Les bibliothèques publiques saturées de livres générés par IA : une solution en suspens

Les Bibliothèques Publiques Saturées De Livres Générés Par Ia :

Les modèles d’IA générative posent des défis considérables pour les bibliothèques publiques, inondées de contenus de faible qualité. L’augmentation des « livres » générés par des bots perturbe l’accès à des lectures cohérentes, laissant les bibliothécaires appelés à trouver des solutions face à cette avalanche numérique déstabilisante.

Prise de position de l’éditeur : Les modèles d’IA générative sont des outils puissants qui peuvent être exploités par des escrocs, des criminels et ceux cherchant à créer une carrière d’écrivain à partir de rien. En théorie, ces modèles peuvent générer un flux infini de textes apparemment cohérents, et ils ont déjà été utilisés pour inonder des plateformes offrant des services numériques aux bibliothèques publiques.

Internet devient un désert, dépourvu d’interactions humaines, alors que des bots consomment la bande passante mondiale avec un trafic malveillant et sans valeur. Selon les acteurs de l’industrie du prêt de livres électroniques, le texte généré par l’IA est déjà devenu un problème majeur pour les bibliothèques financées par des fonds publics. Des « livres » de faible qualité inondent le marché, submergeant à la fois les filtres automatisés et les testeurs humains face à un défi presque insurmontable.

Un rapport récent de 404 Media souligne que le problème touche principalement OverDrive et Hoopla, les deux principales entreprises sur lesquelles les bibliothèques publiques s’appuient pour la gestion et le prêt de livres électroniques. OverDrive permet aux bibliothèques de sélectionner les ouvrages à proposer, tandis que Hoopla offre un accès illimité à l’ensemble de son catalogue. Bien que les bibliothèques utilisant Hoopla puissent limiter les prix des livres, elles n’ont pas de contrôle sur les titres qui deviennent disponibles pour leurs utilisateurs.

Le problème central du modèle de Hoopla réside dans la présence croissante de contenus factices – qualifiés en industrie d’édition de “vendor slurry”. Même avant la généralisation de l’IA générative, les éditeurs et les bibliothèques luttaient déjà contre un afflux de livres électroniques de faible qualité, souvent auto-publiés. Depuis des années, des individus produisent des “résumés” de livres populaires avec peu ou pas de contenu original. À présent, avec des outils comme ChatGPT, la production de contenus automatisés dépourvus de sens a atteint un tout nouveau niveau.

Les bibliotheques publiques saturees de livres generes par IA

Luca Bartlomiejczyk, un bibliothécaire à la Bibliothèque commémorative Edith Wheeler à Monroe, Connecticut, a déclaré que le nombre “gargantuesque” de livres disponibles sur Hoopla est largement composé de matériels de faible qualité, peu attrayants pour les lecteurs humains. « Si vous dites que nous avons 15 000 ebooks sur notre plateforme, et que 5 000 d’entre eux sont de qualité médiocre, générés par une IA, ou des contenus ajoutés sans aucune supervision ou critères de sélection respectés, que proposez-vous réellement ? » s’est-il interrogé.

Un nombre croissant d’éditeurs et de soi-disant “auteurs” se spécialisent dans le marché de la vendor slurry. Un exemple est IRB Media, qui a des centaines de livres sur Hoopla – tous des résumés générés par l’IA à partir de titres préexistants. Comme l’a expliqué Bartlomiejczyk, un client recherchant un livre spécifique pourrait facilement se retrouver avec un résumé généré par une IA à la place. Le prêt de tels contenus sans valeur coûte de l’argent aux bibliothèques tout en fournissant une expérience de lecture décevante alimentée par l’IA.

Il y a deux ans, Library Futures et le Library Freedom Project ont exhorté Hoopla et OverDrive à s’attaquer au problème des livres de faible qualité, en particulier ceux niant l’Holocauste ou promouvant la haine contre les minorités. Hoopla a retiré les titres offensants, expliquant que les tests humains et algorithmiques avaient échoué à les empêcher d’entrer dans son catalogue.

À présent, des bibliothécaires comme Bartlomiejczyk appellent à une plus grande responsabilité de la part des plateformes de prêt numérique, car la dégradation du contenu alimentée par l’IA est un problème peu susceptible de disparaître de sitôt. Personne ne plaide pour une interdiction totale des livres générés par l’IA, mais ce contenu devrait être clairement étiqueté dans les catalogues afin que les lecteurs sachent exactement ce qu’ils téléchargent sur leurs e-readers.