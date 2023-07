En bref : Plus de 8 000 auteurs, dont des sommités comme James Patterson, Margaret Atwood et Jonathan Franzen, ont signé une lettre ouverte demandant aux dirigeants des six plus grandes entreprises spécialisées dans l’IA de ne pas utiliser leurs œuvres pour des modèles de formation sans avoir obtenu au préalable leur consentement et offert une compensation.

La lettre, publiée par l’organisation d’écrivains professionnels The Authors Guild, est adressée aux patrons d’OpenAI, d’Alphabet, de Meta, de Stability AI, d’IBM et de Microsoft. Elle interpelle les PDG sur « l’injustice inhérente » à l’utilisation des œuvres des auteurs pour entraîner leurs grands modèles de langage sans consentement, crédit ou compensation.

« Ces technologies imitent et régurgitent notre langage, nos histoires, notre style et nos idées. Des millions de livres, d’articles, d’essais et de poèmes protégés par le droit d’auteur constituent la « nourriture » des systèmes d’IA, des repas sans fin pour lesquels il n’y a pas de facture », peut-on lire dans la lettre.

« Vous dépensez des milliards de dollars pour développer la technologie de l’IA. Il n’est que juste que vous nous indemnisiez pour l’utilisation de nos écrits, sans lesquels l’IA serait banale et extrêmement limitée. »

Il est également affirmé que de nombreux textes de livres sur lesquels les systèmes d’IA sont entraînés proviennent de sites Web de piratage notoires.

NPR écrit qu’un nouveau communiqué de la Guilde des auteurs révèle que les revenus des écrivains ont diminué de 42 % entre 2009 et 2019, le revenu médian d’un écrivain à temps plein n’étant plus que de 23 000 dollars l’année dernière. Avec des IA génératives telles que ChatGPT et Bard qui ajoutent à leur pression, et certaines entreprises qui remplacent déjà les travailleurs par ces systèmes, il est facile de comprendre d’où vient la colère.

Mary Rasenberger, PDG de l’Authors Guild, a déclaré que l’objectif de la lettre était de convaincre les entreprises d’IA de régler les différends avec les auteurs sans passer par la voie des poursuites judiciaires, longues et coûteuses. Ce n’est pas que tous les auteurs évitent une action en justice : Sarah Silverman, Paul Tremblay et Mona Awad sont demandeurs dans des actions collectives contre Meta et/ou OpenAI pour avoir formé leurs programmes sur des copies piratées de leurs œuvres.

OpenAI a déclaré dans un communiqué (via le Wall Street Journal) que ChatGPT est formé à partir de « contenus sous licence, de contenus accessibles au public et de contenus créés par des formateurs d’IA et des utilisateurs humains », ajoutant que l’entreprise respecte les droits des créateurs et des auteurs.

Les auteurs ne sont pas les seuls à voir leurs œuvres utilisées pour l’entraînement de l’IA. Google a mis à jour sa politique de confidentialité au début du mois pour indiquer explicitement que l’entreprise se réserve le droit de collecter et d’analyser pratiquement tout ce que les internautes partagent sur le web pour entraîner ses systèmes d’intelligence artificielle.

Le grattage de texte par les entreprises spécialisées dans l’IA est une question controversée à l’heure actuelle. Elon Musk a déclaré que Twitter avait limité le nombre de tweets que les comptes pouvaient lire par jour afin de lutter contre les « niveaux extrêmes » de raclage de données et de « manipulation du système » sur la plateforme. Il a également menacé de poursuivre Microsoft, qui a investi des milliards dans OpenAI, pour utilisation illégale des données de Twitter.

Reddit est également confronté à une série de problèmes depuis qu’il a désactivé l’accès gratuit à ses API afin de mettre fin à la collecte de données. Plus de 8 000 subreddits sont devenus sombres en signe de protestation et certains sont devenus NSFW.

