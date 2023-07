En bref : Si vous doutiez que le contenu que vous publiez publiquement en ligne sera intégré à des modèles d’intelligence artificielle, jetez un coup d’œil à la mise à jour des règles de confidentialité de Google. Le document indique désormais explicitement que l’entreprise se réserve le droit de collecter et d’analyser pratiquement tout ce que les internautes partagent sur le web afin d’entraîner ses systèmes d’intelligence artificielle.

La mise à jour de Google au cours du week-end a introduit une nouvelle formulation dans sa politique de confidentialité. Elle indiquait auparavant que les données des internautes seraient utilisées pour former des modèles « linguistiques », mentionnant uniquement Google Translate. La version mise à jour remplace ce terme par « modèles d’IA », mentionnant spécifiquement Bard et Cloud AI aux côtés de Translate.

L’un des nombreux points litigieux des systèmes d’IA générative tels que ChatGPT et Bard est la manière dont ils récupèrent et utilisent les données. Il peut s’agir d’informations accessibles au public, mais cela n’empêche pas les problèmes de plagiat et de protection de la vie privée, sans parler de la possibilité que l’IA interprète mal ce qui a été dit ou propose des réponses anciennes et dépassées. Même Google a averti ses employés de faire preuve de prudence lorsqu’ils utilisent des chatbots comme son propre Bard, car ils peuvent faire des suggestions de code non souhaitées.

La question se pose également de savoir si ce type de collecte de données est légal. Le créateur de ChatGPT, OpenAI, fait l’objet de poursuites judiciaires parce qu’il est accusé d’avoir recueilli illégalement des informations personnelles auprès d’internautes et d’avoir utilisé ces données pour créer ses produits.

OpenAI fait également l’objet d’une action en justice pour violation des droits d’auteur et de la vie privée suite à des affirmations selon lesquelles elle aurait utilisé sans autorisation des livres protégés par des droits d’auteur pour entraîner ses systèmes d’intelligence artificielle. L’entreprise aurait copié illégalement des textes de ces titres sans obtenir le consentement des détenteurs des droits d’auteur et sans les créditer ou les dédommager.

Pour faire face à des niveaux extrêmes de grattage de données & ; manipulation du système, nous avons appliqué les limites temporaires suivantes : – Les comptes vérifiés sont limités à la lecture de 6000 messages par jour.

– Les comptes non vérifiés sont limités à 600 messages/jour

– Nouveaux comptes non vérifiés à 300/jour – Elon Musk (@elonmusk) 1er juillet 2023

Le grattage de données semble être un sujet particulièrement contrariant pour Elon Musk. Au cours du week-end, Twitter a temporairement limité le nombre de tweets que les comptes pouvaient lire par jour pour prétendument faire face à des « niveaux extrêmes » de raclage de données et de « manipulation du système » sur la plateforme – bien que tout le monde ne soit pas d’accord pour dire que c’était la raison de cette limitation.

Reddit est également confronté à une série de problèmes depuis qu’il a désactivé l’accès gratuit à ses API afin de mettre fin à la collecte de données. Plus de 8 000 subreddits sont devenus sombres en signe de protestation et certains sont devenus NSFW.



Découvrez le reportage du mois (sous-titré en français), l’IA gagnera t-elle face aux champion du monde du jeu de Go ? :