En bref : Le fabricant de ChatGPT OpenAI fait l’objet d’une enquête de la part de la Federal Trade Commission (FTC) afin de déterminer si le chatbot de l’entreprise a enfreint le droit de la consommation en portant atteinte à la réputation et en mettant en danger les données personnelles. La FTC souhaite également obtenir des informations sur deux incidents de sécurité survenus au début de l’année.

L’agence a envoyé une lettre de demande de 20 pages à OpenAI pour obtenir des informations sur la manière dont elle traite les risques liés à ses modèles d’IA, écrit le Washington Post. La demande d’enquête civile demande également des détails sur l’entreprise, son modèle d’IA et sa formation, la façon dont elle traite la vie privée et les attaques par injection rapide, les intégrations d’API et de plugins, et la collecte de données.

L’une des déclarations demande spécifiquement ce qu’OpenAI a fait pour remédier au danger que ses produits génèrent des informations fausses, trompeuses ou désobligeantes sur des personnes réelles. Les IA génératives sont connues pour leur tendance à l’hallucination, bien sûr.

Le Reg souligne qu’OpenAI n’est pas étrangère aux procès en diffamation. Un animateur de radio de Géorgie a poursuivi la société en justice parce que ChatGPT avait faussement associé son nom à une affaire criminelle. En avril, un maire australien a menacé d’intenter une action en justice au motif que ChatGPT l’avait accusé d’être impliqué dans un scandale de corruption à l’étranger. Le chatbot a également accusé à tort un professeur de droit américain d’agression sexuelle sur la base d’un article du Washington Post fabriqué de toutes versions.

OpenAI n’a pas été très ouverte dans la divulgation des données qu’elle utilise pour former ses grands modèles de langage qui alimentent ChatGPT. La FTC veut savoir si ces données ont été récupérées sur Internet ou si elles ont été achetées à des tiers. L’agence demande également quels sont les sites web d’où proviennent les données et ce qui a été fait pour empêcher que des informations personnelles ne soient utilisées comme données d’entraînement.

Les pratiques d’extraction de données des entreprises d’IA générative ont récemment fait l’objet d’une controverse. Elon Musk a menacé de poursuivre Microsoft, qui a investi des milliards dans OpenAI, pour avoir utilisé illégalement des données de Twitter – c’est également la raison invoquée pour limiter le nombre de tweets consultés par les utilisateurs. Reddit, quant à lui, a connu une révolte massive de ses utilisateurs après avoir commencé à faire payer l’accès à son API en réponse à l’utilisation de données par des entreprises d’IA.

La FTC souhaite également obtenir des informations et des dossiers relatifs à des incidents de sécurité survenus au début de l’année. L’un d’eux était un bug qui permettait à certains utilisateurs de voir des informations relatives aux paiements, l’autre exposait les titres des historiques de chat des utilisateurs.

Nous avons construit le GPT-4 en nous appuyant sur des années de recherche en matière de sécurité et nous avons passé plus de six mois après la fin de la formation initiale à le rendre plus sûr et mieux aligné avant de le diffuser. Nous protégeons la vie privée des utilisateurs et nous concevons nos systèmes pour qu’ils apprennent à connaître le monde, et non des individus. – Sam Altman (@sama) 13 juillet 2023

Le PDG d’OpenAI, Sam Altman, a déclaré que l’entreprise collaborerait avec la FTC. Il a ajouté que l’entreprise protégeait la vie privée des utilisateurs et qu’elle concevait ses systèmes pour en apprendre davantage sur le monde, et non sur les individus.

La FTC a déjà infligé de lourdes amendes à Meta, Amazon et Twitter, accusés d’avoir violé les lois sur la protection des consommateurs. OpenAI pourrait faire l’objet d’une sanction similaire s’il s’avère qu’elle a agi de la même manière, ce qui donnerait des sueurs froides à d’autres entreprises d’IA générative.

Au début du mois, Google a mis à jour sa politique de confidentialité pour indiquer explicitement que l’entreprise se réserve le droit de collecter et d’analyser pratiquement tout ce que les internautes partagent sur le web afin d’entraîner ses systèmes d’intelligence artificielle.



