Elon Musk menace de poursuivre Microsoft pour avoir utilisé les données de Twitter pour son IA

Elon Musk menace de poursuivre Microsoft pour avoir utilisé les données de Twitter pour son IA

Le PDG de Twitter, Elon Musk, a menacé de poursuivre Microsoft pour avoir utilisé les données de son entreprise pour former son modèle d’intelligence artificielle. Musk a fait cette annonce dans un tweet mercredi, après que plusieurs points de vente ont annoncé que Microsoft cesserait de prendre en charge Twitter dans sa plateforme publicitaire.

« Ils se sont entraînés illégalement en utilisant les données de Twitter », a écrit Musk. « Il est temps de porter plainte. »

La menace de Musk est vague, mais semble être liée à l’utilisation par OpenAI des données Twitter pour former le grand modèle de langage derrière des produits comme ChatGPT. OpenAI n’est évidemment pas Microsoft, mais il a reçu un investissement important de la société l’année dernière, qui intègre l’IA dans des outils comme Bing, Edge et Microsoft 365.

« Il est temps de poursuivre », le message d’Elon Musk à Microsoft

On ne sait pas si Elon Musk poursuivra réellement Microsoft, car il a menacé de poursuites judiciaires qui ne se sont jamais matérialisées dans le passé, comme contre le créateur du compte Twitter @ElonJet.

Le message d’Elon Musk est la dernière indication que la propriété des données devient rapidement un champ de bataille dans la course à l’IA générative. La grande technologie travaille toujours pour développer des modèles d’IA de pointe comme le GPT d’OpenAI, et les propriétaires de données cherchent à l’empêcher ou à facturer l’utilisation de leur contenu.

Microsoft développe ses propres grands modèles de langage (LLM) et commercialise l’accès aux modèles OpenAI. Microsoft a investi 10 milliards de dollars dans OpenAI l’année dernière dans le cadre d’un accord inhabituellement structuré. En effet, Elon Musk était l’un des co-fondateurs d’OpenAI avant de quitter son conseil d’administration en 2018.

Les LLM comme GPT-4 nécessitent des téraoctets de données pour s’entraîner, dont une grande partie provient de sites Web tels que Reddit, StackOverflow et Twitter. Les données des réseaux sociaux sont plus précieuses car elles capturent des conversations informelles et interactives.

Alors que ces nouveaux modèles d’IA passent des laboratoires et des universités au monde des affaires, les propriétaires de données commencent à faire des demandes. Par exemple, Reddit a déclaré plus tôt cette semaine qu’il facturerait aux entreprises l’accès à son interface de programmation utilisée pour alimenter les conversations entre Redditors sur le logiciel de formation à l’IA.


Découvrez le reportage du mois (sous-titré en français), l’IA gagnera t-elle face aux champion du monde du jeu de Go ? :

Youtube video