Microsoft s’interroge sur les méthodes de DeepSeek pour entrainer ses modèles d’IA, soupçonnant une éventuelle violation des droits de propriété intellectuelle. En effet, des témoignages suggèrent que DeepSeek pourrait avoir utilisé les modèles d’OpenAI comme base. Cette affaire soulève des questions cruciales sur l’économie et l’éthique dans l’IA.

Microsoft, investisseur majeur d’OpenAI, se penche désormais sur la question de savoir si la société chinoise DeepSeek a utilisé des méthodes malveillantes pour entraîner ses modèles de raisonnement. D’après Bloomberg Law, Microsoft suspecte DeepSeek d’avoir violé ses conditions de service en utilisant son interface de programmation d’application (API) pour former son modèle récemment annoncé, le R1.
Cet événement survient peu de temps après que David Sacks, responsable de l’IA et des cryptomonnaies à la Maison Blanche, a déclaré lors d’une interview sur Fox News, qu’il était « possible » que DeepSeek ait « volé des propriétés intellectuelles » des États-Unis.
“Il existe des preuves substantielles que ce que DeepSeek a fait, c’est extraire les connaissances des modèles d’OpenAI,” a déclaré Sacks au média.
L’industrie de l’IA a fait l’éloge de la capacité de DeepSeek à former rapidement et de manière économique des modèles d’IA en un an avec seulement **5,6 millions €**. Il existe une possibilité sous-jacente que l’efficacité de la société soit due à l’utilisation de modèles d’une autre entreprise comme référence.
DeepSeek pourrait avoir utilisé un processus appelé distillation, qui implique un dynamisme enseignant-élève entre deux modèles pour que l’un puisse recueillir des informations de l’autre. D’une part, cela pourrait expliquer les faibles coûts d’exploitation de la société et l’utilisation de puces Nvidia H800 moins puissantes. DeepSeek pourrait désormais être contraint de prouver qu’il n’a pas adopté des actions illégales lors du développement de ses modèles.
Avant ce développement récent, les experts de l’industrie supposaient que DeepSeek avait probablement utilisé l’ingénierie inverse pour former ses modèles. Ce processus analyse les modèles afin d’identifier leurs schémas et leurs biais pour améliorer les modèles futurs. L’ingénierie inverse est une pratique courante parmi les développeurs open-source et est considérée comme légale.
Des chercheurs en sécurité autorisés par Microsoft ont déjà constaté que DeepSeek pourrait avoir extrait un volume considérable de code de l’API d’OpenAI durant l’automne 2024. Microsoft aurait informé OpenAI de cette violation à l’époque. Le modèle R1 a été annoncé la semaine dernière, attirant l’attention sur la société d’IA chinoise et les parties associées.
DeepSeek a également été salué comme une application d’IA open-source, sur laquelle tout le monde peut développer. C’est de là que provient une grande partie de l’engouement autour de la plateforme — en plus de sa comparaison aux principaux outils comme ChatGPT et Google Gemini. OpenAI n’est pas un service open-source ; toutefois, toute personne peut s’inscrire pour accéder à son API. La société précise dans ses conditions de service que d’autres entités ne peuvent pas utiliser les résultats pour former d’autres modèles d’IA, note TechCrunch.
Un porte-parole d’OpenAI a déclaré à Reuters qu’indépendamment des réglementations, il est devenu courant pour diverses entreprises internationales d’essayer de copier des modèles de sociétés bien connues aux États-Unis.
“Nous engageons des contre-mesures pour protéger notre propriété intellectuelle, y compris un processus minutieux pour déterminer quelles capacités de pointe inclure dans les modèles publiés, et nous croyons qu’il est essentiel à l’avenir de travailler en étroite collaboration avec le gouvernement des États-Unis pour protéger au mieux les modèles les plus performants contre les tentatives d’adversaires et de concurrents d’exploiter la technologie américaine,” a déclaré le porte-parole.
