Microsoft intrigue après l’annonce de l’hébergement de DeepSeek R1 sur Azure, quelques jours après des accusations d’OpenAI sur des violations éventuelles des services. DeepSeek, un modèle économique prometteur, menace de bouleverser le marché avec des coûts de formation bien inférieurs, suscitant ainsi des tensions au sein de l’industrie de l’IA.
En bref : Microsoft suscite des interrogations après avoir annoncé qu’il hébergera DeepSeek R1 sur son service cloud Azure. Cette décision intervient quelques jours seulement après qu’OpenAI a accusé DeepSeek de violer ses conditions de service en utilisant prétendument les résultats de ChatGPT pour entraîner son système, des affirmations que Microsoft est actuellement en train d’examiner.
DeepSeek R1 a commencé à faire sensation dans le monde de l’IA lors de son lancement la semaine dernière. Le développeur chinois DeepSeek le présente comme un modèle de raisonnement simulé disponible gratuitement, rivalisant avec la performance de OpenAI’s o1, mais à un coût de formation bien moindre. Alors qu’OpenAI a fixé le prix de son modèle o1 à 60 € par million de jetons de sortie, DeepSeek le propose à seulement 2,19 € par million – un contraste remarquable qui a fait chuter les actions d’entreprises adjacentes à l’IA comme NVIDIA.
La décision de Microsoft d’héberger R1 sur Azure n’est pas si inhabituelle en soi. Le géant de la technologie propose déjà plus de 1 800 modèles d’IA via son Azure AI Foundry, offrant aux développeurs accès à une variété de systèmes d’IA pour des expériences et intégrations. Microsoft ne fait pas de discrimination puisqu’il tire profit de toute plateforme d’IA fonctionnant sur son infrastructure cloud. Cependant, cette décision semble ironique puisque OpenAI a passé la semaine dernière à critiquer vigoureusement le modèle pour avoir distillé les résultats de ChatGPT.
🚀 DeepSeek-R1 est là !
⚡ Performance comparable à OpenAI-o1
📖 Modèle entièrement open-source & rapport technique
🏆 Licence MIT : Distillez & commercialisez librement !🌐 Le site Web & l’API sont en ligne ! Essayez DeepThink dès aujourd’hui à https://t.co/v1TFy7LHNy
🐋 1/n pic.twitter.com/7BlpWAPu6y
– DeepSeek (@deepseek_ai) 20 janvier 2025
OpenAI affirme que la startup d’IA a violé ses conditions de service en utilisant la « distillation », comme rapporté par Fox News. La distillation est lorsque les développeurs entraînent un modèle d’IA en utilisant les résultats d’un système plus avancé. Des soupçons sont apparus après que des utilisateurs ont découvert qu’un modèle antérieur, DeepSeek V3, se désignait parfois comme « ChatGPT », ce qui suggère que DeepSeek a utilisé des données générées par OpenAI pour peaufiner son système.
Ce mouvement semble également quelque peu hypocrite, étant donné que des chercheurs en sécurité de Microsoft auraient lancé une enquête éthique sur DeepSeek mercredi. Des sources anonymes affirment que l’enquête se concentre sur la question de savoir si DeepSeek a extrait des quantités substantielles de données via l’API d’OpenAI au cours de l’automne 2024.
Malgré les frustrations causées par DeepSeek, le PDG d’OpenAI, Sam Altman, a publiquement accueilli la concurrence. Dans un tweet lundi, Altman a reconnu l’efficacité en termes de coûts de R1, le qualifiant de « modèle impressionnant », mais promettant qu’OpenAI fournirait bientôt « des résultats bien meilleurs ». Les analystes s’attendent à ce que l’entreprise lance un nouveau modèle, o3-mini, dès aujourd’hui.
Le r1 de deepseek est un modèle impressionnant, notamment en ce qu’ils peuvent offrir à ce prix.
Nous allons évidemment offrir des modèles bien meilleurs et c’est véritablement revigorant d’avoir un nouveau concurrent ! Nous allons publier quelques nouveautés.
– Sam Altman (@sama) 28 janvier 2025
L’indignation d’OpenAI concernant les pratiques de données de DeepSeek est notable, étant donné son propre historique d’accusations d’abus de données. The New York Times a déposé une plainte contre OpenAI et Microsoft, les accusant d’utiliser du journalisme protégé par des droits d’auteur sans autorisation. OpenAI a également conclu des accords avec des éditeurs et des communautés en ligne – comme The Associated Press et d’autres – pour accéder aux données générées par les utilisateurs pour l’entraînement.
La situation actuelle expose la relation hypocrite de l’industrie de l’IA avec la propriété des données. La société d’investissement Andreessen Horowitz, un autre investisseur d’OpenAI, a soutenu dans un dossier judiciaire de 2023 que l’entraînement des modèles d’IA ne devrait pas être considéré comme une infraction au droit d’auteur, car ils « extrait simplement des informations » des œuvres existantes. Si OpenAI croit vraiment en ce principe, alors DeepSeek ne fait que respecter les mêmes règles.
Le paysage actuel de l’industrie de l’IA est en quelque sorte un véritable lâcher-prise. Nous n’avons pas de lois sur les livres pour régir directement l’IA, et celles qui l’affectent indirectement, comme les lois sur le droit d’auteur et le commerce, sont interprétées de manière favorable par les entreprises d’IA qui les enfreignent.
