Des chercheurs indépendants rivalisent avec OpenAI en développant des modèles d’IA performants à faible coût. En seulement 24 heures, une équipe a créé un outil concurrent qui atteint 55 % de précision sur des benchmarks, tout en nécessitant moins de 30 minutes d’entraînement et seulement 20 € en crédits cloud.

Alors qu’OpenAI persiste à affirmer que le seul chemin vers l’AGI repose sur des investissements financiers et énergétiques massifs, des chercheurs indépendants exploitent des technologies open-source pour égaler les performances de ses modèles les plus puissants — et ce, à une fraction du coût.
Vendredi dernier, une équipe unifiée de l’Université de Stanford et de l’Université de Washington a annoncé qu’elle avait formé un modèle linguistique large axé sur les mathématiques et la programmation qui fonctionne aussi bien que les modèles de raisonnement o1 d’OpenAI et R1 de DeepSeek. Il a coûté seulement 50 € en crédits cloud pour le créer. L’équipe a apparemment utilisé un modèle de base prêt à l’emploi, puis a distillé le modèle expérimental Gemini 2.0 Flash Thinking de Google à l’intérieur. Le processus de distillation d’IA implique d’extraire les informations pertinentes pour accomplir une tâche spécifique d’un modèle d’IA plus grand et de les transférer à un modèle plus petit.
De plus, mardi, des chercheurs de Hugging Face ont lancé un concurrent des outils de Deep Research d’OpenAI et de Google Gemini, baptisé Open Deep Research, qu’ils ont développé en seulement 24 heures. « Alors que des modèles LLM puissants sont maintenant disponibles gratuitement en open-source, OpenAI n’a pas beaucoup divulgué sur le cadre agentique sous-jacent à Deep Research, » a écrit Hugging Face dans son post d’annonce. « Nous avons donc décidé d’entreprendre une mission de 24 heures pour reproduire leurs résultats et ouvrir le framework nécessaire dans le processus ! » Il coûterait environ 20 € en crédits cloud et nécessiterait moins de 30 minutes pour s’entraîner.
Le modèle de Hugging Face a ensuite atteint une précision de 55 % sur le benchmark General AI Assistants (GAIA), utilisé pour tester les capacités des systèmes IA agentiques. En comparaison, Deep Research d’OpenAI a obtenu une précision allant de 67 à 73 %, selon les méthodologies de réponse. Certes, le modèle de 24 heures ne performe pas aussi bien que l’offre d’OpenAI, mais il n’a pas non plus nécessité des milliards d’euros et la capacité de production énergétique d’une nation européenne de taille moyenne pour être formé.
Ces efforts font suite à des nouvelles de janvier selon lesquelles une équipe du laboratoire Sky Computing de l’Université de Californie à Berkeley a réussi à entraîner son modèle de raisonnement Sky T1 pour environ 450 € en crédits cloud. Le modèle Sky-T1-32B-Preview de l’équipe a prouvé qu’il était l’égal de la première version du modèle de raisonnement o1-preview. À mesure que ces concurrents open-source émergent face à la domination d’OpenAI, leur simple existence questionne la validité du plan de l’entreprise de dépenser 500 milliards d’euros pour créer des centres de données IA et des installations de production d’énergie.
