Un nouvel acteur de la technologie mondiale émerge, défiant les géants établis. L’innovation radicale d’un entrepreneur peu conventionnel pourrait bien reconfigurer l’équilibre de pouvoir dans le domaine de l’intelligence artificielle, suscitant une compétition acharnée entre deux superpuissances. Son ambition ? Révolutionner les règles du jeu.
Wenfeng travaille depuis des années dans le secteur, mais ne correspond pas au profil traditionnel des pionniers de l’intelligence artificielle. En 2023, il a lancé DeepSeek, une IA qui a ouvert un nouveau front dans la guerre technologique entre les États-Unis et la Chine. Ce nouveau modèle démontre qu’il est possible de l’emporter en changeant les règles. En effet, l’entreprise chinoise a décidé de modifier la structure fondamentale des modèles d’IA et d’utiliser plus efficacement ses ressources limitées.

En janvier 2025, DeepSeek-R1, un modèle open source de la société chinoise DeepSeek, a ébranlé la Silicon Valley. Pour seulement 6 millions de dollars, la Chine a créé un modèle d’intelligence artificielle capable de rivaliser avec les grandes entreprises technologiques américaines telles que OpenAI, Microsoft et Google. Ce succès est attribué à Liang Wenfeng, « un jeune nerd avec une coiffure horrible qui parlait de construire un cluster de 10 000 puces pour entraîner ses propres modèles », se souvient un de ses associés. « Nous ne le prenions pas au sérieux, nous l’avons snobé.«
Wenfeng, 40 ans, né à Zhanjiang, travaille depuis longtemps dans le secteur, bien qu’il ne réponde pas aux critères des pionniers de l’intelligence artificielle (comme par exemple Sam Altman). Ce n’est pas un entrepreneur, il vient du monde financier et a commencé à utiliser l’intelligence artificielle dans ses stratégies de trading pour prévoir les tendances du marché et prendre des décisions d’investissement. Puis en 2023, il a fondé DeepSeek pour développer une intelligence artificielle générale capable d’égaler l’intelligence humaine.
Son objectif, comme il l’explique lors d’une interview, est de « cesser de suivre et commencer à diriger« . Pendant des années, les entreprises chinoises ont exploité les innovations technologiques développées ailleurs, « mais cela n’est pas durable. Cette fois, notre objectif n’est pas le gain rapide, mais l’avancement de la frontière technologique pour conduire la croissance de l’écosystème« . Le plan fonctionne, en effet, le développement d’une intelligence artificielle de pointe à une fraction du coût des rivaux occidentaux soulève de nouveaux doutes quant aux centaines de milliards de dollars prévus dans le secteur.
Qui est Liang Wenfeng, le fondateur de DeepSeek
Liang est né en 1985 à Zhanjiang, dans le Guangdong, son père était enseignant dans une école primaire. Il a étudié à l’Université de Zhejiang, l’une des plus anciennes et prestigieuses universités de Chine. Il a obtenu son diplôme en ingénierie de l’information électronique en 2007 et un Master en ingénierie de l’information et des communications en 2010. Sa thèse de master était intitulée « Recherche sur l’algorithme de suivi de cible basé sur une caméra PTZ à faible coût ».
En 2015, Wenfeng et deux de ses camarades de classe créent un fonds d’investissement quantitatif, High-Flyer, qui s’appuie « sur les mathématiques et l’intelligence artificielle pour des investissements quantitatifs ». Selon son site, en 2019, High-Flyer gérait au moins 10 milliards de dollars d’actifs. En 2021, Liang commence à acheter des milliers de GPU Nvidia pour son projet parallèle d’intelligence artificielle. Ses associés ne le prennent pas au sérieux, ils disaient que cela semblait, comme, un milliardaire à la recherche d’un nouveau hobby excentrique. Et en réalité, c’est le début de DeepSeek. En effet, en 2023, il ouvre un laboratoire, branche de High Flyer, pour développer son intelligence artificielle.
Pourquoi le projet DeepSeek effraie les États-Unis
Le modèle ouvre un nouveau front dans la guerre technologique entre les États-Unis et la Chine. DeepSeek démontre en effet que, malgré tous les blocages sur les exportations, on peut gagner en changeant les règles du jeu. L’entreprise chinoise a décidé de modifier la structure fondamentale des modèles d’IA et d’utiliser plus efficacement ses ressources, qui sont limitées.
Comme l’explique Marina Zhang, professeure associée à l’Université de technologie de Sydney dans Wired USA : « Contrairement à de nombreuses entreprises chinoises d’IA qui s’appuient fortement sur l’accès à un matériel avancé, DeepSeek s’est concentré sur la maximisation de l’optimisation des ressources basées sur le logiciel. Elle a adopté des méthodes open source, mettant en commun les compétences collectives et favorisant l’innovation collaborative. Cette approche non seulement atténue les contraintes en matière de ressources, mais accélère également le développement de technologies de pointe, permettant à DeepSeek de se démarquer des concurrents plus fermés ».
Dans un document publié fin décembre, les chercheurs de DeepSeek ont expliqué avoir construit et entraîné le modèle avec 2 000 puces Nvidia H800 à un coût inférieur à 6 millions de dollars. Un montant bien plus bas que celui de la concurrence. Elon Musk, par exemple, entraîne Grok 3, son modèle d’IA, sur 100 000 GPU H100 de Nvidia. Mark Zuckerberg aurait acheté 350 000 GPU Nvidia H100 en 2024.
Wenfeng ne cherche pas à réaliser « des profits excessifs » et son entreprise « ne deviendra pas closed-source« . L’objectif est en fait de créer une industrie chinoise de l’intelligence artificielle capable de rattraper les États-Unis. « Nous disons souvent qu’il y a un écart d’un ou deux ans entre l’IA chinoise et l’américaine, mais le véritable écart réside entre l’originalité et l’imitation », a-t-il déclaré lors de l’interview traduite. « Si cela ne change pas, la Chine sera toujours un pays qui suit ».
