DeepSeek.com : ce que c’est et qui se cache derrière l’alternative chinoise à ChatGPT qui a mis l’industrie de l’IA en difficulté

DeepSeek: quelle est la solution chinoise à ChatGPT qui a mis l'industrie de l'IA en émoi

Une IA chinoise, DeepSeek, défie les attentes en matière d’intelligence artificielle avec des performances comparables à celles d’OpenAI, mais à un coût considérablement réduit. Ce projet ambitieux, axé sur la qualité et la collaboration, démontre qu’innovation ne rime pas toujours avec puissance brute, mais avec ingéniosité.

DeepSeek est actuellement à la pointe des technologies d’IA grâce à un développement plus soigné et réfléchi que celui de ses concurrents

DeepSeek: quelle est la solution chinoise à ChatGPT qui a mis l'industrie de l'IA en émoi
La développeuse chinoise a prouvé qu’il ne fallait pas plus de puissance, mais une meilleure optimisation du mode de fonctionnement

Donald Trump, le nouveau président des États-Unis, a lancé son plan ambitieux pour dominer l’avenir de l’IA. Le projet Stargate, d’une valeur de 500 milliards de dollars, vise à conquérir le marché. Cependant, une IA chinoise semble remettre en question cette stratégie qui pourrait s’effondrer avant même de se concrétiser. En effet, selon Wired, cette IA offre des performances équivalentes à celles de la version 01 d’OpenAI mais à une fraction de son coût.

Qu’est-ce que DeepSeek

comparatif montrant que DeepSeek R1 est aussi performant que ChatGPT 01

Les comparaisons peuvent être dérangeantes, mais cette évaluation montre clairement la proximité entre les deux modèles de langage

DeepSeek est une IA d’origine chinoise et de code ouvert qui a récemment fait surface grâce à sa remarquable capacité à égaler OpenAI et son modèle le plus puissant, 01, mais avec un coût très réduit.

L’idée est née d’un fonds d’investissement chinois et est dirigée par Liang Wenfeng, son fondateur, qui a concentré les ressources sur le développement d’une IA générale artificielle axée sur la qualité, plutôt que sur la rapidité de mise sur le marché. Cela est intéressant, car il a choisi de progresser plus lentement dans la course vers l’intelligence artificielle générale (AGI), mais en rendant le système beaucoup plus fiable pour les utilisateurs et en adoptant une approche plus collaborative.

Un de ses atouts réside dans le fait qu’elle est partiellement open source dans tous ses modèles, ce qui permet de comprendre son fonctionnement et d’identifier les points susceptibles d’être optimisés.

La créativité face à la contrainte

Jusqu’à présent, la plupart des IA visaient à augmenter leur taille pour gagner en puissance et analyser les données de manière plus efficace. Cependant, les États-Unis ont exclu la Chine de l’accès au matériel nécessaire pour faire passer son IA à un niveau supérieur, ou du moins c’était l’intention. En réalité, cela a conduit à rendre l’IA plus efficace.

Depuis 2022, la Chine n’a plus accès aux puces avancées de technologie propriétaire américaine, ce qui l’a contrainte à optimiser ses méthodes d’entraînement pour atteindre un nouveau niveau.

L’équipe de développement, composée de jeunes talents provenant de grandes universités techniques à Pékin ou Tsinghua, a réussi ce qui semblait impossible a priori: surpasser les États-Unis grâce à une approche open source et une utilisation plus efficace des ressources. Il est estimé que le coût reviendrait à seulement 5 % de celui des solutions d’IA proposées par OpenAI.

Alors que les IA chinoises avaient jusqu’à présent du retard par rapport à leurs homologues américaines, cela semble évoluer avec le lancement de la version R1 de DeepSeek. Pour y parvenir, ils ont adopté des systèmes avec des schémas de communication personnalisés entre les puces, permettant ainsi aux modèles de consommer beaucoup moins de ressources. Les technologies clés utilisées incluent la Multi-head Latent Attention (MLA) et la Mixture-of-Experts.

Bien que cela puisse sembler anodin, DeepSeek constitue une affirmation forte, prouvant que l’IA peut offrir beaucoup sans la puissance brute démesurée qui a longtemps été présentée comme incontournable dans la course pour obtenir le modèle le plus puissant.