Un nouveau rival pour DeepSeek : il vient de Chine et est supérieur à DeepSeek V3 dans la plupart des tests

DeepSeek a désormais un nouveau rival : il vient de Chine et surpasse DeepSeek V3 dans la plupart des tests

La récente avancée d’un modèle d’intelligence artificielle chinois suscite l’intérêt, car il se positionne en tête du marché en surpassant ses concurrents américains en termes de performance. Avec des résultats impressionnants lors de tests comparatifs, cette innovation promet de redéfinir le paysage numérique actuel.

Qwen est le modèle d’IA de la géante chinoise Alibaba, qui vient de dévoiler sa version 2.5 Max

DeepSeek a désormais un nouveau rival : il vient de Chine et surpasse DeepSeek V3 dans la plupart des tests
L’interface de Qwen Chat, l’assistant IA basé sur le grand modèle de langage d’Alibaba

DeepSeek a récemment transformé l’industrie de l’intelligence artificielle en proposant un modèle de langage capable de rivaliser, et même de surpasser en performance et efficacité les modèles d’entreprises américaines telles que Google et OpenAI. Peu de temps après son lancement, son application est devenue la plus téléchargée sur les principales plateformes mobiles, attirant les louanges de figures importantes du secteur comme Sam Altman ou Satya Nadella, qui ont salué cet accomplissement d’une société chinoise apparemment peu connue.

La compétition pour créer le modèle d’IA le plus puissant et efficace n’en est qu’à ses débuts, et il semble que la Silicon Valley ne soit plus le centre névralgique de cette industrie en pleine croissance. Quelques jours après l’émergence de DeepSeek, la gigantesque entreprise chinoise Alibaba a démontré que son nouveau modèle de langage, Qwen 2.5 Max, est capable de surpasser DeepSeek dans la majorité des tests.

Qwen 2.5 Max offre de meilleurs résultats que Llama et DeepSeek V3 dans les benchmarks

Qwen 2.5 Max utilise une architecture similaire à celle de DeepSeek, connue sous le nom de Mixture of Experts ou MoE, qui permet aux modèles d’être beaucoup plus efficaces et évolutifs. Cette architecture ne consiste pas en un modèle monolithique possédant tout le savoir, mais en plusieurs « experts », chacun spécialisé dans un sous-ensemble de données ou de tâches. Un autre élément, le « routeur », détermine lequel de ces experts est le plus adapté pour traiter une entrée spécifique.

Qwen 2.5 Max Instruct

Les résultats de Qwen 2.5 Max dans certains des principaux tests, comparés à ceux de ses concurrents

L’utilisation de cette technique, associée aux avancées liées à l’entraînement avec plus de 20 milliards de tokens et aux méthodologies de Finetuning Supervisé (SFT) ainsi qu’Apprentissage par Renforcement à partir de Retours Humains (RLHF), a permis à Alibaba de créer l’un des modèles les plus avancés du moment. Les tests ont démontré que Qwen 2.5 Max surpasse DeepSeek V3 dans des tests de référence tels qu’Arena-Hard, LiveBench, LiveCodeBench et GPQA-Diamond, tout en fournissant des résultats très compétitifs dans d’autres types de tests, y compris MMLU-Pro.

Qwen 2.5 Max est déjà accessible, tant via des plateformes comme HuggingFace que par le biais du chatbot officiel de Qwen, qui permet de sélectionner le modèle désiré grâce à un menu déroulant situé dans le coin supérieur gauche.