Après l’éblouissant R1 de DeepSeek, Alibaba riposte avec un modèle encore plus puissant

Après L'éblouissant R1 De Deepseek, Alibaba Riposte Avec Un Modèle

Alibaba répond à la montée de DeepSeek avec le lancement surprise de son modèle Qwen 2.5-Max, affirmant qu’il surpasse les capacités du DeepSeek-V3. Dévoilé durant la période du Nouvel An lunaire, ce lancement souligne l’impact du succès de DeepSeek sur les géants technologiques. Les enjeux sont élevés dans cette bataille technologique.

Alibaba a porté un coup à son rival DeepSeek avec la sortie surprise de son nouveau modèle Qwen 2.5-Max. Le titan chinois du commerce électronique affirme que sa dernière offre d’intelligence artificielle dépasse les capacités du DeepSeek-V3, récemment lancé et très médiatisé.

Le timing de la sortie du Qwen 2.5-Max est inhabituel, car elle a eu lieu le premier jour des vacances du Nouvel An lunaire, lorsque la plupart des travailleurs chinois sont en congé. Cela illustre à quel point la percée de l’IA de DeepSeek a secoué les acteurs établis.

Nous avons pu observer l’impact que la percée de DeepSeek a eu sur des concurrents étrangers comme OpenAI, entraînant de multiples publications de son PDG Sam Altman sur X et la gigantesque chute des actions de NVIDIA, estimée à 600 milliards € – la plus importante en une journée pour une entreprise cotée. Il n’est donc pas surprenant que le succès de DeepSeek ait poussé puissants géants technologiques chinois à se précipiter afin de réagir. La riposte d’Alibaba prend la forme du nouveau Qwen 2.5-Max.

« Qwen 2.5-Max surpasse… presque tous les modèles, y compris GPT-4o, DeepSeek-V3 et LLaMa-3.1-405B », a vanté Alibaba Cloud dans son annonce sur WeChat, en citant certains des modèles d’IA open-source les plus avancés développés par OpenAI et Meta.

Apres leblouissant R1 de DeepSeek Alibaba riposte avec un modele

Au-delà des capacités générales de l’IA de DeepSeek, un autre facteur qui a contribué à sa popularité a été le coût extrêmement faible de développement et d’exécution de ses modèles. Cela a même amené les investisseurs à remettre sérieusement en question les dépenses massives consacrées à l’IA par les grands acteurs technologiques américains.

Tenant probablement compte de cela, Alibaba Cloud a également souligné l’efficacité du Qwen 2.5-Max dans un article de blog, mettant en avant qu’il a été entraîné sur plus de 20 trillions de tokens tout en utilisant une architecture de mixture-of-experts (MoE) nécessitant significativement moins de ressources informatiques que les approches habituelles.

1738242524 827 Apres leblouissant R1 de DeepSeek Alibaba riposte avec un modele

Au-delà d’Alibaba, le parent de TikTok, ByteDance, a réagi avec une version mise à jour de son IA phare, qu’il affirme avoir surpassé le GPT-3.5 d’OpenAI sur certains critères de référence.

Une version antérieure de DeepSeek avait également déclenché une guerre des prix intense en Chine au mois de mai. Le coût incroyablement bas de 1 yuan (14 cents) par million de tokens de données traitées de DeepSeek-V2 a contraint de grands fournisseurs de cloud comme Alibaba à réduire leurs propres prix de modèles d’IA jusqu’à 97 %.

Il est important de souligner que, comme DeepSeek, le nouveau Qwen 2.5-Max d’Alibaba semble éviter de discuter des sujets politiques sensibles liés à la Chine. Les tentatives de l’interroger sur de tels sujets sont apparemment accueillies avec des messages d’excès de quotas de données, même s’il répond normalement à d’autres demandes.