Qu’est-ce qui vient de se passer ? Intel a lancé le défi à NVIDIA dans la bataille acharnée pour la suprématie hardware de l’IA. Au Computex cette semaine, le PDG Pat Gelsinger a dévoilé les prix des puces accélératrices d’IA Gaudi 2 et Gaudi 3 de nouvelle génération d’Intel, et les chiffres semblent perturbateurs.
Les prix de produits comme ceux-ci sont généralement cachés au public, mais Intel a résisté à la tendance et a fourni des chiffres officiels. L’accélérateur phare Gaudi 3 coûtera environ 15 000 dollars par unité lorsqu’il est acheté individuellement, soit 50 % moins cher que le GPU concurrent H100 pour centre de données de NVIDIA.
Le Gaudi 2, bien que moins puissant, réduit également considérablement les prix de NVIDIA. Un kit complet d’accélérateur Gaudi 2 à 8 puces se vendra 65 000 $ aux fournisseurs de systèmes. Intel affirme que cela ne représente qu’un tiers du prix des configurations comparables de NVIDIA et d’autres concurrents.
Pour le Gaudi 3, cette même configuration de kit à 8 accélérateurs coûte 125 000 $. Intel insiste sur le fait qu’il est deux tiers moins cher que les solutions alternatives à ce niveau de performances haut de gamme.
À #Computex2024PDG d’Intel @PGelsinger a dévoilé tous les nouveaux processeurs Intel®ï¸Â Xeon®ï¸Â 6, l’architecture Lunar Lake et plus de 80 nouvelles conceptions de PC IA et kits IA standard, dont huit accélérateurs Intel® Gaudi® 2 et 3. pic.twitter.com/viHlLGQVDd
– Intel Inde (@IntelIndia) 7 juin 2024
Pour donner un peu de contexte aux prix de Gaudi 3, le nouveau GPU Blackwell B100 de NVIDIA coûte environ 30 000 $ par unité. Pendant ce temps, le combo Blackwell CPU + GPU hautes performances, le B200, se vend environ 70 000 $.
Bien entendu, la tarification n’est qu’une partie de l’équation. Les performances et l’écosystème logiciel sont des considérations tout aussi cruciales. Sur ce front, Intel insiste sur le fait que le Gaudi 3 suit le rythme ou surpasse le H100 de NVIDIA dans une variété de charges de travail importantes de formation et d’inférence en IA.
Les benchmarks cités par Intel montrent que le Gaudi 3 offre des temps de formation jusqu’à 40 % plus rapides que le H100 dans de grands clusters de 8 192 puces. Même une configuration Gaudi 3 plus petite à 64 puces offre un débit 15 % plus élevé que le H100 sur le modèle de langage populaire LLaMA 2, selon la société. Pour l’inférence IA, Intel revendique un avantage de vitesse 2x par rapport au H100 sur des modèles comme LLaMA et Mistral.
Cependant, même si les puces Gaudi exploitent des normes ouvertes comme Ethernet pour un déploiement plus facile, elles manquent d’optimisations pour la plate-forme CUDA omniprésente de NVIDIA sur laquelle s’appuient aujourd’hui la plupart des logiciels d’IA. Convaincre les entreprises de refactoriser leur code pour Gaudi pourrait être difficile.

Pour favoriser l’adoption, Intel affirme avoir sélectionné au moins 10 principaux fournisseurs de serveurs, dont de nouveaux partenaires constructeurs de Gaudi 3 comme Asus, Foxconn, Gigabyte, Inventec, Quanta et Wistron. Des noms familiers comme Dell, HPE, Lenovo et Supermicro sont également présents.
NVIDIA reste néanmoins une force avec laquelle il faut compter dans le monde des centres de données. Au dernier trimestre 2023, ils détenaient une part de 73 % du marché des processeurs pour centres de données, et ce chiffre a continué d’augmenter, réduisant les enjeux d’Intel et d’AMD. Le marché des GPU grand public n’est pas si différent, avec NVIDIA détenant une part de 88 %.
C’est une bataille difficile pour Intel, mais ces énormes différences de prix pourraient contribuer à réduire l’écart.
Détente, découvrez l’évolution du nombre de smartphones vendus par marque au fil du temps dans la vidéo ci-dessous :

