Pourquoi c’est important : avec l’échelle des modèles d’IA générative qui croît plus rapidement que les capacités de calcul nécessaires pour les former et les exécuter, il n’est pas étonnant que des entreprises comme Microsoft explorent des solutions internes comme alternative au hardware standard du marché dominant. entreprise dans l’espace GPU dédié.
La course à la suprématie de l’IA parmi les géants de la technologie ne fait que commencer, et elle va déjà au-delà de l’alimentation d’énormes quantités de données vers des modèles comme le célèbre (ou tristement célèbre, selon votre point de vue) ChatGPT qui fait partie de presque tous les cycles d’actualités.
Un rapport de The Information affirme que Microsoft développe actuellement une puce d’IA personnalisée pour former ses modèles. Le mystérieux morceau de silicium porte le nom de code « Athena » et la société aurait commencé à travailler dessus en 2019. Pour l’instant, seul un petit groupe d’employés de Microsoft et d’OpenAI y ont accès afin de tester ses performances lorsqu’il est utilisé pour de grands modèles de langage. comme GPT-4.
Les entreprises, grandes et petites, saisissent tous les GPU Nvidia de niveau entreprise afin de créer des systèmes puissants nécessaires à la formation de modèles d’intelligence artificielle à l’aide d’ensembles de données organisés. Il s’agit du même hardware qu’ils utilisent pour exécuter les modèles et faire quelque chose appelé « inférence » – le processus qui prend des informations ou des entrées du monde réel et génère un élément de contenu utile pour une application spécifique.

Le problème est que Nvidia ne peut fabriquer qu’un nombre limité de GPU A100 et H100, et chacun d’eux coûte une petite fortune. Les GPU A100 coûtent environ 10 000 $ chacun, et les GPU H100 plus modernes coûtent plus de 40 000 $ sur eBay. Team Green est tellement satisfaite de la demande refoulée qu’elle déplace une partie de la capacité de production des GPU GeForce RTX 4090 pour fabriquer davantage de GPU H100.
Par conséquent, il ne devrait pas être surprenant que des entreprises comme Microsoft essaient de réduire leur dépendance à un seul fournisseur pour leurs efforts d’apprentissage automatique. Cela pourrait également entraîner des économies de coûts importantes sur toute la ligne, c’est pourquoi Amazon, Meta et Google suivent la même voie de construction de puces internes.
Avec 300 personnes travaillant sur la puce Athena et plusieurs générations prévues pour les années à venir, il sera intéressant de voir ce qu’il adviendra du partenariat existant de Microsoft avec Nvidia. Quoi qu’il en soit, le géant de Redmond a été occupé à intégrer la technologie de l’IA dans chaque produit ou service qu’il propose, qu’il s’agisse du navigateur Edge, de son moteur de recherche Bing, de la suite Microsoft 365, de GitHub, etc.
Fait intéressant, un rapport distinct de Thurrott suggère que Microsoft développe également une unité de traitement neuronal (NPU) pour sa gamme d’appareils Surface. Il utilise actuellement des processeurs et des SoC d’Intel, d’AMD et de Qualcomm – jusqu’à présent, seule la version Qualcomm de la Surface Pro 9 dispose d’un NPU.
Découvrez le reportage du mois (sous-titré en français), l’IA gagnera t-elle face aux champion du monde du jeu de Go ? :

