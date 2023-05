La vue d’ensemble : développer une alternative aux puissants GPU de NVIDIA est une entreprise colossale, et les entreprises aux poches profondes comme Microsoft sont plus susceptibles de réussir à le faire. La société de Redmond doit sans doute emprunter cette voie, car ses ambitions en matière d’IA augmentent plus rapidement que l’offre de GPU pour centres de données.

Plus tôt cette semaine, nous avons appris que Microsoft pourrait être intéressé à suivre la recette d’Apple consistant à développer du silicium personnalisé pour ses ambitions. Cependant, cela ne devrait surprendre personne qui regarde l’industrie technologique, car presque tous les géants de la technologie travaillent sur leurs propres puces. Facebook, Amazon, Google, Baidu et d’autres sont particulièrement intéressés par les puces de serveur pour devenir moins dépendants du hardware standard et réduire le coût total de possession de leurs centres de données.

Dans le cas de Microsoft, ces ambitions ont commencé petit – la société avait besoin de fabriquer des appareils ambitieux pour Windows on Arm, elle a donc forgé un partenariat exclusif avec Qualcomm pour affiner les chipsets Snapdragon pour les Surface PC. L’année dernière, cette collaboration s’est étendue pour inclure des puces spécialement conçues pour les lunettes de réalité augmentée et virtuelle. À ce stade, Microsoft avait déjà développé une certaine expertise dans la création de processeurs de signaux numériques à faible consommation d’énergie qui agrègent les données de divers capteurs de gestes et d’environnement dans les casques HoloLens.

Un nouveau rapport de Bloomberg affirme que le géant de Redmond a demandé l’aide d’AMD pour construire des puces IA. La publication cite des sources internes connaissant le projet « Athena » et la stratégie qui le sous-tend. Microsoft fournirait à AMD des ressources d’ingénierie pour diriger le développement de hardware spécialisé pour la formation et l’inférence de l’IA. À son tour, cela aiderait cette dernière société à prendre pied sur un marché presque entièrement dominé par NVIDIA.

Le nouveau partenariat est censé être né d’un besoin d’étendre rapidement l’infrastructure pour les modèles d’IA générative, qui nécessitent de grandes quantités de puissance de calcul. Pour mettre les choses en perspective, la puissance de traitement nécessaire pour former et exécuter des systèmes d’intelligence artificielle a augmenté de façon exponentielle ces dernières années. Microsoft et AMD ont besoin d’environ 700 000 dollars par jour pour exécuter le service populaire ChatGPT qui fait désormais partie de presque tous les cycles d’actualités.

Il est assez courant que les startups d’IA dépensent plus de 80% du capital qu’elles lèvent uniquement pour les coûts de calcul, car les GPU NVIDIA A100 et H100 très recherchés qu’ils utilisent coûtent généralement entre 10 000 et 40 000 dollars chacun. C’est pourquoi le chiffre d’affaires annuel du centre de données de NVIDIA a atteint la barre des 13 milliards de dollars l’année dernière. Pour référence, des entreprises spécifiques à l’IA comme SambaNova Systems, Cerebras et Graphcore ont réalisé respectivement 5,1 milliards de dollars, 4 milliards de dollars et 2,8 milliards de dollars en 2022.

En s’associant à Microsoft, AMD pourrait avoir une réelle chance de profiter de l’engouement pour l’IA. Après tout, les deux sociétés ont déjà un partenariat solide qui a vu les unités de traitement de données Pensando de la seconde se déployer dans le cloud Azure de la première.

Lors d’un récent appel aux investisseurs, la PDG d’AMD, Lisa Su, a mentionné que le segment des centres de données de l’entreprise avait connu une baisse du bénéfice d’exploitation au cours du premier trimestre 2023, principalement en raison de « l’augmentation des investissements en R&D pour saisir les grandes opportunités qui nous attendent ». Cela est probablement lié au prochain silicium de Bergame de la société, mais Su a expliqué que la société avait également créé un nouveau groupe d’IA à partir d’équipes dispersées dans différentes divisions. Elle a souligné que les IA génératives étaient la priorité stratégique numéro un d’AMD et un domaine dans lequel l’acquisition de Xilinx et « l’équipe semi-personnalisée très compétente » peuvent apporter beaucoup à la table.

Quant à Microsoft, la société reconnaît l’existence du projet Athena mais affirme qu’AMD n’y est pas impliqué. Cela n’exclut pas la possibilité que les deux sociétés travaillent sur des accélérateurs d’IA personnalisés basés sur les APU MI300 d’AMD.

La société de Redmond aurait dépensé 2 milliards de dollars pour ses efforts en matière de puces et emploie actuellement environ 1 000 ingénieurs dans l’équipe Microsoft Silicon. Microsoft a également débauché l’architecte de puces Apple de haut niveau Mike Fillipo et a confié à Rani Borkar – un ancien cadre d’Intel – la direction du groupe. Il sera intéressant de voir les capacités du silicium Athena, mais la première version devrait être prête en 2024 au plus tôt.

