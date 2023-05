Vue d’ensemble : la nouvelle stratégie de NVIDIA est centrée sur les IA génératives, les grands modèles de langage et les systèmes de recommandation, tout comme son dernier supercalculateur DGX. La société pense que ceux-ci formeront bientôt les « moteurs numériques de l’économie moderne » alors que des entreprises comme Meta, Google et Microsoft se précipitent pour tirer parti des avantages de l’IA en utilisant les architectures matérielles Grace, Hopper et Ada Lovelace de NVIDIA.

À l’heure actuelle, ce n’est un secret pour personne que NVIDIA s’est lancée dans l’idée de vendre des pelles aux entreprises, grandes et petites, qui creusent de manière maniaque dans le pays des IA génératives à la recherche de trésors numériques. La société est bien placée pour capitaliser sur cette tendance et pourrait très bien devenir le premier fabricant de puces avec une valorisation de 1 000 milliards de dollars, soit plus du double de celle de TSMC, la société qui fabrique plus de la moitié des puces les plus avancées au monde.

Les annonces de NVIDIA au Computex 2023 reflètent très bien cette nouvelle stratégie. Le PDG de NVIDIA, Jensen Huang, a révélé que les super puces Grace Hopper GH200 de la société sont désormais en pleine production, soulignant leur potentiel d’accélération des services de calcul et des logiciels pour les nouveaux modèles commerciaux et l’optimisation des modèles existants.

Huang dit que l’industrie technologique s’est heurtée à un mur dur avec l’architecture traditionnelle ces dernières années, c’est pourquoi elle se tourne de plus en plus vers les GPU et l’informatique accélérée pour résoudre des tâches informatiques complexes. Pour satisfaire cette augmentation de la demande, NVIDIA a développé une nouvelle plate-forme de supercalcul DGX GH200 qui contient 256 super puces Grace Hopper GH200.

Chaque unité Grace Hopper combine un processeur Grace et un GPU H100 Tensor Core, et le système DGX GH200 est censé fournir un exaflop de performances de calcul ainsi que dix fois plus de bande passante mémoire que la génération précédente. Pour référence, le premier ordinateur exascale était le supercalculateur Frontier du laboratoire national d’Oak Ridge dans le Tennessee, qui a pu atteindre 1,2 exaflops lors du test Linmark l’année dernière, retirant la couronne au système japonais Fugaku.

Le DGX GH200 est également équipé de 144 téraoctets de mémoire partagée, soit 500 fois plus que dans le système DGX A100 qu’il remplace. Cela devrait permettre aux entreprises de créer et d’exécuter facilement des modèles d’IA génératifs comme celui derrière ChatGPT. NVIDIA affirme que Microsoft, Google Cloud et Meta sont parmi les premiers clients du nouveau supercalculateur, tandis que le japonais SoftBank cherche à apporter les super puces GH 200 aux centres de données à travers le pays asiatique.

NVIDIA utilisera également quatre systèmes DGX GH200 liés à l’aide du réseau Quantum-2 InfiniBand avec une bande passante allant jusqu’à 400 Go par seconde pour créer son propre supercalculateur AI appelé Helios. Par ailleurs, la société lance plus de 400 configurations système différentes qui seront commercialisées dans les mois à venir et qui intègrent les architectures Hopper, Grace et Ada Lovelace pour une variété d’applications informatiques hautes performances.

Lorsqu’il se tenait à côté d’une représentation visuelle grandeur nature du système DGX GH200 sur scène, Huang l’a décrit comme « quatre éléphants, un GPU », puisque toute unité GH200 a accès à l’ensemble du pool de mémoire de 144 téraoctets. Il a également essayé de faire plaisir au public en notant qu’il se demandait si ce nouveau système pouvait faire fonctionner Crysis. Étant donné que les passionnés ont pu exécuter le célèbre titre directement à partir de la VRAM d’une GeForce RTX 3090, vous pourriez probablement exécuter plusieurs milliers d’instances simultanées en utilisant un monstre comme le DGX GH200.

Une chose est sûre : NVIDIA se concentre presque sur la capitalisation du boom des puces IA, car les avancées dans ce domaine génèrent plus de la moitié de ses revenus. Le nouveau supercalculateur DGX est une nouvelle tentative pour maintenir l’industrie accrochée aux produits NVIDIA. Qu’une entreprise souhaite alimenter des réseaux 5G, des services d’IA générative, des robots d’usine, des expériences de réalité augmentée et virtuelle ou des moteurs publicitaires, NVIDIA veut être le fournisseur incontournable pour toutes les entreprises qui cherchent à utiliser l’informatique accélérée.

Les joueurs sont toujours sur le radar de l’entreprise, mais plus à travers le prisme de ce que l’IA peut faire pour améliorer les expériences de jeu. Par exemple, le nouveau Avatar Cloud Engine for Games de NVIDIA permettra aux développeurs d’améliorer les interactions avec les personnages non jouables en les liant à un grand modèle de langage. La société ne dirait pas à quoi ressembleraient les exigences système pour cette nouvelle technologie, mais nous savons que la version de recherche de NVIDIA est occupée à explorer des moyens d’optimiser les ressources de jeu dans les futurs jeux utilisant l’IA.

