La grande image: Pour ceux d’entre vous qui n’ont pas prêté une attention particulière, Nvidia n’est plus une société de jeux. Oh, bien sûr, ils continuent de fabriquer certaines des puces graphiques les plus performantes pour les jeux et hébergent un service de jeu mondial basé sur le cloud appelé GeForce Now. Mais si vous prenez du recul et examinez la gamme complète des offres de la société, elle est beaucoup plus large qu’elle ne l’a jamais été – un point que le PDG Jensen Huang a martelé lors de son discours d’ouverture sur la GTC cette semaine. Selon ses propres termes, «Nvidia est désormais une société d’informatique complète.»
Reflétant à quel point la portée de Nvidia s’est élargie au cours des dernières années, ironiquement, il y avait probablement autant de nouvelles sur les puces non-GPU que sur les GPU à GTC 2021 (GPU Technology Conference).
Entre un nouveau processeur 5 nm basé sur le bras nommé «Grace», un élargissement de la gamme DPU créée à partir de l’acquisition de Mellanox, de nouveaux ajouts à ses puces et plates-formes automobiles et des discussions sur l’informatique quantique, le traitement des données 5G et plus encore, la société atteint à des portions toujours plus larges du paysage informatique.

À ne pas négliger, bien sûr, il y a eu de nouvelles annonces liées au GPU et au GPU, y compris une gamme impressionnante de nouveaux logiciels et services GPU basés sur l’IA basés sur le cloud.
À son honneur, Nvidia élargit depuis plusieurs années la gamme d’applications pour les GPU. Son impact sur l’apprentissage automatique, les réseaux de neurones profonds et d’autres modèles d’IA sophistiqués a été bien documenté, et lors du salon de cette année, la société a continué d’étendre cette portée. En particulier, Nvidia a souligné ses efforts visant l’entreprise avec toute une gamme de modèles d’IA prédéfinis que les entreprises peuvent déployer plus facilement pour un large éventail d’applications. L’outil d’IA conversationnelle Jarvis annoncé précédemment, par exemple, est désormais disponible et peut être utilisé par les entreprises pour créer des outils de service client automatisés.

Aussi impressionnantes que soient les applications axées sur le GPU pour l’entreprise, la grande nouvelle (et une partie de la plus grande confusion) de GTC est venue du changement stratégique de l’entreprise vers trois types de puces différents: GPU, DPU et CPU.
Le projet Maxine récemment dévoilé est conçu pour améliorer la qualité vidéo sur des connexions à faible bande passante et pour effectuer une transcription automatique et une traduction en temps réel – des capacités opportunes et pratiques que de nombreux outils de collaboration ont mais pourraient probablement être améliorées avec l’intégration de Nvidia, basée sur le cloud, Outils alimentés par l’IA. La société a également fait une annonce importante avec VMware, notant que les outils et plates-formes d’intelligence artificielle de Nvidia peuvent désormais fonctionner sur des environnements VMWare virtualisés en plus du matériel bare metal dédié. Bien qu’apparemment banal à première vue, il s’agit en fait d’un développement extrêmement important pour les nombreuses entreprises qui exécutent une bonne partie de leurs charges de travail sur VMware.

Aussi impressionnantes que soient les applications axées sur le GPU pour l’entreprise, la grande nouvelle (et une partie de la plus grande confusion) de GTC est venue du changement stratégique de l’entreprise vers trois types de puces différents: GPU, DPU et CPU. Le PDG Huang a parfaitement résumé l’approche avec une slide qui montrait les feuilles de route pour les trois différentes lignes de puces jusqu’en 2025, soulignant comment chaque ligne sera mise à jour toutes les quelques années, mais avec des points de départ différents, permettant à l’entreprise d’en avoir un (et parfois deux ) des avancées architecturales majeures chaque année.

La ligne DPU, baptisée BlueField, s’appuie sur la technologie de mise en réseau à haut débit que Nvidia a acquise lors de l’achat de Mellanox en avril dernier. Spécifiquement ciblée sur les centres de données, le HPC (calcul haute performance) et les applications de cloud computing, la gamme de puces BlueField est parfaitement adaptée pour accélérer les performances des applications Web modernes.
Étant donné que ces applications sont divisées en de nombreux conteneurs plus petits qui s’exécutent souvent sur plusieurs serveurs physiques, elles dépendent fortement de ce que l’on appelle communément le trafic «est-ouest» entre les racks informatiques d’un centre de données. Il est important de noter cependant que ces mêmes principes de développement logiciel sont utilisés pour une gamme de plus en plus large d’applications, y compris l’automobile, ce qui explique pourquoi la dernière génération de SoC automobile (nom de code Atlan et discuté ci-dessous) inclut un cœur BlueField dans sa conception.

La nouvelle gamme de processeurs – qui a incontestablement généré le plus de buzz – est une conception basée sur Arm et baptisée Grace (pour le pionnier de l’informatique Grace Hopper – une initiative élégante de la part de Nvidia). Bien que de nombreux rapports initiaux suggèrent qu’il s’agissait d’un produit concurrentiel pour les processeurs des serveurs Intel et AMD x86, la vérité est que l’objectif initial de mise en œuvre de Grace ne concerne que le HPC et d’autres énormes charges de travail basées sur des modèles d’IA. Ce n’est pas une conception de processeur à usage général. Néanmoins, dans les types d’applications d’IA avancées, très exigeantes et gourmandes en mémoire que Nvidia cible initialement pour Grace, il résout le problème critique de la connexion des GPU à la mémoire système à des vitesses nettement plus rapides que les architectures x86 traditionnelles. De toute évidence, ce n’est pas une application dont toutes les organisations peuvent tirer parti, mais pour le nombre croissant d’organisations qui construisent de grands modèles d’IA, c’est toujours très important.

Bien sûr, une partie de la raison de la confusion est que Nvidia tente actuellement d’acheter Arm, de sorte que tout lien entre les deux est lié à un problème plus vaste. De plus, Nvidia a démontré une gamme d’applications différentes dans lesquelles il travaille pour combiner son IP avec des produits basés sur Arm, y compris le cloud computing avec AWS Graviton d’Amazon, l’informatique scientifique en conjonction avec les processeurs de serveur Altra à usage général d’Ampère, l’infrastructure réseau 5G et l’informatique de pointe avec Octeon de Marvell et PC avec SoC MT819x de MediaTek.
Comme pour un cœur BlueField DPU de nouvelle génération, le nouveau diagramme SoC automobile d’Atlan incorpore un cœur de processeur «Grace Next», générant encore plus de spéculations. En parlant de cela, Nvidia a également mis en évidence un certain nombre d’annonces liées à l’automobile à GTC.

La plate-forme automobile de nouvelle génération de la société porte le nom de code Orin et devrait apparaître dans les véhicules de grands acteurs tels que Mercedes-Benz, Volvo, Hyundai et Audi à partir de l’année prochaine. La société a également annoncé l’ordinateur central Orin, où une seule puce peut être virtualisée pour exécuter quatre applications différentes, y compris le tableau de bord, le système d’infodivertissement, l’interaction et la surveillance des passagers, et des fonctionnalités de conduite autonome et assistée avec vue de confiance – un affichage visuel de ce que les ordinateurs de la voiture voient, conçus pour donner aux passagers l’assurance qu’elle fonctionne correctement. La société a également lancé sa plate-forme de véhicule autonome (AV) Hyperion de huitième génération, qui comprend plusieurs puces Orin, des capteurs d’image, un radar, un lidar et le dernier logiciel audiovisuel de la société.
Une nouvelle puce – l’Atlan susmentionné – devrait arriver en 2025. Bien que beaucoup puissent trouver une pré-annonce pluriannuelle excessive, c’est une pratique relativement courante dans l’industrie automobile, où ils travaillent généralement sur les voitures trois ans avant leur introduction.
Atlan est également le premier produit Nvidia à inclure les trois architectures de puces de base de la société – GPU, DPU et CPU – dans une seule conception de semi-conducteur.
Atlan est intrigant à bien des égards, dont le moindre n’est pas le fait qu’il devrait quadrupler la puissance de calcul d’Orin (qui sortira en 2022) et atteindre un taux de 1000 TOPS (téra opérations par seconde). Comme indiqué précédemment, Atlan est également le premier produit Nvidia à inclure les trois architectures de puces de base de la société – GPU, DPU et CPU – dans une seule conception de semi-conducteur.

Les détails restent vagues, mais la prochaine génération de chacune des architectures actuelles devrait faire partie d’Atlan, ce qui en fera potentiellement un enfant d’affiche des opportunités élargies de l’entreprise, ainsi qu’un excellent exemple de la sophistication technique des automobiles à sortir. à cette époque. Quoi qu’il en soit, Atlan sera certainement quelque chose à regarder.
Tout compte fait, Nvidia a présenté une histoire large et impressionnante à GTC. Je n’ai même pas mentionné, jusqu’à présent, sa plate-forme Omniverse pour la collaboration 3D, ses plates-formes matérielles de type supercalculateur DGX et une foule d’autres annonces faites par la société. Il y avait tout simplement trop de choses à couvrir dans une seule colonne. Cependant, cela est évident. Nvidia se concentre clairement sur un éventail d’opportunités beaucoup plus large que jamais.
Même si les fans de jeux ont peut-être été déçus par le manque de nouvelles pour eux, quiconque pense à l’avenir de l’informatique ne peut s’empêcher d’être impressionné par la profondeur de ce que Nvidia a dévoilé. Les jeux et les GPU ne sont, semble-t-il, que le début.
Bob O’Donnell est le fondateur et analyste en chef de TECHnalysis Research, LLC, une société de conseil en technologie qui fournit des services de conseil stratégique et d’études de marché à l’industrie technologique et à la communauté financière professionnelle. Vous pouvez le suivre sur Twitter @bobodtech.
