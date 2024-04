Le point de vue de l’éditeur : Pour être clair, nous ne détestons pas NVIDIA. Plutôt l’inverse; nous sommes de plus en plus convaincus de leur position forte dans le centre de données depuis leur journée des analystes de mars 2022 – six mois avant que ChatGPT n’enflamme le monde de l’IA. Notre titre fait référence à la comédie romantique de 1999, qui est une adaptation moderne de Shakespeare. Même si nous ne dirions pas que nous aimons NVIDIA, nous sommes convaincus qu’ils continueront à dominer le marché du silicium pour centres de données dans un avenir prévisible.

Cela étant dit, nous recherchons l’honnêteté intellectuelle, ce qui signifie que plus notre conviction dans une thèse est élevée, plus nous devons la tester. Percer des trous. Cherchez les raisons pour lesquelles nous pourrions nous tromper. Dans ce cas, nous souhaitons explorer toutes les façons dont NVIDIA pourrait être vulnérable.

Note de l’éditeur:

L’auteur invité Jonathan Goldberg est le fondateur de D2D Advisory, un cabinet de conseil multifonctionnel. Jonathan a développé des stratégies de croissance et des alliances pour des entreprises des secteurs de la téléphonie mobile, des réseaux, des jeux et des logiciels.

Il est difficile d’envisager cela de manière systémique, car NVIDIA se positionne comme fournissant des solutions complètes, ce qui signifie que toutes les versions sont liées ensemble. Mais nous diviserons notre analyse en plusieurs catégories et passerons en revue chacune d’entre elles.

Les fabricants de puces

Le premier domaine est le hardware. NVIDIA fonctionne incroyablement bien depuis plusieurs années et possède un net avantage en termes de performances. D’une manière générale, ils dominent le marché de la formation en IA. Cependant, le marché de l’inférence cloud devrait être plus vaste, et ici, les aspects économiques compteront plus que les performances brutes. Ce changement est susceptible d’introduire beaucoup plus de concurrence.

Le concurrent le plus proche ici est AMD avec sa série MI300. Bien que ce hardware soit très performant, il lui manque encore de nombreuses fonctionnalités. C’est probablement suffisant pour créer une niche pour AMD, mais il semble peu probable qu’il ait un impact significatif sur la part de marché de NVIDIA pour le moment. Intel et son accélérateur Gaudi 3 récemment lancé suffisent à montrer qu’Intel est toujours dans le jeu, mais l’appareil n’est ni programmable ni complet, ce qui limite la capacité d’Intel à défier NVIDIA sur certains segments de marché. Dans l’ensemble, parmi les principaux fabricants de puces, NVIDIA semble bien positionné.

De plus, un certain nombre de startups s’attaquent à ce marché. Le plus avancé est probablement Groq, qui a publié des tests d’inférence assez impressionnants. Cependant, notre évaluation est que leur solution n’est adaptée qu’à un sous-ensemble de tâches d’inférence d’IA. Bien que cela puisse suffire à Groq pour rester compétitif, cela ne constitue pas une menace pour NVIDIA sur une grande partie du marché.

Les hyperscalers

La concurrence la plus sérieuse vient des solutions internes en silicium des hyperscalers.

Google est de loin le plus avancé dans ce domaine. Ils ont récemment révélé qu’ils utilisaient leurs TPU pour entraîner le grand modèle de langage Gemini, la seule fissure majeure dans la domination de NVIDIA en matière de formation. Mais Google est un cas particulier, ils contrôlent leur pile logicielle, ce qui leur permet d’adapter très précisément les TPU. Les autres hyperscalers sont plus en retard.

Après des années à tout tester sur le marché, Meta a enfin lancé son propre accélérateur, à la suite de Microsoft qui a lancé le sien l’année dernière. Ces deux solutions semblent intéressantes, mais ce sont également des premières tentatives, et il faudra quelques générations pour que ces solutions fassent leurs preuves. Tout cela renforce notre opinion selon laquelle les deux continueront à s’appuyer fortement sur NVIDIA et AMD pendant encore quelques années.

Pendant ce temps, AWS en est à la deuxième génération de ses puces d’inférence et de formation, mais celles-ci sont également relativement en retard, et Amazon semble désormais se démener pour acheter autant de produits NVIDIA que possible. Leurs besoins viennent du fait qu’ils ne contrôlent pas leur pile logicielle ; ils exécutent les logiciels de leurs clients, et ces clients ont une forte préférence pour NVIDIA.

La mise en réseau

Un autre élément important dans tout cela est le hardware réseau. Les liens entre tous les serveurs d’un data center constituent une contrainte majeure sur les modèles d’IA. NVIDIA possède un avantage majeur dans sa pile réseau. Cela vient en grande partie de leur acquisition de Mellanox en 2019 et de leur solution Infiniband à faible latence.

Cette opération restera probablement dans les mémoires comme l’une des meilleures opérations de fusion et acquisition de l’histoire récente. Toutefois, cet avantage est une arme à double tranchant. Les ventes de systèmes complets par NVIDIA représentent aujourd’hui une part importante de la croissance de leurs revenus et, dans de nombreux cas d’utilisation, les avantages de ces systèmes reposent en grande partie sur l’élément réseau.

Rappelons que NVIDIA a admis que le réseau est la source de son avantage sur le marché de l’inférence. Pour le moment, Infiniband reste essentiel aux déploiements d’IA, mais l’industrie consacre d’immenses efforts à la version à faible latence d’Ethernet, Ultra Ethernet. Si Ultra Ethernet tenait ses promesses, qui ne sont en aucun cas garanties, cela mettrait la pression sur NVIDIA dans certains domaines importants.

Bref, NVIDIA fait face à une grande quantité de concurrents, mais reste largement en avance en qualité.

CUDA

Une des principales raisons de cette avance reste sa pile logicielle. Le logiciel de NVIDIA présente en réalité deux faces : sa couche de compatibilité « CUDA » et la gamme croissante de services et de modèles logiciels qu’il propose aux clients.

CUDA est le plus connu d’entre eux, souvent cité comme la base de l’avance de l’entreprise en matière de calcul de l’IA. Nous pensons que cela simplifie à l’extrême la situation. CUDA est en réalité un raccourci pour une multitude de fonctionnalités des puces NVIDIA qui les rendent programmables jusqu’à un niveau très bas. D’après tout ce que l’on peut voir, ces douves restent incroyablement solides.

L’industrie prend (enfin) conscience de la puissance qu’offre cette couche logicielle, et de nombreuses initiatives existent pour proposer des alternatives. Celles-ci vont du ROCm d’AMD aux alternatives « ouvertes » comme XLA et UXL. Si vous souhaitez approfondir ce sujet, Austin Lyon a écrit une excellente introduction à ChipStrat, qui vaut vraiment la peine d’être lue.

Mais pour résumer, aucun d’entre eux n’a encore gagné en popularité, et la multitude d’alternatives risque de diluer les efforts de chacun – comme d’habitude, XKCD l’a dit le mieux. L’heuristique que nous avons utilisée pour évaluer ces alternatives consiste à demander aux partisans de chacune d’entre elles combien de puces prennent actuellement en charge la norme. Chaque fois que la réponse dépassera un silence gênant, nous reviendrons sur cette position. La plus grande menace pour NVIDIA sur ce front vient de ses propres clients. Les principaux hyperscalers cherchent tous des moyens de s’éloigner de CUDA, mais ils sont probablement les seuls capables de le faire.

Plus de logiciels

Au-delà de CUDA, NVIDIA développe également toute une suite d’autres logiciels. Ceux-ci incluent des modèles pré-entraînés pour quelques dizaines de marchés finaux, des API de services composables (NIM) et bien d’autres.

Ceux-ci facilitent grandement la formation et le déploiement de modèles d’IA, à condition que ces modèles fonctionnent sur du silicium NVIDIA. L’IA n’en est qu’à ses débuts, et si NVIDIA devait les adopter largement, ils verraient effectivement une génération de développeurs dont l’intégralité des piles logicielles repose sur ces services. Jusqu’à présent, on ne sait pas exactement dans quelle mesure cette adoption est répandue. Nous savons que sur certains marchés, comme l’industrie pharmaceutique et la biotechnologie, les outils NVIDIA suscitent un enthousiasme considérable, tandis que d’autres marchés en sont encore aux premières phases d’évaluation.

Il n’est pas clair si NVIDIA envisage un jour de facturer ces services et de développer une véritable activité de logiciels, ce qui soulève une question fondamentale plus large concernant la compétitivité de NVIDIA. À mesure qu’ils connaissent du succès et gagnent en importance, le niveau d’inconfort de l’industrie augmente.

La chaîne d’approvisionnement des centres de données regorge déjà de plaintes concernant les prix de NVIDIA, l’allocation de versions rares et les longs délais de livraison. Les plus gros clients de NVIDIA, les hyperscalers, craignent fortement de devenir trop dépendants de l’entreprise, d’autant plus que NVIDIA semble hésiter à lancer sa propre offre d’infrastructure en tant que service (IaaS).

Jusqu’où iront ces clients, quelle part de la pile de NVIDIA achèteront-ils ? Il doit y avoir une limite, mais les entreprises peuvent souvent court-circuiter la réflexion stratégique à long terme au profit de remises et d’opportunités d’approvisionnement à court terme. Les hyperscalers ne se seraient pas retrouvés dans cette situation s’ils n’avaient pas abandonné presque toutes les startups qui ont tenté de leur vendre une alternative au cours de la dernière décennie. NVIDIA est donc certainement confronté à des risques sur ce front, mais pour le moment, ces risques sont largement informes.

Le modèle économique

De manière plus générale, nous pensons que le modèle économique global de NVIDIA présente des défis. L’entreprise a toujours vendu des systèmes complets, depuis les cartes graphiques d’il y a 30 ans jusqu’aux gigantesques racks de serveurs DGX d’aujourd’hui.

Même si l’entreprise se dit prête à vendre des composants décomposés, elle préférerait clairement vendre des systèmes complets. Et cela pose un certain nombre de problèmes. Comme le démontre l’histoire de l’entreprise, lorsque les cycles de stocks diminuent, NVIDIA se trouve au bout du coup de fouet, faisant des ravages dans ses finances.

Jensen Huang (co-fondateur et PDG de NVIDIA)

Compte tenu de l’ampleur de leur croissance récente et des systèmes toujours plus grands qu’ils vendent, le risque d’une réinitialisation majeure est bien plus grand. Soyons clairs, nous ne prévoyons pas que cela se produise dans un avenir proche, mais cela vaut la peine de considérer l’ampleur du problème.

Infrastructure en tant que service (IaaS)

Ce qui nous amène aux usines d’IA. Il existe désormais une douzaine d’opérateurs de centres de données, indépendants des hyperscalers IaaS du cloud public, qui exploitent des entrepôts remplis de GPU NVIDIA. NVIDIA a investi dans bon nombre d’entre eux et ils constituent probablement une source de revenus majeure étant donné que leur proposition de valeur repose en grande partie sur leur capacité à proposer des instances GPU à la demande.

Il s’agit de la chaîne de NVIDIA et elle sera probablement une source de problèmes à un moment donné. En toute honnêteté, il existe une faible possibilité que l’IA présente un changement si sismique dans le calcul que les usines d’IA deviennent les fournisseurs IaaS dominants, mais il existe quelques entreprises pesant des milliers de milliards de dollars qui mèneraient une guerre de la terre brûlée pour empêcher que cela ne se produise.

IA de nouvelle génération

Enfin, le risque ultime qui pèse sur NVIDIA est la croissance de l’apprentissage automatique basé sur les réseaux neuronaux, également appelé IA. Jusqu’à présent, les gains de l’IA ont une portée assez limitée : génération de code, marketing numérique et une multitude de petits gains de performances logiciels cachés.

Si vous souhaitez construire un cas d’ours pour NVIDIA, vous devriez explorer la possibilité que l’IA ne aille pas plus loin. Nous pensons que cela est peu probable, et notre sentiment est que l’IA peut encore progresser beaucoup plus, mais si elle échoue, NVIDIA serait très exposée.

De la même manière (jeu de mots), les logiciels d’IA évoluent si rapidement qu’il est possible qu’un futur développeur de génie propose un modèle d’IA supérieur qui oriente le calcul dans une direction où les GPU et l’investissement de NVIDIA importent moins. Cela semble peu probable, mais il existe toujours un risque que les logiciels d’IA stagnent ici ou progressent au point de réduire le besoin d’autant de clusters GPU massifs dans le monde. Cela ne doit pas être considéré comme une catastrophe pour NVIDIA, mais cela entraînerait un ralentissement important.

Pour résumer tout cela, NVIDIA est dans une position très forte, mais elle n’est pas inattaquable.

À notre test, leur plus grande menace vient du fait qu’ils connaissent un tel succès qu’ils obligent leurs clients à réagir. Il existe de multiples avenirs pour NVIDIA et le centre de données, allant de NVIDIA qui deviendra l’un des nombreux concurrents dans le centre de données, à NVIDIA devenant le maître de l’univers. Il y a suffisamment de vulnérabilités dans son modèle pour rendre la seconde improbable, mais elles sont tellement dynamiques que la première n’est plus probable.



