La grande image: Des normes concurrentes pourraient bientôt émerger alors que des entreprises comme Microsoft, Intel, Qualcomm et Apple se préparent à promouvoir les PC et autres appareils qui donnent la priorité aux opérations d’IA sur les appareils. Microsoft et Intel ont récemment présenté ce qui, selon eux, devrait être classé comme « PC IA », mais l’actuel leader du secteur de l’IA, NVIDIA, a des idées différentes.
Une présentation interne récemment divulguée de NVIDIA explique la préférence apparente de l’entreprise pour les GPU dédiés plutôt que les unités de traitement neuronal (NPU) pour exécuter des applications d’IA générative locales. Le géant des cartes graphiques pourrait considérer les NPU d’autres sociétés comme une menace puisque ses bénéfices ont grimpé en flèche depuis que ses processeurs sont devenus partie intégrante de l’exploitation de grands modèles de langage.
Depuis le lancement de ses processeurs Meteor Lake à la fin de l’année dernière, Intel a tenté de faire des ordinateurs portables dotés de processeurs et de leurs NPU intégrés une nouvelle classe de « PC IA » conçus pour effectuer des opérations d’IA génératives sans dépendre de centres de données massifs dans le cloud. Microsoft et Qualcomm prévoient de lancer davantage de PC IA sur le marché plus tard cette année, et Apple prévoit de prendre le train en marche en 2024 avec ses prochains processeurs bioniques M4 et A18.
Microsoft tente de promouvoir ses services comme faisant partie intégrante de la nouvelle tendance en répertoriant son assistant virtuel Copilot et une nouvelle clé Copilot comme exigences pour tous les PC IA. Cependant, NVIDIA pense que ses cartes graphiques RTX, commercialisées depuis 2018, sont bien mieux adaptées aux tâches d’IA, ce qui implique que les NPU sont inutiles et que des millions de « PC IA » sont déjà en circulation.
Microsoft affirme que des performances d’IA atteignant 40 000 milliards d’opérations par seconde (TOPS) seront nécessaires pour les PC IA de nouvelle génération, mais la présentation de NVIDIA affirme que les GPU RTX peuvent déjà atteindre 100 à 1 300 TOPS. Le fabricant de GPU a déclaré que les puces telles que les cartes graphiques RTX 3000 et 40 actuellement disponibles sont d’excellents outils pour la création de contenu, la productivité, les chatbots et d’autres applications impliquant de nombreux grands modèles de langage. Pour de telles tâches, la GeForce RTX 4050 mobile est censée surpasser le processeur M3 d’Apple, et la RTX 4070 de bureau atteint des « performances phares » dans Stable Diffusion 1.5.

Pour mettre en valeur les capacités uniques de sa technologie, NVIDIA a déployé une mise à jour majeure pour ChatRTX. Ce chatbot, alimenté par TensorRT-LLM de NVIDIA, fonctionne localement sur n’importe quel PC équipé d’un GPU RTX série 30 ou 40 et d’un minimum de 8 Go de VRAM. Ce qui distingue ChatRTX, c’est sa capacité à répondre aux requêtes dans plusieurs langues en parcourant des documents ou des listes de lecture YouTube fournies par les utilisateurs. Il est compatible avec les formats texte, pdf, doc, docx et XML.
Bien sûr, ce n’est pas parce que NVIDIA affirme être le leader infaillible en matière de performances de l’IA embarquée que ses concurrents jetteront l’éponge et diront : « Vous gagnez ». Au contraire, la concurrence et la R&D sur le marché des NPU ne feront que s’intensifier à mesure que les entreprises tenteront de renverser NVIDIA.
Détente, découvrez l’évolution du nombre de smartphones vendus par marque au fil du temps dans la vidéo ci-dessous :


