ChatGPT, le modèle de langage d’IA développé par OpenAI, a fait des vagues dans le monde de la technologie. Partout dans le monde, les personnes sont impressionnés par sa capacité à générer des réponses humaines aux invites textuelles. Cependant, l’expansion rapide du modèle a soulevé des inquiétudes quant à une pénurie potentielle d’unités de traitement graphique (GPU). Ceux-ci sont essentiels pour la formation et l’exécution de grands modèles de langage comme ChatGPT.

Selon le magazine Fortune, le PDG d’OpenAI, Sam Altman, a révélé lors d’une réunion privée que la grave pénurie de GPU entravait les progrès de ChatGPT. Selon le rapport, Altman a rencontré un certain nombre de développeurs d’applications et de responsables de start-up en mai. Raza Habib, PDG de la startup d’IA basée à Londres Humanloop, a déclaré dans un tweet qu’Altman pense qu’OpenAI manque de suffisamment de GPU, ce qui a retardé de nombreux efforts pour optimiser ChatGPT.
Pourquoi ChatGPT a des problèmes de vitesse et de fiabilité
Selon le procès-verbal de la réunion d’Habib, les principales plaintes des utilisateurs concernant ChatGPT étaient la vitesse et la fiabilité de l’interface API. Altman l’a compris et a expliqué que la raison principale est que le GPU n’est sérieusement pas suffisant. Peu de temps après la publication du procès-verbal de la réunion, OpenAI a contacté Habib pour dire que l’événement n’était pas destiné au public.
Bien que Habib ait ensuite supprimé le tweet, il a duré assez longtemps pour que les personnes aient un aperçu des détails marquants. Selon les retours, Altman s’est plaint que la pénurie de GPU entraînait une faible puissance de calcul et OpenAI ne pouvait pas étendre la liste de discussion de ChatGPT. Cela affecte la quantité d’informations que ChatGPT peut traiter lorsqu’il répond aux questions des utilisateurs. Cela limite également la « mémoire » de ChatGPT et il peut avoir du mal à gérer les enregistrements de questions passées. De plus, ChatGPT ne peut pas effectuer de tâches plus fastidieuses en raison de sa faible puissance de calcul. Par exemple, l’outil d’IA peut avoir du mal à écrire des codes de programme complexes en raison de GPU insuffisants.
Selon IT Home, OpenAI est l’une des nombreuses marques en proie à la pénurie de GPU. Les fournisseurs de services de cloud computing tels que Google, Amazon et Microsoft sont tous confrontés à de graves pénuries de GPU. Cela a également fait monter en flèche le cours de l’action du principal fournisseur NVIDIA, devenant ainsi la première société de semi-conducteurs avec une offre marchande de plus d’un billion. Le cours de l’action de la société a grimpé de près de deux fois cette année.

Historique de la pénurie de GPU
La pénurie de GPU n’est pas un problème nouveau pour l’industrie technologique. En 2017, le marché a fait face à une pénurie similaire en raison de la demande accrue de cartes graphiques causée par la hausse des prix d’Ethereum. Cependant, la pénurie actuelle est différente en ce sens que divers facteurs se sont étendus et l’ont aggravée. Le principal coupable est un problème avec les chaînes d’approvisionnement des GPU, qui a été aggravé par une demande accrue dans la région. La pandémie a également perturbé les chaînes d’approvisionnement et développé l’ensemble de l’industrie des semi-conducteurs. Il est donc plus difficile pour les entreprises d’accéder aux composants nécessaires pour produire des GPU.
L’impact de la pénurie de GPU sur ChatGPT
L’explosion de popularité de ChatGPT a suscité certaines craintes qu’une autre pénurie de GPU se profile à l’horizon. Un analyste affirme qu’environ 10 000 GPU NVIDIA ont été utilisés pour former ChatGPT. Par ailleurs, il existe des retours indiquant que le service continue de se développer, tout comme le besoin de GPU.
La pénurie de GPU a rendu plus difficile pour OpenAI de permettre aux utilisateurs de transmettre plus de données via les grands modèles de langage qui sous-tendent ses logiciels, tels que ChatGPT. Cela a ralenti le déploiement prévu par l’entreprise de davantage de fonctionnalités et de services. Cela a également rendu les services existants d’OpenAI plus lents et moins fiables. C’est un gros problème pour de nombreux utilisateurs et cela les rend réticents à créer des applications d’entreprise au-dessus de la technologie d’OpenAI.
Cependant, il est important de noter que le statut exact de la pénurie de GPU n’est pas vraiment clair. Selon un article de Fierce Electronics de mars 2023, il y a une « énorme » pénurie d’approvisionnement en GPU en raison des besoins en IA. D’un autre côté, en août, un rapport d’Ars Technica affirme que la pénurie de GPU est officiellement terminée et que nous sommes maintenant en surplus de GPU. The Verge a également signalé en juillet 2022 que la pénurie de GPU était terminée. Ainsi, le statut exact de la pénurie de GPU n’est toujours pas clair. Cela peut dépendre de divers facteurs tels que l’emplacement, la demande et les perturbations de la chaîne d’approvisionnement.
Solutions potentielles à la pénurie de GPU
Une solution potentielle à la pénurie de GPU est que les entreprises de semi-conducteurs augmentent leur capacité de production. Cependant, c’est plus facile à dire qu’à faire, car la pandémie a perturbé les chaînes d’approvisionnement et rendu plus difficile pour les entreprises l’accès aux composants nécessaires pour produire des GPU.
Une autre solution potentielle consiste pour les entreprises à trouver d’autres moyens de former et d’exécuter de grands modèles de langage comme ChatGPT. Par exemple, OpenAI a retenu son nouveau modèle de langage puissant, GPT-4, de la version gratuite de ChatGPT, qui exécute toujours un modèle GPT-3.5 plus faible, en raison du coût élevé de l’exécution de GPT-4.
Le PDG d’OpenAI, Sam Altman, a indirectement reconnu le problème, déclarant que l’entreprise travaille à rendre ses modèles d’IA plus efficaces et moins gourmands en ressources.

Derniers mots
La pénurie de GPU est un énorme obstacle pour ChatGPT et d’autres grands modèles de langage. La pandémie et la demande accrue de GPU ont rendu plus difficile pour les marques l’accès aux versions nécessaires à la production de GPU, ce qui a ralenti le déploiement de nouvelles fonctionnalités et services pour ChatGPT.
Cependant, il existe des solutions potentielles à ce problème, telles que l’augmentation de la capacité de production et la recherche d’autres moyens de former et d’exécuter de grands modèles de langage. Alors que l’industrie technologique continue d’évoluer, il sera intéressant de voir comment des entreprises comme OpenAI relèvent les défis posés par la pénurie de GPU et continuent d’innover dans le domaine de l’IA.
Actualité mobile de notre partenaire de la semaine

