OpenAI confirme qu’ils n’ont pas assez de GPUs pour assurer un service complet à ChatGPT-4.5

OpenAI confirme qu'elle n'a pas assez de GPU pour fournir un service complet à ChatGPT-4.5

OpenAI fait face à des temps d’attente de plus en plus longs pour ChatGPT-4.5, dû à une pénurie de processeurs graphiques. Sam Altman a reconnu que la capacité de l’entreprise ne répond pas à la demande croissante, entraînant des retards et une performance irrégulière.

La pénurie de processeurs graphiques entraîne de longues attentes et un fonctionnement irrégulier du service phare d’OpenAI. Sam Altman admet que l’entreprise ne peut pas répondre à la demande croissante pour son modèle le plus avancé.

OpenAI confirme qu'elle n'a pas assez de GPU pour fournir un service complet à ChatGPT-4.5
Sam Altman, PDG d’OpenAI, a publiquement reconnu les problèmes de capacité de calcul qui affectent ChatGPT-4.5

Les utilisateurs de ChatGPT rencontrent des temps d’attente de plus en plus longs alors que l’entreprise lutte contre une grave pénurie de matériel. La situation survient au moment du déploiement de sa version 4.5, un modèle nécessitant une capacité de traitement bien supérieure à celle de ses prédécesseurs, ce qui a engorgé les centres de données de l’entreprise en quelques semaines.

« Nous n’avons pas suffisamment de capacité de calcul », a reconnu Sam Altman sur X, confirmant ce que des milliers d’utilisateurs expérimentent déjà par des réponses lentes et un fonctionnement irrégulier. Le PDG d’OpenAI a ajouté qu’ils sont « en train de travailler pour étendre notre infrastructure le plus rapidement possible », bien qu’il n’ait pas fourni de délais précis pour la résolution de ce problème.

La pénurie de puces freine l’expansion de l’IA

La situation d’OpenAI n’est pas un cas isolé. NVIDIA, le principal fabricant des GPU spécialisés utilisés par ces systèmes, maintient des listes d’attente de jusqu’à 9 mois pour ses puces H100, essentielles pour l’entraînement et l’inférence des modèles avancés. Chaque serveur pour ChatGPT-4.5 nécessite entre 4 et 8 de ces unités, coûtant environ 25 000 dollars par puce.

Cette crise d’approvisionnement affecte particulièrement ChatGPT-4.5, dont les améliorations en matière de raisonnement et de programmation exigent 60 % de puissance de calcul en plus que la version précédente. Les analyses techniques indiquent que le modèle traite jusqu’à 300 000 jetons par minute lors d’opérations complexes, saturant même l’infrastructure de Microsoft Azure réservée pour OpenAI.

La pénurie a conduit des concurrents comme Anthropic avec Claude et Google avec Gemini à gagner du terrain, ces derniers disposant d’une infrastructure propre plus consolidée ou, dans le cas de Google, de ses propres puces TPU développées en interne.

Le problème se complique avec l’annonce que ChatGPT-5 a déjà une date de sortie prévue et nécessitera encore plus de puissance de traitement. Les estimations du secteur suggèrent que le nouveau modèle aura besoin du double de puissance que son prédécesseur, ce qui remet sérieusement en question la viabilité de son déploiement dans les conditions actuelles du marché.

Impact direct sur les utilisateurs et stratégie d’entreprise

OpenAI confirme qu'elle n'a pas assez de GPU pour fournir un service complet à ChatGPT-4.5

OpenAI a mis en place un système de priorisation qui favorise clairement les abonnés payants. Les données internes révélées à Bloomberg indiquent que les utilisateurs gratuits subissent des temps d’attente jusqu’à cinq fois plus longs que ceux d’il y a trois mois, tandis que des fonctionnalités avancées, comme l’analyse de code, sont souvent restreintes pendant les heures de pointe.

Cette situation contraste avec les déclarations d’Altman concernant ChatGPT-4.5, où il promettait un accès plus démocratique à des capacités « transformantes ». Les développeurs indépendants ont exprimé leur frustration dans des forums techniques, soulignant que la limitation actuelle empêche d’utiliser le modèle pour des applications commerciales cohérentes.

Microsoft, le principal investisseur d’OpenAI, a alloué 3,5 milliards de dollars supplémentaires pour étendre les centres de données spécifiquement orientés vers l’IA générative. Cependant, des sources du secteur indiquent que même avec cet investissement, résoudre complètement le problème pourrait prendre entre 6 et 12 mois en raison des bottleneck (goulots d’étranglement) dans la chaîne d’approvisionnement des semi-conducteurs.

La crise du matériel pousse également OpenAI à repenser sa stratégie d’intégration entre GPT-4.5 et GPT-5, comme l’a confirmé un porte-parole de l’entreprise. L’option la plus probable est qu’ils priorisent l’optimisation des performances du modèle actuel avant de consacrer des ressources au développement de son successeur.

Les analystes de Morgan Stanley estiment que cette situation pourrait coûter à OpenAI entre 200 et 300 millions de dollars de revenus non réalisés durant 2024, un montant significatif pour une entreprise qui cherche encore son modèle économique définitif dans un marché de plus en plus concurrentiel.