Elon Musk et son équipe de xAI réalisent un exploit sans précédent en construisant un supercluster d’IA en seulement 19 jours, défiant les attentes de l’industrie technologique. Ce projet complexe, qui aurait normalement pris des années, souligne à quel point l’ingéniosité et l’ingénierie peuvent redéfinir les standards en matière de technologie.
Elon Musk et son équipe de xAI semblent avoir réalisé l’impossible. L’entreprise a construit un supercluster de 100 000 GPU NVIDIA H200 Blackwell en seulement 19 jours. Le PDG de NVIDIA, Jensen Huang, a qualifié cet exploit de « surhumain ». Huang a partagé cette incroyable histoire lors d’une interview avec le groupe Tesla Owners Silicon Valley sur X.
Selon Huang, la construction d’un superordinateur de cette taille prendrait normalement environ quatre ans – trois ans de planification et un an pour la livraison, l’installation et la mise en route. Cependant, en moins de trois semaines, Musk et son équipe ont réussi l’ensemble du processus, depuis le concept jusqu’à la pleine fonctionnalité. Le supercluster xAI a même terminé son premier entraînement d’IA peu après avoir été activé.
Elon Musk est surhumain.
Ce qui prendrait un an à tout le monde n’a pris que 19 jours. pic.twitter.com/q51sM48lsu
– Tesla Owners Silicon Valley (@teslaownersSV) 13 octobre 2024
Huang était presque à court de mots, peinant à exprimer son admiration avant de décrire l’exploit.
« Tout d’abord, [bafouille] ce que vous avez réussi en 19 jours est incroyable … Savez-vous combien de jours représentent 19 jours ? Ce n’est que quelques semaines. Et la montagne de technologie, si vous deviez la voir, est incroyable … Ce qu’ils ont accompli est unique. Jamais auparavant ce type de superordinateur [de taille comparable] n’a été construit en si peu de temps. Normalement, il faudrait trois ans pour la planification – puis le hardware doit être expédié, et il faut un an pour tout faire fonctionner. »
Huang a exprimé son respect pour l’expertise en ingénierie de Musk, soulignant les défis d’intégration du hardware de pointe de NVIDIA.

« Le nombre de threads qui entre dans un nœud… l’arrière d’un ordinateur est rempli de threads », a noté Huang, soulignant que le réseautage du hardware NVIDIA nécessite un niveau de complexité différent de celui des centres de données traditionnels à grande échelle.
Le projet a nécessité l’installation des GPU ainsi que la construction et l’obtention des autorisations pour une toute nouvelle « usine X », équipée de systèmes de refroidissement avancés et d’une infrastructure énergétique pour assurer un fonctionnement sans faille des 200 000 GPU. La coordination entre les ingénieurs de Musk et l’équipe de NVIDIA a également été un exploit monumental, garantissant que le hardware et l’infrastructure étaient expédiés, installés et synchronisés sans faille.
Venez aider xAI à diriger des photons en tant que technicien fibre élite à Memphis ! pic.twitter.com/JJShV75May
– xAI (@xai) 15 juillet 2024
« Ce niveau d’intégration n’a jamais été réalisé auparavant, et il se peut qu’il ne le soit pas de sitôt », a remarké Huang.
Le supercluster représente un bond considérable dans l’infrastructure IA, positionnant xAI comme un concurrent de taille dans la recherche et le développement en IA. Grâce à la puissance de calcul désormais à sa disposition, les équipes de Musk pourraient considérablement accélérer des projets impliquant des réseaux de neurones avancés, l’apprentissage profond et le traitement du langage naturel.
