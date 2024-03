Qu’est-ce qui vient de se passer? La NASA est la première agence de recherche spatiale au monde et a accès aux technologies les plus récentes et les plus performantes dont la plupart des organisations ne peuvent que rêver. Cependant, un audit mené par le Bureau de l’Inspecteur général de la NASA a révélé que les supercalculateurs obsolètes et surchargés de l’agence créent d’énormes bottleneck (goulots d’étranglement) dans les infrastructures, entraînant de graves retards dans les missions.

Dans un rapport cinglant (via The Register), l’OIG a déclaré que les technologies informatiques haut de gamme (HEC) de la NASA ont besoin d’une refonte complète si elle veut rivaliser avec les programmes de recherche spatiale d’autres pays et conserver sa position de leader. Sans changements massifs, les ressources de calcul intensif de l’agence « limiteront probablement les priorités et objectifs des missions futures ».

Décrivant les ressources HEC de l’agence comme « sursouscrites et surchargées », le rapport affirme que les directions de mission demandent plus de temps de calcul que la capacité existante ne peut en fournir, ce qui entraîne souvent des retards dans les délais.

La situation est si grave que diverses équipes de la NASA doivent utiliser une partie du budget qui leur est alloué pour acheter leurs propres ressources HEC afin de respecter les délais. À titre d’exemple, le rapport souligne que l’équipe Space Launch System investit environ 250 000 $ par an pour acheter et gérer ses propres systèmes HEC au lieu d’attendre la disponibilité des ressources HEC existantes. Selon l’OIG, presque tous les centres de la NASA utilisent leurs propres systèmes HEC, à l’exception du Goddard Space Flight Center et du Stennis Space Center.

L’audit a également souligné que la NASA ne suit pas les tendances modernes en matière de calcul intensif, en partie à cause de contraintes organisationnelles et financières. Par exemple, l’installation Advanced Supercomputing de la NASA ne dispose que de 48 GPU et de 18 000 CPU, tandis que les systèmes HEC du Center for Climate Simulation de la NASA sont encore plus gourmands en CPU. L’incapacité à moderniser les systèmes serait due à de multiples facteurs tels que « les problèmes de chaîne d’approvisionnement, les exigences en matière de langage informatique (codage) moderne et la rareté du personnel qualifié nécessaire pour mettre en œuvre les nouvelles technologies ».

En juin 2023, la NASA disposait de cinq supercalculateurs dans les installations NASA Advanced Supercomputing (NAS) à Ames, en Californie, et au NASA Center for Climate Simulation (NCCS) à Goddard, Maryland. La liste comprend Endeavour (154,8 TFLOPS), Aitken (13,12 PFLOPS), Electra (8,32 PFLOPS), Discover (8,1 PFLOPS) et Pléiades (7,09 PFLOPS).

Le rapport test la NASA pour son manque « d’une stratégie globale indiquant quand utiliser les actifs HEC sur site ou quand utiliser les options de cloud computing ». La gestion aléatoire des HEC constitue également une menace claire et présente en matière de cybersécurité, à laquelle il faut remédier le plus rapidement possible.

Pour atténuer ces défis, le BIG recommande que la NASA nomme « une direction exécutive pour déterminer la définition, la portée, la propriété, le placement organisationnel et la structure appropriés du HEC de la NASA ». Par ailleurs, le rapport indique que l’agence devrait établir « une équipe de tigres pour collaborer et élaborer des stratégies sur les questions HEC », notamment en identifiant et en comblant les lacunes technologiques tests.

L’agence est également encouragée à développer une stratégie concrète pour améliorer la priorisation et l’allocation des actifs HEC, atténuer les problèmes de cybersécurité et résoudre divers autres problèmes qui l’empêchent d’atteindre son plein potentiel.

