Dans un contexte d’accusations de manque de transparence, DeepSeek a récemment lancé sa « Semaine de l’Open Source », dévoilant des technologies innovantes, dont un système de fichiers performant. Les spécialistes de l’IA saluent ces avancées, promettant un impact significatif sur le paysage technologique actuel.
Que s’est-il passé ? En réponse aux organisations occidentales le qualifiant de « suspect et peu fiable », DeepSeek a lancé la « Semaine de l’Open Source ». Lors de l’événement de la semaine dernière, l’entreprise a mis à disposition plusieurs dépôts pour la communauté open source, y compris un système de fichiers hautement performant.
La semaine dernière, DeepSeek a publié cinq de ses dépôts logiciels les plus avancés lors de son événement « Semaine de l’Open Source ». La société chinoise d’IA a dévoilé un système de fichiers basé sur Linux qu’elle utilise en interne pour les charges de travail d’entraînement et d’inférence de l’IA. Le Système de Fichiers Fire-Flyer (3FS) affiche des performances impressionnantes. Les entreprises occidentales de l’IA y ont prêté attention et explorent ces dépôts. La société a conçu le 3FS pour accélérer les tâches d’IA. La technologie exploite les caractéristiques des unités de stockage à état solide modernes et des réseaux RDMA, fournissant une couche de stockage partagée pour simplifier le déploiement d’applications distribuées.
Tom’s Hardware note que le code de 3FS de DeepSeek fonctionne sans mise en cache de lecture et priorise les requêtes de lecture aléatoire, car les modèles d’IA exécutés sur des nœuds GPU accèdent constamment à des extraits de données stockées sur des serveurs. Le système de fichiers peut combiner le débit de milliers d’unités SSD et la bande passante réseau de centaines de nœuds de stockage, simplifiant le code des applications et appliquant des modèles d’API de stockage standard.
🚀 Jour 5 de #OpenSourceWeek : 3FS, propulseur pour tous les accès aux données DeepSeek
Système de Fichiers Fire-Flyer (3FS) – un système de fichiers parallèle qui utilise toute la bande passante des SSD modernes et des réseaux RDMA.
⚡ 6.6 TiB/s de débit de lecture agrégé dans un cluster de 180 nœuds
⚡ 3.66 TiB/min…– DeepSeek (@deepseek_ai) 28 février 2025
Le système de fichiers distribué peut atteindre un débit de lecture agrégé de 6.6 TiB/s lorsqu’il est utilisé dans un cluster de 180 nœuds, atteignant un débit de 3.66 TiB/min lors du benchmark GraySort (dans un cluster de 25 nœuds). La startup Perspective AI a salué les résultats de DeepSeek comme des références de « niveau supérieur », décrivant le 3FS comme une potentielle révolution pour les charges de travail lourdes en données liées à l’IA, à la recherche, et plus encore.
Dans un article publié l’été dernier, des chercheurs de DeepSeek ont décrit les caractéristiques de l’architecture personnalisée Fire-Flyer 2 de l’IA à haute performance de l’entreprise. Grâce à 3FS, HaiScale, et d’autres éléments de sa pile logicielle, DeepSeek a atteint 80 % des performances des serveurs DGX-A100 de NVIDIA pour 50 % du prix et en utilisant 40 % moins d’énergie. Fire-Flyer 2 utilisait 180 nœuds de stockage avec 16 SSD de 16 To chacun, deux NUC de 200 Gbps, et 10 000 GPU NVIDIA A100 via PCIe.
DeepSeek a créé la Semaine de l’Open Source pour souligner sa transparence et son innovation communautaire après avoir été critiqué comme étant obscur et peu fiable. L’entreprise chinoise publie de nombreux produits logiciels en tant que dépôts open source, avec des cibles clés, y compris FlashMLA, DeepEP, DeepGEMM, et plus encore.
