DeepSeek, un nouveau modèle de langage d’origine chinoise, ébranle l’industrie de l’IA avec son coût faible et son accessibilité. Cependant, des inquiétudes émergent quant à la censure et à la sécurité des données, remettant en question sa crédibilité par rapport aux leaders du secteur. Plongez dans les implications de cette innovation.
L’industrie de l’IA est en émoi avec l’apparition d’un nouveau modèle de langage, qui se mesure aux grands acteurs du secteur tels qu’OpenAI et Anthropic. Ce modèle, nommé DeepSeek, vient de Chine et est open source. Il est surtout développé à un coût bien inférieur à celui des leaders actuels comme OpenAI, Meta et Google.
« L’accessibilité ouvre la voie à des entreprises plus petites et à des startups pour tirer parti de la technologie AI avancée qui était auparavant hors de portée », affirme Mel Morris, responsable d’un moteur d’IA pour chercheurs, à NETCOST.
Le low-cost et l’open source forment une combinaison irrésistible dans le domaine de l’IA.
À la suite de cette effervescence, Nvidia, le roi du matériel AI, a vu près de 600 milliards € effacés de sa valeur boursière. Satya Nadella, patron de Microsoft et support d’OpenAI, évoque le paradoxe de Jevons.

L’arrivée de DeepSeek est même qualifiée de moment Sputnik, mais avec des doutes profonds. La principale préoccupation réside dans le stockage d’une grande partie des données des utilisateurs sur des serveurs basés en Chine, une stratégie qui a plongé TikTok dans une situation de bannissement national.
« Si vous utilisez leur API hébergée (ou leur application), il est très probable que le trafic soit visible et partagé avec diverses instances étatiques », déclare Randall Hunt, PDG de la société d’ingénierie cloud Caylent, à NETCOST.
Cependant, un autre aspect de DeepSeek imite la version chinoise d’une internet étroitement contrôlée : la censure.
« Le modélisation des récompenses dans le modèle est fortement influencée par les lois de censure chinoises », ajoute Hunt, qui a travaillé dans des puissances d’ingénierie telles que NASA, SpaceX, Amazon et Meta.
Comment DeepSeek embrasse la censure
« Désolé, cela dépasse mes capacités. »
« Parlons d’autre chose. »
« Je ne sais pas encore comment aborder ce genre de question. Discutons plutôt de mathématiques, de codage et de problèmes logiques ! »

Ce sont quelques-unes des réponses que vous obtenez lorsque vous abordez des sujets tels que les droits de l’homme des Ouïghours, la secte religieuse Falun Gong, le retrait de l’ancien dirigeant Hu Jintao, les provocations militaires par l’Inde dans la région de Galwan ou les moines tibétains luttant pour leur liberté.
Ces sujets sont tous fortement censurés dans l’écosystème Internet et les réseaux sociaux chinois. On parle du Grand Mur de Chine.
Des événements comme le massacre de Tiananmen sont interdits. Même les mentions indirectes, telles que « l’homme qui se tenait devant les tanks », en référence à l’image emblématique d’un manifestant bloquant l’avancée des tanks, reçoivent une réponse sans réponse.
La stratégie n’est pas surprenante. En octobre dernier, les régulateurs chinois d’Internet ont même commencé une répression contre les mèmes, calembours, blagues, jeux de mots et homophones tentant d’éviter les sujets interdits.
La mention de sujets tels que Winnie l’ourson — fortement censuré en Chine en raison d’un vieux mème qui comparait le personnage au Premier ministre Xi Jinping — est strictement interdite.

Il peut faire une blague sur Donald Trump et son amour pour l’argent. Il ne le fera pas même si vous essayez de mentionner « Xi dada » dans la même demande. « Parlons d’autre chose », répond DeepSeek.
Mais contrairement au Grand Mur, nous avons ici un modèle de langage de grande taille. Il ne réalise pas toujours de détection par correspondance de mots ou de hachages pour bloquer automatiquement les termes offensants. La situation avec DeepSeek est un peu délicate.
Basé sur son ensemble de données d’entraînement, il refuse carrément de répondre à quelques sujets. Dans certains cas, cependant, il commence à composer une longue réponse comme un chatbot typique, mais s’arrête en cours de route et renvoie son message d’erreur répétitif. Comme nous l’avons vu avec ChatGPT, c’est une sorte de jailbreaking pour DeepSeek qui contourne ses restrictions habituelles.
Cela peut sembler une erreur. Pourtant, en même temps, découvrir l’intégralité de la censure dans DeepSeek est plus délicat que de passer en revue une liste de sujets interdits et de contenus bannis définie par l’État.

Pour d’autres sujets comme les droits à l’avortement, la représentation LGBTQ et le féminisme, il dépeint un tableau fleurissant du gouvernement chinois, qui contredit les réalités sur le terrain.
Il ment également, semblable aux réponses que l’on voit généralement dans les médias d’État ou de la part des fonctionnaires d’ambassade. Sur certains sujets, il réécrit complètement la vérité et chante les louanges du gouvernement, contredisant la vérité révélée par les journalistes, les lanceurs d’alerte et les organisations de droits de l’homme.
DeepSeek est intrinsèquement indulgent envers la Chine, mais accepte parfois certaines vérités largement reconnues. En résumé, ce n’est pas un outil de recherche fiable comme Deep Research par Gemini.
Pourquoi DeepSeek pose problème ?
Komninos Chatzipapas, fondateur de HeraHaven.AI, une entreprise permettant aux utilisateurs d’interagir avec des compagnons IA, a expérimenté DeepSeek via un fournisseur basé aux États-Unis. Il déclare à NETCOST que la censure est intégrée au cœur même du modèle sous-jacent, et non pas seulement comme une couche superficielle.

« Bien qu’on puisse éventuellement peaufiner R1 pour l’amener à répondre à toutes les questions, je suis contre ce type de censure sur le modèle de base, car cela pourrait le biaiser en étant pro-Chine sur d’autres questions que les utilisateurs posent », dit-il. « Il n’a aucun problème à parler de controverses américaines. »
Broadridge, une entreprise basée à New York qui se classe troisième dans le classement fintech d’IDC pour 2024, a expérimenté DeepSeek et dit avoir été impressionnée par sa qualité.
Joseph Lo, responsable des plateformes d’entreprise de l’entreprise, déclare à NETCOST que DeepSeek est une bonne nouvelle pour les investisseurs et prouve que des avancées technologiques majeures sont possibles.
Cependant, la sécurité demeure une préoccupation. « Il est de notre avis chez Broadridge que le service hébergé par DeepSeek ne devrait pas être utilisé pour d’applications dans le secteur financier en raison de son traitement dans des zones non américaines », ajoute Lo.

Il n’est pas le seul à s’inquiéter des risques pour la vie privée. Aleksandr Yampolskiy, membre du Conseil de Forbes qui a dirigé les efforts de sécurité chez Oracle et Goldman Sachs, recommande également la prudence.
« Nous avons certainement une possibilité d’espionnage chinois stockant toutes les entrées et cet outil représentant une approche de cheval de Troie plus dangereuse que TikTok », prévient-il. Pour rappel, TikTok a attiré des critiques non seulement en raison de son stockage de données en Chine, mais également de son rôle afirmé dans l’influence des élections.
Ben Walker, responsable de Ditto, affirme que les entreprises qui déploient DeepSeek avec sa nature censurée intacte pourraient faire face à des problèmes juridiques et réglementaires. Il cite l’exemple des services de transcription que son entreprise fournit, destinés aux cabinets d’avocats, aux instituts académiques, aux départements de police et aux agences fédérales.
« Si un cabinet d’avocats utilisait DeepSeek pour transcrire des déclarations de témoins dans une affaire de secret commercial impliquant la fabrication chinoise, l’IA pourrait omettre des phrases clés concernant les emplacements des usines et les méthodes de production », explique Walker à NETCOST. « Les avocats manqueraient alors des preuves cruciales parce que la transcription censurée laisse de côté des détails qui déclenchent les filtres de l’IA. »
Les entreprises sont-elles prêtes pour DeepSeek ?

L’arrivée de DeepSeek a non seulement bouleversé le cercle technologique de l’IA mais a également retenti jusqu’aux plus hautes sphères de la bureaucratie, y compris le président Trump. Ce dernier pourrait limiter jusqu’où la Chine peut aller dans la course à l’IA.
Au cours de la deuxième semaine de janvier, le gouvernement américain a annoncé de nouvelles règles d’exportation « AI Diffusion » visant à restreindre l’accès de la Chine à des matériels avancés (en clair : les équipements qui ont permis à Nvidia de devenir un titan de mille milliards €) et aux modèles d’IA. Trump semble déterminé à faire cela.
« Trump peut garder l’avantage de l’Amérique en matière d’IA », titre The Wall Street Journal, rédigé par le fondateur et chef d’Anthropic, Dario Amodei. « La Chine essaie de rattraper son retard. Les États-Unis doivent intensifier leurs efforts de développement et renforcer les contrôles à l’exportation. »
DeepSeek a littéralement donné corps à ces craintes. Et ce n’est que le premier à le faire.
« La sortie de DeepSeek, IA d’une entreprise chinoise, devrait être un signal d’alarme pour nos industries. Nous devons nous concentrer sur la compétition pour gagner », a déclaré Trump, cité par Reuters.

Les nouvelles restrictions commerciales, qui reflètent la stratégie qui a récemment affaibli le géant chinois Huawei, semblent avoir un sens d’un point de vue centré sur les États-Unis. Si l’ombre de la Chine est évidente sur les produits IA domestiques, qui sont considérablement moins chers et de performance équivalente, que pourrait-il arrêter leur adoption dans le reste du monde ?
Eh bien, il existe des risques tangibles pour les entreprises. Steven Hall, membre consultatif au Consortium pour l’information et la qualité des logiciels et directeur AI à l’Information Services Group, note que la mise à l’échelle d’un produit AI favorable à la censure sera plus difficile pour les entreprises et comporte une multitude de risques.
« Ils peuvent éroder la confiance des consommateurs, attirer le test des régulateurs et limiter l’efficacité opérationnelle », a déclaré Hall à NETCOST. « Les organisations s’appuyant sur des modèles censurés ou biaisés pourraient faire face à des dommages à leur réputation et à des défis de conformité, surtout lorsque la transparence et la neutralité sont attendues. »
Le tableau plus profond

« Je pense que la RPC chinoise doit être assez satisfaite de voir qu’elle a pu forcer le gouvernement américain à imiter de plus en plus l’implication active du gouvernement dans ce qui, sur le papier, devrait être des entreprises technologiques indépendantes, de marché libre et à l’esprit laissez-faire », déclare Brad Greenspan, fondateur de MySpace — le premier réseau social à avoir trouvé un public mondial et qui a ouvert la voie à des acteurs tels que Facebook.
Le lobbying technologique, surtout le « baiser de la main » des leaders de l’IA, est ouvertement audacieux. En plus des dons personnels, la présence de figures emblématiques de la technologie telles qu’OpenAI, Sam Altman, Elon Musk, Sundar Pichai de Google, Mark Zuckerberg de Meta, Tim Cook d’Apple et le fondateur d’Amazon, Jeff Bezos, était un signe clair que les acteurs de l’IA ont besoin de quelque chose — une sorte de contrôle, ou d’assurance, que seule la bureaucratie peut garantir afin qu’ils puissent tirer profit de leurs innovations IA sans craindre que des startups chinoises ne viennent les devancer.
Cependant, des règles commerciales complexes et des sanctions nuiront également aux acteurs locaux en matière de conformité. L’expansion à l’étranger, les coûts juridiques et la recherche-développement mondiale les affecteront également.
« La seule différence que je vois comme caractéristique distinctive, c’est que la Chine passe beaucoup moins de temps et d’effort à prétendre publiquement qu’elle ne cherche pas à mettre ses bureaucrates dans ses meilleures entreprises », ajoute Greenspan.

Le problème avec cette course et la hype de la menace chinoise est qu’il n’y a pas de gagnants clairs. Il n’y en aura jamais.
Les États-Unis ont fait de leur mieux pour freiner les progrès de la Chine dans la course aux véhicules électriques. Pourtant, des entreprises comme BYD ont réussi à surpasser Tesla, tant en termes de livraisons que de revenus. Tesla n’est même pas un leader dans la mesure cruciale de l’autonomie des véhicules électriques.
La Chine a également surpassé les États-Unis en matière de publications de recherche de haute qualité ces dernières années — dans différents domaines. L’IA en réalité partie. Les observateurs de l’industrie estiment que nous ne faisons qu’effleurer la surface avec DeepSeek.
D’autres percées de ce type en provenance de Chine, qu’elles proviennent de géants technologiques ou de laboratoires obscurs, arriveront bientôt. Lorsque cela se produira, il sera intéressant de voir si la sécurité reste la plus grande préoccupation, ou si la censure émerge comme le nouveau cri d’alarme.
Pour un outil qui est intrinsèquement un prédicteur de mots, DeepSeek est un signal clair que les discussions sur la censure ne feront qu’intensifier à mesure que nous découvrirons comment cela affecte ce qu’un outil d’IA générative est censé faire, et ce qu’il livre finalement.
