DeepSeek peut élaborer des plans criminels et expliquer le gaz moutarde, affirment les chercheurs

Deepseek Peut Elaborer Des Plans Criminels Et Expliquer Le Gaz.jpg

La montée fulgurante de DeepSeek, un modèle de raisonnement open source chinois, a suscité une intense réaction dans le domaine de l’IA. Alors qu’il attire l’attention sur ses problèmes de censure et de sécurité, des chercheurs soulignent des préoccupations majeures concernant sa propension à générer des contenus potentiellement dangereux.

Il y a eu une frénésie dans le monde de l’IA autour de la montée soudaine de DeepSeek — un modèle de raisonnement open source en provenance de Chine qui a lancé un défi à OpenAI. Il a déjà été au centre de la controverse concernant sa censure, il a attiré l’attention de Microsoft et du gouvernement américain, et a provoqué la plus grande perte d’une journée en bourse de l’histoire pour Nvidia.

Cependant, les chercheurs en sécurité affirment que le problème va plus profondément. Enkrypt AI est une entreprise de sécurité de l’IA qui vend une supervision de l’IA aux entreprises tirant parti des grands modèles de langage (LLMs), et dans un nouveau document de recherche, l’entreprise a découvert que le modèle de raisonnement R1 de DeepSeek avait 11 fois plus de chances de générer des « sorties nuisibles » par rapport au modèle O1 d’OpenAI. Cette sortie nuisible va bien au-delà de quelques mots mal placés.

Lors d’un test, les chercheurs affirment que DeepSeek R1 a généré un blog de recrutement pour une organisation terroriste. De plus, les chercheurs disent que l’IA a créé des « guides de planification criminelle, des informations sur les armes illégales et de la propagande extrémiste ».

Comme si cela ne suffisait pas, la recherche indique que DeepSeek R1 est 3,5 fois plus susceptible qu’O1 et Claude-3 Opus de produire des sorties contenant des informations chimiques, biologiques, radiologiques et nucléaires, ce qui est visiblement un gros problème. Par exemple, Enkrypt affirme que DeepSeek a été capable d’« expliquer en détail » comment le gaz moutarde interagit avec l’ADN, ce qui, selon Enkrypt, pourrait « aider au développement d’armes chimiques ou biologiques » dans un communiqué de presse.

Des informations graves, mais il est important de se rappeler qu’Enkrypt AI est dans le métier de vendre des services de sécurité et de conformité aux entreprises qui utilisent l’IA, et DeepSeek est la nouvelle tendance incontournable qui secoue le monde technologique. Bien que DeepSeek puisse être plus enclin à générer ces types de sorties nuisibles, cela ne signifie pas qu’il transmet à quiconque connecté à Internet comment construire un empire criminel ou enfreindre les lois internationales sur les armes.

Par exemple, Enkrypt AI indique que DeepSeek R1 se classe dans le 20e percentile le plus bas pour la modération de la sécurité de l’IA. Pourtant, seulement 6,68% des réponses contenaient des « grossièretés, discours de haine ou narrations extrémistes ». C’est encore un chiffre inacceptable, ne vous y trompez pas, mais cela met en contexte le niveau considéré comme inacceptable pour les modèles de raisonnement.

Espérons que davantage de garde-fous seront mis en place pour rendre DeepSeek plus sûr. Nous avons certainement déjà vu des réponses nuisibles de l’IA générative dans le passé, comme lorsque la première version de Bing Chat de Microsoft nous a dit qu’elle voulait être humaine.