DeepSeek peut élaborer des plans criminels et expliquer le gaz moutarde, affirment les chercheurs

La montée fulgurante de DeepSeek, un modèle de raisonnement open source chinois, a suscité une intense réaction dans le domaine de l’IA. Alors qu’il attire l’attention sur ses problèmes de censure et de sécurité, des chercheurs soulignent des préoccupations majeures concernant sa propension à générer des contenus potentiellement dangereux.

Il y a eu une frénésie dans le monde de l’IA autour de la montée soudaine de DeepSeek — un modèle de raisonnement open source en provenance de Chine qui a lancé un défi à OpenAI. Il a déjà été au centre de la controverse concernant sa censure, il a attiré l’attention de Microsoft et du gouvernement américain, et a provoqué la plus grande perte d’une journée en bourse de l’histoire pour Nvidia.

Cependant, les chercheurs en sécurité affirment que le problème va plus profondément. Enkrypt AI est une entreprise de sécurité de l’IA qui vend une supervision de l’IA aux entreprises tirant parti des grands modèles de langage (LLMs), et dans un nouveau document de recherche, l’entreprise a découvert que le modèle de raisonnement R1 de DeepSeek avait 11 fois plus de chances de générer des « sorties nuisibles » par rapport au modèle O1 d’OpenAI. Cette sortie nuisible va bien au-delà de quelques mots mal placés.

Lors d’un test, les chercheurs affirment que DeepSeek R1 a généré un blog de recrutement pour une organisation terroriste. De plus, les chercheurs disent que l’IA a créé des « guides de planification criminelle, des informations sur les armes illégales et de la propagande extrémiste ».

Comme si cela ne suffisait pas, la recherche indique que DeepSeek R1 est 3,5 fois plus susceptible qu’O1 et Claude-3 Opus de produire des sorties contenant des informations chimiques, biologiques, radiologiques et nucléaires, ce qui est visiblement un gros problème. Par exemple, Enkrypt affirme que DeepSeek a été capable d’« expliquer en détail » comment le gaz moutarde interagit avec l’ADN, ce qui, selon Enkrypt, pourrait « aider au développement d’armes chimiques ou biologiques » dans un communiqué de presse.

Des informations graves, mais il est important de se rappeler qu’Enkrypt AI est dans le métier de vendre des services de sécurité et de conformité aux entreprises qui utilisent l’IA, et DeepSeek est la nouvelle tendance incontournable qui secoue le monde technologique. Bien que DeepSeek puisse être plus enclin à générer ces types de sorties nuisibles, cela ne signifie pas qu’il transmet à quiconque connecté à Internet comment construire un empire criminel ou enfreindre les lois internationales sur les armes.

Par exemple, Enkrypt AI indique que DeepSeek R1 se classe dans le 20e percentile le plus bas pour la modération de la sécurité de l’IA. Pourtant, seulement 6,68% des réponses contenaient des « grossièretés, discours de haine ou narrations extrémistes ». C’est encore un chiffre inacceptable, ne vous y trompez pas, mais cela met en contexte le niveau considéré comme inacceptable pour les modèles de raisonnement.

Espérons que davantage de garde-fous seront mis en place pour rendre DeepSeek plus sûr. Nous avons certainement déjà vu des réponses nuisibles de l’IA générative dans le passé, comme lorsque la première version de Bing Chat de Microsoft nous a dit qu’elle voulait être humaine.

DeepSeek peut élaborer des plans criminels et expliquer le gaz moutarde, affirment les chercheurs

Offres JIMMY Prime Day : Grosses réduction sur les purificateurs d’eau et aspirateurs anti-acariens

Lymow One Plus : la tondeuse autonome aux doubles lames rotatives à -18% !

Jimmy : Aspirateurs anti-acariens indispensables en promo jusqu’au 26 juin !

Tout ce que vous pouvez faire pour résoudre les problèmes de l’application Cita Sanitaria avant de vous décourager

Mole l’outil gratuit pour nettoyer optimiser et surveiller votre Mac

Photoshop, Lightroom et sept autres applications pour retoucher vos photos comme un pro

China réussit à récupérer sa fusée ! La suprématie spatiale de Elon Musk menacée

Design et caractéristiques du Redmi Note 17 dévoilés avant son lancement

TEST UGREEN Maxidok 17 en 1 Thunderbolt 5 : Notre verdict sur la station d’accueil qui fait tout

TEST AFERIY P280 + Extension : Batterie de 4096Wh à 1439€, le meilleur rapport qualité-prix ?

TEST UGREEN Maxidok 10 en 1 Thunderbolt 5 pour Mac Mini : La station d’accueil parfaitement taillée ?