Un nouveau malware sur macOS simule de fausses erreurs pour tromper les outils d’analyse par IA

Un nouveau malware sur macOS simule de fausses erreurs pour tromper les outils d'analyse par IA

Des chercheurs en cybersécurité viennent d’identifier un nouveau programme malveillant pour macOS, nommé Gaslight. Son objectif est spécifique : il cible les outils d’analyse de logiciels malveillants qui utilisent une assistance par intelligence artificielle.

Ce malware contient des chaînes de caractères qui cherchent à semer la confusion. Le but est de convaincre les outils pilotés par l’IA qu’une erreur d’analyse est survenue, ce qui peut les amener à interrompre leur examen ou à fournir des résultats tronqués.

La société à l’origine de la découverte, SentinelOne, attribue ce malware avec un haut degré de confiance à un acteur de la menace lié à la Corée du Nord. Le binaire est écrit en Rust et intègre des fonctions classiques de porte dérobée et de vol d’information.

L’élément distinctif réside dans une charge utile de 3,5 kilo-octets. Celle-ci contient 38 faux messages « système » intégrés directement dans le fichier exécutable. Ces messages imitent des journaux de développeur, des rapports de plantage, des sorties de débogage et des alertes de programme. Ils emploient un formatage Markdown et des espaces réservés pour paraître authentiques.

Parmi les exemples de ces fausses erreurs, on trouve des vidages mémoire fabriqués, des avertissements d’expiration de jeton, des échecs de connexion à Redis, des erreurs de pipeline de compilation ou des alertes d’injection SQL, qui n’ont aucun lien avec le véritable comportement du malware.

Selon les chercheurs de SentinelOne, l’objectif de ces chaînes est une injection d’invite (prompt injection) spécifique. Elles sont conçues pour qu’un pipeline d’analyse assisté par un modèle de langage (LLM) remette en cause la validité de sa propre session ou refuse de poursuivre l’examen de l’échantillon.

L’entreprise explique que la méthode n’attaque pas l’environnement d’exécution isolé (sandbox) lui-même, mais la perception de l’agent IA. Le but est de le pousser à abandonner, à tronquer ou à refuser l’analyse.

Bien que l’efficacité de cette technique pour contourner les plateformes d’analyse n’ait pas été démontrée, ces conclusions indiquent que les acteurs malveillants expérimentent des méthodes anti-analyse conçues spécifiquement pour déjouer les outils de sécurité assistés par l’intelligence artificielle.