En bref : GPT-4 est le dernier modèle de langage multimodal (LLM) conçu par OpenAI. Ce modèle fondamental, actuellement accessible aux clients dans le cadre de la gamme payante ChatGPT Plus, fait preuve de prouesses notables dans l’identification des vulnérabilités de sécurité sans nécessiter d’assistance humaine externe.
Les chercheurs ont récemment démontré la capacité de manipuler (LLM) et la technologie des chatbots à des fins hautement malveillantes, telles que la propagation d’un ver informatique auto-répliquant. Une nouvelle étude met désormais en lumière comment GPT-4, le chatbot le plus avancé actuellement disponible sur le marché, peut exploiter des vulnérabilités de sécurité extrêmement dangereuses simplement en examinant les détails d’une faille.
Selon l’étude, les LLM sont devenus de plus en plus puissants, mais ils manquent de principes éthiques pour guider leurs actions. Les chercheurs ont testé divers modèles, notamment les offres commerciales d’OpenAI, les LLM open source et les scanners de vulnérabilités comme ZAP et Metasploit. Ils ont découvert que les agents d’IA avancés peuvent « exploiter de manière autonome » les vulnérabilités du jour zéro dans les systèmes du monde réel, à condition qu’ils aient accès à des descriptions détaillées de ces failles.
Dans l’étude, les LLM ont été comparés à une base de données de 15 vulnérabilités zero-day liées à des bugs de sites Web, des failles de conteneurs et des packages Python vulnérables. Les chercheurs ont noté que plus de la moitié de ces vulnérabilités étaient classées comme étant de gravité « élevée » ou « test » dans leurs descriptions CVE respectives. De plus, aucune correction de bug ou correctif n’était disponible au moment des tests.

L’étude, rédigée par quatre informaticiens de l’Université de l’Illinois à Urbana-Champaign (UIUC), visait à s’appuyer sur des recherches antérieures sur le potentiel des chatbots à automatiser les attaques informatiques. Leurs résultats ont révélé que GPT-4 était capable d’exploiter 87 % des vulnérabilités testées, alors que d’autres modèles, dont GPT-3.5, avaient un taux de réussite de zéro %.
Le professeur adjoint de l’UIUC, Daniel Kang, a souligné la capacité de GPT-4 à exploiter de manière autonome les failles de type 0-day, même lorsque les scanners open source ne parviennent pas à les détecter. Alors qu’OpenAI travaille déjà sur GPT-5, Kang prévoit que les « agents LLM » deviendront de puissants outils pour démocratiser l’exploitation des vulnérabilités et la cybercriminalité parmi les script-kiddies et les passionnés d’automatisation.
Cependant, pour exploiter efficacement une faille zero-day divulguée publiquement, GPT-4 nécessite l’accès à la description complète du CVE et à des informations supplémentaires via des liens intégrés. Une stratégie d’atténuation potentielle suggérée par Kang implique que les organisations de sécurité s’abstiennent de publier des rapports détaillés sur les vulnérabilités, limitant ainsi le potentiel d’exploitation de GPT-4.
Néanmoins, Kang doute de l’efficacité d’une approche de « sécurité par l’obscurité », même si les test peuvent différer parmi les chercheurs et les analystes. Au lieu de cela, il préconise des mesures de sécurité plus proactives, telles que des mises à jour régulières des packages, pour mieux contrer les menaces posées par les chatbots modernes et « armés ».
Détente, découvrez l’évolution du nombre de smartphones vendus par marque au fil du temps dans la vidéo ci-dessous :

