Wormgpt retourne: de nouvelles variantes d’IA malveillantes construites sur Grok et Mixtral à découvert

Lucas Morel

Les cybercriminels détournent les API LLM traditionnelles comme Grok et Mixtral avec des invites jailbreaks pour relancer Wormpt comme de puissants outils de phishing et de logiciels malveillants.

Deux nouvelles variantes de Wormpt, le modèle de grande langue malveillant (LLM) de juillet 2023 qui fonctionnait sans restrictions pour générer des e-mails de phishing, des messages BEC et des scripts de malware, ont été découverts, sur les modèles mixtral de Xai et de Mistral de Mistral.

La société de sécurité des réseaux de cloud-native Cato Networks a analysé les variantes publiées sur le marché souterrain largement utilisé BreachForums entre octobre 2024 et février 2025, et les a identifiées comme nouvelles et non déclarées auparavant.

« Le 26 octobre 2024, ‘Xzin0vich’ a publié une nouvelle variante de Wormpt dans BreachForums », a déclaré un chercheur de Cato Ctrl Vitaly Simonovich dans un article de blog, ajoutant qu’une autre variante a été publiée par ‘Keanu’ le 25 février, 2025. « 

« Notre analyse montre que ces nouvelles itérations de wormpt ne sont pas des modèles sur mesure construits à partir de zéro, mais plutôt le résultat d’acteurs de menace adaptant habilement les LLM existantes », a-t-il noté. «En manipulant les invites au système et en utilisant potentiellement un réglage fin sur les données illicites, les créateurs proposent de puissants outils dirigés par l’IA pour les opérations cybercriminales sous la marque Wormgpt.»

Cato a recommandé les meilleures pratiques de sécurité pour contrer les risques posés par les modèles d’IA réutilisés, qui comprenaient le renforcement de la détection et de la réponse des menaces (TDR), de la mise en œuvre de contrôles d’accès plus forts (comme ZTNA) et de l’amélioration de la sensibilisation et de la formation à la sécurité. Au cours des dernières années, les cybercriminels ont poussé les versions modifiées des modèles d’IA sur les forums foncées, conçus pour contourner les filtres de sécurité et automatiser les escroqueries, le phishing, les logiciels malveillants et la désinformation. Outre Wormgpt, les exemples les plus connus incluent Fraudgpt, Evilgpt et Darkgpt.