Dépassez la loi de Moore : la difficulté des défenses de cybersécurité que les modèles d’IA peuvent briser double tous les quatre mois environ – et cet intervalle de temps diminue.
La capacité des modèles d’IA à effectuer des tests d’intrusion de bout en bout en plusieurs étapes qui correspondent aux capacités des humains effectuant les mêmes tâches s’est considérablement améliorée ces derniers mois, selon de nouveaux critères publiés par l’AI Security Institute (AISI) du gouvernement britannique.
En novembre 2025, la difficulté des cybertâches que les meilleurs modèles pouvaient accomplir doublait tous les huit mois, selon l’AISI, un organisme de recherche du Département de la science, de l’innovation et de la technologie (DSIT).
En février de cette année, les améliorations des performances s’étaient accélérées, la difficulté des tâches que les modèles d’IA pouvaient accomplir doublant tous les 4,7 mois, et depuis lors, les derniers modèles Claude Mythos Preview et GPT-5.5 montrent des capacités encore plus grandes, a déclaré l’AISI.
Les références d’horizon temporel utilisées par l’AISI mesurent ou estiment d’abord le temps qu’il faudrait à un expert humain pour résoudre divers défis en guise d’indicateur de leur difficulté, puis estiment la tâche la plus longue (en heures de travail humain) que les modèles d’IA peuvent accomplir avec un taux de réussite de 80 %. Cela en fait une mesure de capacité autonome plutôt que de vitesse : si un humain peut terminer avec succès un ensemble de tâches de test d’intrusion en 4 heures, les tests à horizon temporel mesurent dans quelle mesure un modèle d’IA peut correspondre à cette capacité avec une fiabilité donnée.
Pour y parvenir, l’IA doit maintenir ses performances sur plusieurs étapes tout en conservant le contexte et en se remettant des échecs. Plus il y a d’étapes, plus le test d’intrusion devient difficile et plus les résultats sont significatifs.
Comme pour tous les benchmarks, il existe des mises en garde. La première est que pour comparer les performances des modèles au fil du temps, les tests ont plafonné les systèmes d’IA à 2,5 millions de jetons. Cela a un certain nombre d’effets, notamment dans ces benchmarks, en limitant la capacité des modèles d’IA à suivre ce sur quoi ils travaillaient à un stade antérieur.
Comme l’AISI l’a déclaré dans son analyse : « Ce sont des prédicteurs inexacts de la performance ; l’IA a du mal à réaliser certaines tâches que les humains effectuent rapidement et en accomplit facilement d’autres que les humains trouvent difficiles. Cependant, nous utilisons ce type de référence car elle offre une mesure de l’autonomie de l’IA à partir de laquelle nous pouvons tirer des tendances ».
Risque croissant
Cette recherche inquiète le gouvernement britannique.
« Nos tests indépendants montrent que les cybercapacités des principaux systèmes d’IA progressent beaucoup plus rapidement que prévu. Cela est important car ce n’est pas théorique : ces progrès commencent déjà à se traduire par des risques réels pour les organisations, en particulier celles dont les cyberdéfenses sont faibles », a déclaré par courrier électronique la ministre britannique de l’IA, Kanishka Narayan.
« Ces outils peuvent également aider les équipes de cybersécurité à détecter et à corriger les faiblesses plus rapidement. Le Royaume-Uni ouvre la voie en matière de tests et de compréhension de l’IA de pointe, et cette capacité ne fera que devenir plus importante à mesure que la technologie continue d’évoluer », a-t-il ajouté.
En avril, la secrétaire d’État du DSIT, Liz Kendall, et le ministre de la Sécurité, Dan Jarvis, ont publié une lettre ouverte avertissant les entreprises des risques croissants en matière de cybersécurité posés par les modèles d’IA.
Ce qui est clair, c’est que les capacités des modèles d’IA dans des scénarios réels s’améliorent rapidement et, comme en témoigne la récente évaluation AISI de Claude Mythos Preview, s’accélèrent probablement.
Toutes les évaluations récentes des capacités de l’IA à résoudre des problèmes difficiles n’ont pas donné des résultats aussi impressionnants. Lors d’un test récent de 19 modèles d’IA sur une gamme de tâches, notamment le codage, la cristallographie, la généalogie et la notation de partitions musicales, des chercheurs de Microsoft ont découvert que les modèles pouvaient être sujets aux erreurs et peu fiables, en particulier pour les tâches plus longues.
Kat Traxler, chercheuse principale en sécurité chez Vectra AI, considère les benchmarks comme un signal utile auquel les entreprises devraient prêter attention. « Les tests d’AISI ne mesurent pas si les modèles peuvent détecter une faille. Ils mesurent plutôt si divers modèles peuvent enchaîner une série d’exploits en attaques efficaces pour atteindre un objectif final, comme le font les attaquants du monde réel. En tant que signal de capacité offensive, les résultats d’AISI ont un réel poids », a-t-elle déclaré.
Cependant, elle a souligné une récente évaluation Xbow de Claude Mythos qui a révélé des performances mitigées dans certaines tâches. « La manière dont ces limitations connues du modèle limiteront réellement les campagnes offensives autonomes du monde réel est encore en cours de détermination, mais cela souligne la nécessité d’un harnais de validation sophistiqué pour véritablement voir le plafond des capacités du modèle. »
Selon Chris Lentricchia, directeur de la stratégie de sécurité du cloud et de l’IA chez Sweet Security, les entreprises devraient également considérer les avantages : les modèles d’IA aident les attaquants, mais aussi les défenseurs.
« Il ne s’agit pas simplement d’une histoire offensive. La même accélération de l’amélioration des capacités des attaquants peut également améliorer les capacités défensives dans des domaines tels que la détection proactive des menaces et l’automatisation des réponses. Les benchmarks sont mieux considérés comme des indicateurs permettant de comprendre si les défenses de l’entreprise évoluent suffisamment rapidement pour suivre le rythme de l’accélération des capacités de l’IA », a déclaré Lentricchia.



