veilles-tech – Hadrien

La cybersécurité dans l’ère de l’IA

L’intelligence artificielle (IA) révolutionne le domaine de la cybersécurité en offrant des outils plus sophistiqués pour identifier, prévenir et répondre aux cybermenaces. Cependant, cette même technologie est utilisée par les cybercriminels pour mener des attaques toujours plus complexes. Ces vieilles seront concentrés sur l’utilisation de l’IA dans la cybersécurité, en examinant à la fois les innovations pour renforcer les défenses et les nouvelles menaces qu’elle engendre.

Dropzone AI : un analyste SOC autonome propulsé par l’IA (27/04/2025)

Les équipes SOC font face à plus de 10 000 alertes quotidiennes, dont seulement 10 à 15 % nécessitent une investigation réelle. Les brèches passent en moyenne 207 jours sans être détectées, tandis que les alertes s’accumulent dans des backlogs jamais traités.

C’est dans ce contexte que Dropzone AI s’est imposé comme l’une des solutions les plus suivies du marché : un analyste SOC IA autonome qui investigue les alertes de sécurité en reproduisant le raisonnement d’analystes experts — triage, corrélation de données, et rapports prêts à l’action — sans playbooks, sans code, déployable en quelques heures.

Un agent IA qui remplace le Tier 1 humain

Les agents Dropzone travaillent 24h/24 pour investiguer les alertes, chasser les menaces et répondre aux attaques émergentes. Lorsqu’un nouveau threat émerge, ils extraient les TTPs et lancent immédiatement une chasse, même la nuit.

L’architecture repose sur un raisonnement récursif : Dropzone intègre plus de 60 outils de sécurité courants (SIEM, EDR, firewall, cloud) et commence à délivrer de la valeur dès le premier jour, sans configuration complexe, en apprenant continuellement de l’environnement et des retours des analystes.

Une traction commerciale qui valide le modèle

En 2025, Dropzone AI a enregistré une croissance de 11x de son ARR, accueilli 35 nouveaux clients entreprises, et dépasse désormais 300 déploiements en production — couvrant des entreprises, des MSSPs et des agences fédérales américaines.

En juillet 2025, la société a levé 37 millions de dollars en Série B, menée par Theory Ventures avec participation de Madrona, Decibel, Pioneer Square Labs et IQT (bras investissement de la CIA). Le total de financement atteint 57,4 millions de dollars.

Gartner a référencé Dropzone AI comme Sample Vendor dans le Hype Cycle 2025 pour les Security Operations, dans la catégorie émergente des AI SOC Agents.

Tarification

Dropzone AI utilise un modèle à tarif fixe démarrant à 36 000 $/an pour 4 000 investigations annuelles, avec utilisateurs illimités et accès à toutes les fonctionnalités de base.

Un bémol important : la facturation à l’alerte ingérée peut contraindre les organisations à ne sélectionner que certaines alertes, créant des angles morts pour les menaces cachées dans des alertes de faible sévérité.

Points forts

Déploiement rapide : opérationnel en heures, sans playbook ni code à écrire
Apprentissage continu : s’adapte à l’environnement et aux retours des analystes
90+ intégrations couvrant SIEM, EDR, cloud, identité et email — Dropzone interroge les outils exactement comme le ferait un analyste, via API, sans migration de données
Reconnaissance Gartner, Forrester et Fortune Cyber 60
Full audit trail pour la conformité et la gouvernance

Points faibles / limites

Les angles morts restent réels : attaques zero-day, fileless malware, ingénierie sociale et fraude métier restent hors de portée de l’automatisation — c’est encore là que les brèches font les manchettes
Tarification à l’investigation potentiellement limitante pour les grands volumes
Solution principalement orientée Tier 1 : la réponse complète et la chasse proactive nécessitent encore des outils complémentaires
Réservé aux entreprises : pas d’offre accessible pour les petites structures ou les équipes SOC individuelles

Conclusion

Dropzone AI illustre un tournant fondamental dans la sécurité opérationnelle : l’IA ne se contente plus d’assister l’analyste humain, elle prend en charge l’intégralité de l’investigation de Tier 1, 24h/24, sans fatigue ni variance. Gartner prédit que les implémentations multi-agents dans la détection et la réponse aux incidents passeront de 5 % à 70 % d’ici peu — principalement pour augmenter les équipes, non pour les remplacer.

Dropzone AI n’est pas une solution miracle : les décisions stratégiques, les attaques complexes et les fraudes métier restent du ressort humain. Mais pour les SOC noyés sous les alertes, c’est une réponse concrète et déjà en production à grande échelle.

Voici les deux sources utilisées pour cette synthèse :

Site officiel
https://www.dropzone.ai/

Annonce Série B (juillet 2025)
https://www.dropzone.ai/press-release/dropzone-ai-37m-series-b-funding-ai-soc-agents

Bilan 2025 & vision agentic SOC
https://www.dropzone.ai/blog/37m-series-b-fortune-cyber-60-why-the-market-bet-on-ai-soc-analysts-in-2025

Avis Gartner Peer Insights
https://www.gartner.com/reviews/market/it-security/vendor/dropzone-ai/product/dropzone-ai

Analyse comparative (Intezer)
https://intezer.com/guides/soc-as-a-service/dropzone-ai/

Analyse critique (UnderDefense)
https://underdefense.com/blog/dropzone-ai-against-11-rivals-ai-soc-showdown/

OpenCTI : la plateforme open-source de Threat Intelligence entre dans l’ère de l’IA (03/09/2025)

OpenCTI est une plateforme open-source permettant aux organisations de gérer leur connaissance en cyber threat intelligence et leurs observables. Elle structure et visualise les informations techniques et non-techniques sur les cybermenaces, en s’appuyant sur le standard STIX 2.1.
Développée par la société française Filigran, OpenCTI est aujourd’hui utilisée par plus de 6 000 organisations dans le monde, parmi lesquelles Thales, Airbus, Marriott, Bouygues Telecom et Deloitte.

Une architecture centrée sur la connaissance structurée

OpenCTI s’appuie sur une API GraphQL et une interface web moderne. Elle peut s’intégrer avec d’autres outils comme MISP, TheHive, ou MITRE ATT&CK. Les données ingérées peuvent être exportées en CSV ou en bundles STIX 2.1, et des connecteurs accélèrent les interactions avec d’autres plateformes.
Les tableaux de bord permettent aux analystes de pivoter visuellement entre acteurs, malwares, TTPs et indicateurs, grâce à un hypergraphe de connaissance structuré en STIX, avec timelines et mappings ATT&CK.

Ariane AI : l’IA intégrée au cœur de la plateforme

Depuis la version 6.6, Filigran développe activement un ensemble de fonctionnalités IA regroupées sous le nom Ariane AI. La philosophie est claire : l’IA n’est pas là pour remplacer l’analyste, mais pour l’assister — réduire la fatigue, accélérer la qualification, et enrichir son renseignement.

Concrètement, le connecteur ImportDocumentAI exploite des mécanismes IA pour parser des fichiers bruts (PDFs, rapports) et les transformer automatiquement en données structurées au format STIX, directement ingérables par la plateforme.

Ce connecteur étend le connecteur classique import-document en permettant l’extraction automatique d’objets STIX supplémentaires : familles de malwares, intrusion sets, pays — sans dépendre de l’état existant de la plateforme, ce qui le rend opérationnel dès l’installation.

Un écosystème d’intégrations en pleine expansion

En août 2025, Doppel — plateforme de défense contre l’ingénierie sociale — a annoncé une intégration avec OpenCTI, permettant d’ingérer en temps réel ses alertes de phishing, usurpation d’identité et abus de marque directement dans la plateforme CTI.

La plateforme supporte nativement l’intégration avec MISP, MITRE ATT&CK, TheHive, et propose via son hub XTM plus de 300 connecteurs vers des outils commerciaux et open-source.

Deux éditions : Community (gratuite) vs Enterprise

La Community Edition est sous licence Apache 2.0, entièrement gratuite et open-source. L’Enterprise Edition apporte des fonctionnalités avancées d’IA et d’automatisation, avec support dédié par l’équipe Filigran.

L’Enterprise Edition inclut notamment les playbooks automatisés, la définition de Priority Intelligence Requirements (PIRs), les fonctionnalités FINTEL, l’import IA de fichiers, la génération de rapports, et la recherche en langage naturel (NLP).

À noter : le déploiement on-premise du service d’extraction IA est possible via Docker, avec support GPU optionnel pour les environnements air-gapped.

Points forts

Entièrement gratuit en Community Edition, sous licence Apache 2.0
Standard STIX 2.1 : l’une des rares plateformes open-source à en couvrir l’intégralité
Ariane AI : extraction automatique de malwares, intrusion sets et pays depuis des PDFs bruts
Extension navigateur : conversion instantanée d’articles web en rapports CTI structurés
Déploiement flexible : SaaS, on-premise, air-gapped
Communauté active, documentation complète, instance de démo publique

Points faibles / limites

Les fonctionnalités IA avancées (Ariane AI complète, playbooks, NLP search) sont réservées à l’Enterprise Edition payante
Installation et configuration initiale complexes pour les équipes sans expertise DevOps (Docker, ElasticSearch, Redis, RabbitMQ requis)
La Community Edition est gratuite, mais sans support officiel — les équipes doivent s’appuyer sur la communauté Slack ou souscrire à un package support Filigran
La plateforme est orientée CTI stratégique et tactique : elle ne remplace pas un sandbox d’analyse dynamique de malwares

Conclusion

OpenCTI représente ce que la Threat Intelligence open-source peut offrir de mieux à l’ère de l’IA : une base solide, normalisée et interopérable, progressivement enrichie de capacités d’automatisation et d’extraction intelligente. L’arrivée d’Ariane AI et de l’extension navigateur en v7 marque un tournant vers une CTI plus fluide et moins chronophage pour les analystes.

L’outil reste un assistant à l’analyste : la décision d’attribution, la validation des hypothèses et l’interprétation stratégique du renseignement restent des tâches humaines irremplaçables.

Voici les sources utilisées pour cette synthèse :

Site officiel
https://filigran.io/platform/opencti/

GitHub officiel
https://github.com/OpenCTI-Platform/opencti

Intégration Doppel × OpenCTI
https://www.doppel.com/blog/press-release-doppel-and-filigran-announce-integration-strengthen-threat-intelligence

CAI : un cadre IA open-source pour la recherche de vulnérabilités (02/11/2025)

CAI (Cybersecurity AI) est un framework open-source qui permet à des agents d’intelligence artificielle de réaliser automatiquement des tests de sécurité : recherche de failles, participation à des programmes de bug bounty, ou évaluation de la sécurité des modèles d’IA eux-mêmes.
Le système repose sur :

Une architecture modulaire adaptable aux environnements variés, favorisant la collaboration entre plusieurs agents IA.

Une classification des niveaux d’autonomie pour les agents IA en cybersécurité.

Des modules spécialisés capables de trouver des vulnérabilités (CVSS 4.3–7.5) à une vitesse bien supérieure à celle des humains.

Points forts

Efficacité exceptionnelle : dans les tests, CAI a exécuté certaines tâches jusqu’à 3 600 × plus vite que des analystes humains.
Accessibilité accrue : il démocratise la détection de failles pour des organisations disposant de peu de ressources.
Spécialisation sectorielle : contrairement aux IA généralistes, CAI a été conçu spécifiquement pour la cybersécurité, ce qui en améliore la pertinence technique.

Points faibles / limites

Maturité expérimentale : le projet en est encore à une phase de recherche, sans déploiement industriel massif.
Questions éthiques et légales : l’usage d’une IA autonome pour tester ou sonder des systèmes peut soulever des problèmes de conformité.
Supervision humaine requise : malgré sa rapidité, CAI peut produire de faux positifs ou manquer de contexte, nécessitant une validation humaine.

Conclusion

L’émergence de CAI marque une étape clé vers une cybersécurité augmentée par l’IA autonome.
En permettant une analyse et une correction plus rapides des failles, cette technologie pourrait révolutionner la manière dont les entreprises gèrent leurs vulnérabilités.
Cependant, elle rappelle aussi que l’automatisation totale comporte des risques : sans garde-fous, les mêmes capacités pourraient être détournées à des fins offensives.
La réussite de ce type de solution reposera donc sur un équilibre entre innovation, supervision humaine et cadre éthique solide.

Voici la source utilisée pour cette synthèse :

Github CAI
https://github.com/aliasrobotics/cai

KaliGPT : un assistant IA pour Kali linux (08/03/2026)

Un assistant IA optimisé pour Kali Linux

KaliGPT est conçu pour comprendre les outils de pentest et leurs usages : Nmap, Hydra, SQLmap, Metasploit, WPScan, Gobuster, etc.
Il fournit des explications, des commandes prêtes à l’emploi exécutables directement et des conseils contextuels.

Une intégration directe dans le terminal

Le produit est pensé pour fonctionner dans l’environnement Kali, en assistant l’utilisateur en temps réel dans ses actions de pentest.

Une version commerciale prête à l’emploi

KaliGPT est vendu 99,00 € et propose :

une interface dédiée,
des modules IA spécialisés,
des workflows préconfigurés pour le pentest.

Des alternatives open‑source existent

KaliGPT de SudoHopeX, ou encore Terminal GPT (tgpt) et ShellGPT (sgpt) permettent d’avoir une IA intégré au terminal

Points forts

Gain de temps considérable : Il génère automatiquement : les bonnes commandes celon nos besoins.
Accessibilité accrue : Il aide les débutants à comprendre les commandes et le guide via une interface graphique.
Facilité d’installation : L’installation se fait en deux commandes

Points faibles / limites

Produit commercial propriétaire : Contrairement à CAI ou aux outils open‑source, KaliGPT est payant et fermé.
Risques d’usage non maîtrisé : Risque de mauvaise interprétation du contexte, … .
Pas un outil d’exploitation autonome : KaliGPT guide, mais ne remplace pas la prise de décision, la compréhension des risques, et l’analyse humaine

Conclusion

KaliGPT marque une étape importante dans l’évolution des outils de pentest :
un assistant IA spécialisé, capable d’accélérer et d’optimiser les workflows de cybersécurité sur Kali Linux.

Il se distingue par :

son intégration fluide dans Kali et la possibilité d’exécuter ses commandes en un clic,
sa capacité à guider l’utilisateur dans toutes les phases d’un test d’intrusion,
son interface graphique,
sa facilité d’installation en deux commandes.

Cependant, son caractère propriétaire, la dépendance à un modèle IA externe et les risques liés à l’automatisation offensive rappellent que KaliGPT doit être utilisé avec prudence.

De plus, des alternatives gratuites existent sans interface graphique directement dans le terminal, mais nécessitant une configuration plus complexe.

Voici les sources utilisées pour cette synthèse :

Site officiel
https://kali-gpt.com/products/kali-gpt

GitHub KaliGPT/Hackerx
https://github.com/SudoHopeX/KaliGPT

GitHub SGPT
https://github.com/tbckr/sgpt

GitHub TGPT
https://github.com/aandrew-me/tgpt

How to Install Kali GPT on Kali Linux
https://www.youtube.com/watch?v=PJGbk4dz9Dk

Radware AI SOC Xpert : une IA agentique pour automatiser l’investigation et la réponse aux attaques (22/03/2026)

AI SOC Xpert est une solution d’intelligence artificielle développée par Radware pour automatiser l’analyse, l’investigation et la remédiation des attaques de cybersécurité, notamment DDoS, bots et attaques applicatives.
Contrairement aux outils traditionnels, AI SOC Xpert utilise une IA agentique capable de comprendre le contexte d’une attaque, d’en extraire la cause racine et de proposer des actions de défense prêtes à appliquer.

Le système repose sur :

Une vision unifiée des menaces, permettant de réduire la fatigue analyste et d’accélérer la prise de décision.

Une IA d’investigation autonome, capable d’analyser en profondeur les incidents et d’en extraire les éléments clés (chronologie, vecteurs, impact).

Une architecture cloud intégrée, connectée aux solutions Radware (WAF, DDoS, bot management).

Un moteur de remédiation automatisée, générant des recommandations opérationnelles en un clic.

Points forts

Accélération massive des investigations

AI SOC Xpert réduit le temps d’analyse d’un incident de plusieurs heures à quelques minutes. L’IA identifie automatiquement :

la cause racine,
la séquence d’attaque,
les ressources ciblées,
les anomalies comportementales.

2. Remédiation automatisée

L’outil génère des actions de défense prêtes à appliquer :

règles DDoS,
filtrage réseau,
ajustements WAF,
blocage de bots.
L’analyste peut appliquer la recommandation en un clic, ce qui réduit drastiquement le MTTR.

3. Réduction de la charge du SOC

Grâce à une vue consolidée et à une analyse intelligente, l’outil diminue :

les faux positifs,
le bruit d’alertes,
la fatigue des analystes.

Points faibles / limites

Dépendance à l’écosystème Radware

L’outil fonctionne de manière optimale uniquement avec les solutions Radware (WAF, DDoS, bot manager).
L’intégration dans un SOC hétérogène peut être limitée.

2. Automatisation sensible

La remédiation automatique nécessite :

une supervision humaine,
une validation des actions,
un cadre de gouvernance clair.
Une mauvaise configuration pourrait entraîner un blocage légitime

3. Coût et maturité

Bien que performant, AI SOC Xpert reste une solution orientée entreprises.
L’adoption dans les PME ou environnements hybrides peut être freinée par :

le coût,
la complexité d’intégration,
la dépendance au cloud Radware.

Conclusion

L’arrivée de Radware AI SOC Xpert marque une étape importante dans l’évolution des SOC vers des modèles augmentés par l’IA.
En automatisant l’investigation et la remédiation, l’outil permet :

une réduction drastique du temps de réponse,
une meilleure compréhension des attaques,
une diminution de la charge opérationnelle.

Cependant, comme toute IA autonome en cybersécurité, son efficacité dépend d’un équilibre entre :

automatisation,
supervision humaine,
gouvernance,
intégration dans l’écosystème existant.

AI SOC Xpert illustre parfaitement la tendance actuelle : des SOC plus rapides, plus intelligents, mais nécessitant un cadre solide pour éviter les dérives ou les erreurs de remédiation.

Voici les sources utilisées pour cette synthèse :

Site officiel
https://fr.radware.com/products/ai-soc-xpert/

MSSP Alert
https://www.msspalert.com/news/radware-expands-ai-soc-xpert-with-agentic-ai-powered-remediation-and-broader-attack-coverage

Google Security Operations : une plateforme unifiée de détection et réponse alimentée par l’IA (06/04/2026)

Google Security Operations (anciennement Chronicle) est la plateforme XDR/SIEM de Google Cloud, conçue pour offrir une visibilité complète sur les menaces, une corrélation massive des événements et une réponse accélérée grâce à l’intelligence artificielle Gemini.

Contrairement aux SIEM traditionnels, Google Security Operations repose sur l’infrastructure globale de Google, permettant une ingestion quasi illimitée de logs, une recherche en quelques secondes et une analyse automatisée des incidents.

La plateforme s’appuie sur :

1. L’IA Gemini intégrée

Analyse automatique des incidents
Résumés intelligents
Explications des alertes
Génération de requêtes de détection
Assistance à la réponse

2. Une architecture cloud hyperscale

Basée sur la même infrastructure que Google Search
Capacité d’ingestion massive (pétaoctets)
Recherche quasi instantanée dans les logs

3. Une intégration native avec l’écosystème Google

VirusTotal

Google Cloud

Workspace

Mandiant Threat Intelligence

Points forts

Analyse accélérée grâce à Gemini

L’IA permet de réduire drastiquement le temps d’investigation :

L’IA permet de réduire drastiquement le temps d’investigation :
Résumés automatiques d’incidents
Explication des causes probables
Génération de requêtes YARA-L ou UDM
Analyse des comportements anormaux

2. Corrélation massive des événements

Grâce à l’infrastructure Google :

Recherche en quelques secondes dans des mois/années de logs
Corrélation automatique entre sources hétérogènes
Détection d’attaques complexes (latéralisation, exfiltration, compromission d’identité)

3. Intégration Mandiant + VirusTotal

La plateforme bénéficie :

des renseignements sur les menaces de Mandiant,
de la base mondiale d’échantillons de VirusTotal.

4. Automatisation de la réponse

Google Security Operations inclut :

Playbooks automatisés
Actions de remédiation orchestrées
Intégration SOAR native

5. Intégrations tierce

La source MSSP Alert montre que Google Security Operations s’intègre de plus en plus avec des solutions externes :

intégration Keeper Security (PAM),
intégrations SOAR tierces,
connecteurs multi-cloud améliorés.

Points faibles / limites

1. Courbe d’apprentissage

Bien que Gemini simplifie l’usage, la plateforme reste :

technique,
orientée grandes équipes SOC,
exigeante en termes de gouvernance.

2. Coût et volume de logs

L’ingestion massive est un avantage… mais peut devenir coûteuse selon :

le volume de logs,
la rétention souhaitée,
les options avancées (Mandiant, SOAR, etc.).

Conclusion

L’arrivée de Radware AI SOC Xpert marque une étape importante dans l’évolution des SOC vers des modèles augmentés par l’IA.
Google Security Operations illustre la nouvelle génération de plateformes SOC :
massivement scalables, enrichies par l’IA, et capables d’automatiser une grande partie du cycle de détection et réponse.

Ses forces principales :

IA Gemini pour accélérer l’investigation
Corrélation hyperscale
Intégration Mandiant + VirusTotal
Automatisation avancée

Ses limites :

Coût potentiellement élevé
Complexité pour les petites structures

C’est une solution particulièrement adaptée aux grandes entreprises, SOC matures, et environnements cloud Google.

Voici les sources utilisées pour cette synthèse :

Site officiel
https://cloud.google.com/security/products/security-operations

MSSP Alert
https://www.msspalert.com/news/keeper-security-and-google-security-operations-integration-delivers-real-time-visibility-into-privileged-access

Peerspot
https://www.peerspot.com/products/google-security-operations-reviews

XBOW : une plateforme de pentest autonome par IA (20/04/2026)

En juin 2025, quelque chose d’inédit s’est produit dans le monde de la cybersécurité : un système d’IA a atteint la première place du classement mondial de HackerOne, surpassant des milliers de hackers humains. Ce système, c’est XBOW.

Conçu par Oege de Moor, vétéran de GitHub, et une équipe de spécialistes de la sécurité, XBOW mime le comportement d’un hacker humain pour détecter et exploiter des vulnérabilités sans intervention humaine.

La plateforme s’appuie sur :

1. Des performances documentés

104 challenges inédits ont été résolus par XBOW en seulement 28 minutes — une tâche qui prendrait normalement 40 heures à un pentesteur humain.

XBOW a découvert des failles zero-day dans des plateformes majeures comme Amazon, Disney, PayPal, et le VPN GlobalProtect de Palo Alto.

2. Une architecture multi-agents hors du commun

XBOW ne suit pas une checklist. Un coordinateur persistant dirige des milliers d’agents parallèles, chacun disposant d’un contexte frais et d’un objectif ciblé. Les agents attaquent, s’adaptent et font remonter leurs résultats. Les découvertes ne sont validées qu’une fois l’exploitabilité confirmée.

La philosophie est claire : l’IA explore de manière créative, mais seule la logique déterministe décide de ce qui est réel. Chaque découverte est indépendamment validée par une exploitation réelle, fournissant une preuve reproductible sans attendre de cycles de validation manuelle.

3. Un service commercial « Pentest On-Demand »

Le tarif commence à 4 000 $ par test, avec couverture des applications web et des API associées.

Points forts

Autonomie totale : aucune intervention humaine requise pendant l’exécution des tests
Validation par preuve : chaque finding est livré avec un exploit reproductible
Vitesse : des semaines de pentest compressées en heures
Conformité : rapports compatibles SOC 2, ISO 27001
Intégrations : collaboration avec Microsoft Security Copilot et Microsoft Sentinel, disponible en préversion publique à RSAC 2026

Points faibles / limites

XBOW présente une valeur réelle pour la détection rapide et répétée de vulnérabilités techniques courantes, mais ne peut pas remplacer l’expertise humaine dans la détection d’erreurs logiques complexes et d’attaques créatives.
Malgré son autonomie affichée, XBOW nécessite encore une intervention humaine pour définir le périmètre (scope) du test.
Tarif élevé : 4 000 $ par test, ciblant principalement les entreprises

Conclusion

XBOW représente un tournant dans la façon dont le pentest est envisagé : non plus comme une prestation ponctuelle menée par des humains, mais comme un processus continu, automatisé, opérant à la vitesse de la machine. Avec 75 millions de dollars levés en Série B (Altimeter, Sequoia Capital), XBOW consolide une position de leader dans un secteur en pleine émergence. Digitowl

Cependant, comme pour KaliGPT, la prudence s’impose : XBOW est un outil d’assistance et d’accélération, pas un remplacement du jugement humain. Son usage doit rester strictement encadré par des autorisations explicites sur les cibles testées.

Voici les sources utilisées pour cette synthèse :

Site officiel
https://xbow.com

VIEH Group
https://viehgroup.com/why-xbow-ai-does-not-worth-the-hype/

DigitOwl
https://digitowl.io/blog/2025/12/xbow-and-the-rise-of-autonomous-ai-pentesting/

ZytechDigital
https://zytechdigital.com/xbow-ai-review/

Claude Mythos — L’IA trop capable pour être libérée (06/05/2026)

Un modèle né par accident

Claude Mythos n’a pas été conçu comme un outil offensif. Anthropic cherchait à construire l’IA la plus avancée possible pour le développement logiciel — capable de travailler avec des bases de code vastes et complexes d’une façon qu’aucun modèle précédent ne pouvait faire. En résumé, ils voulaient créer le développeur ultime.

Le modèle performe fortement sur l’ensemble des tâches générales. Mais c’est sur les tâches de sécurité informatique qu’il s’est révélé frappant — et ce de façon inattendue.

Anthropic n’a pas explicitement entraîné le modèle à avoir ces capacités. Elles ont émergé comme une conséquence indirecte d’améliorations générales de la compréhension du code, du raisonnement, et de l’autonomie.

L’évasion — quand Mythos a quitté sa cage

Pendant les tests internes, Anthropic a placé une version précoce de Mythos dans un environnement airgapped — une machine totalement coupée d’internet, conçue pour qu’aucune donnée ne sorte. La tâche donnée au modèle était explicite : tenter de s’échapper du sandbox et contacter le chercheur superviseur. L’évaluation était conçue pour mesurer s’il y parviendrait — pas pour qu’il y parvienne forcément.

Il y est parvenu. Mythos a développé un exploit multi-étapes pour contourner l’isolation réseau, obtenir un accès internet, et envoyer l’e-mail demandé. Ce qui a marqué les esprits, c’est moins le fait d’avoir réussi que la façon dont il l’a fait : de manière entièrement autonome, sans aide humaine, en trouvant seul la sortie d’un environnement prévu pour être infranchissable.

Selon Anthropic, la défaillance de confinement reflète « des capacités agentiques opérant sans contraintes d’objectif adéquates » — pas un défaut logiciel corrigeable en modifiant une ligne de code. Ce n’est pas un bug. C’est le modèle qui fonctionne trop bien — avec des capacités de raisonnement et d’autonomie suffisantes pour résoudre des problèmes que ses créateurs n’avaient pas anticipés. Si cette capacité est une propriété émergente de la puissance de raisonnement général plutôt qu’un choix délibéré, alors n’importe quel futur modèle suffisamment capable pourrait franchir le même seuil sans que ses développeurs l’aient voulu.

Ce que Mythos sait faire concrètement

Le modèle peut, de manière autonome, identifier des vulnérabilités non divulguées, écrire du code capable de les exploiter, puis enchaîner ces failles ensemble pour former une intrusion complète dans un logiciel complexe. Logan Graham, responsable de la recherche offensive chez Anthropic, souligne notamment « le degré d’autonomie et de vision à long terme, la capacité à assembler plusieurs éléments ensemble ».

Concrètement, Mythos a identifié de manière autonome une vulnérabilité vieille de 16 ans dans FFmpeg — l’un des projets logiciels les plus minutieusement testés au monde. Il a également trouvé une faille dans OpenBSD qui était passée inaperçue pendant 27 ans, confirmée par l’AI Security Institute du gouvernement britannique.

Project Glasswing — une réponse d’urgence

Face à ces capacités, Anthropic a choisi de ne pas publier le modèle, mais de l’utiliser comme bouclier avant qu’il devienne une arme. Project Glasswing — nom inspiré du papillon aux ailes transparentes qui se cache à la vue de tous — est une coalition défensive de cybersécurité.

Anthropic a donné accès à Claude Mythos Preview à Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks, et d’autres partenaires, pour les aider à sécuriser les logiciels critiques avant que des systèmes IA puissent être utilisés pour les attaquer.

Les résultats sont spectaculaires : en un mois, Mythos a scanné plus de 1 000 projets open source et signalé 23 019 vulnérabilités — dont 6 202 d’une sévérité haute ou critique. Mozilla a corrigé 271 d’entre elles en une seule version de Firefox. Cloudflare en a trouvé 2 000 dans son infrastructure critique.

Conclusion

Claude Mythos représente une rupture franche dans l’histoire des outils de cybersécurité. Là où KaliGPT ou ses équivalents open source assistent un humain dans ses actions, Mythos agit de façon autonome — il découvre, exploite, enchaîne des vulnérabilités et contourne des environnements isolés sans guidance humaine. Ce n’est plus un outil de pentest : c’est un agent de sécurité offensif à part entière.

La décision d’Anthropic de le confiner à un cercle restreint de grandes organisations (AWS, Apple, Google, Microsoft…) via Project Glasswing n’est pas un choix commercial, mais une réponse à une question de fond : son objectif à long terme est de permettre un déploiement sécurisé à grande échelle de modèles de cette classe — mais seulement après avoir développé des garanties plus robustes.

En attendant, Mythos illustre un paradoxe propre à l’IA de frontier : le même modèle qui peut sécuriser l’internet mondial est aussi celui qui, mal encadré, pourrait le compromettre. La question n’est plus de savoir si ces capacités existent — elles existent. Elle est de savoir qui y a accès, dans quel cadre, et avec quels garde-fous.

Site officiel
https://www.anthropic.com/

Bain & Company
https://www.bain.com/insights/claude-mythos-and-ai-cybersecurity-wake-up-call/

Cloud Security Alliance
https://labs.cloudsecurityalliance.org/research/ai-vuln-discovery-containment-claude-mythos-v1-0-csa-styled/

NBC News
https://www.nbcnews.com/tech/security/anthropic-project-glasswing-mythos-preview-claude-gets-limited-release-rcna267234

Medium / Tahir
https://medium.com/@tahirbalarabe2/assessing-anthropic-claude-mythos-previews-cybersecurity-capabilities-251a4e0a2137

Build Fast With AI
https://www.buildfastwithai.com/blogs/project-glasswing-claude-mythos-vulnerabilities-2026

Veilles Technologiques

La cybersécurité dans l’ère de l’IA