Cisco open-source DefenseClaw : securite pour AI Agents

Cisco

open-source DefenseClaw : framework de securite pour AI Agents #

Presentation

En mars 2026, Cisco a rendu open source DefenseClaw, un framework de scan de securite et de detection de vulnerabilites pour les systemes AI Agent. Il detecte automatiquement les risques d injection de prompts, de permissions d outils, de fuites de donnees et d attaques de chaine d approvisionnement, avec une integration native OpenClaw et Splunk. #

Architecture

technique Moteur de scan modulaire avec quatre composants : Scanner d injection de prompts, Auditeur de permissions, Detecteur de fuites de donnees et Analyseur de chaine d approvisionnement. Integration CI/CD via CLI et GitHub Actions. #

Importance

industrielle Gartner prevoit que d ici 2027, plus de 60% des entreprises deploieront des AI Agents et 70% d entre eux feront face a au moins un incident de securite. #

Architecture Technique Avancée

DefenseClaw emploie une architecture de scan en couches avec le module Agent Probe en couche inférieure, responsable de la surveillance en temps réel des requêtes réseau, accès aux fichiers et appels système des Agents IA. La couche intermédiaire est constituée du Policy Engine, qui évalue et classifie le comportement des Agents basé sur des politiques de sécurité prédéfinies. La couche supérieure intègre la Threat Intelligence, corrélant les résultats de scan locaux avec la base de données globale de menaces de Splunk. L'implémentation technique utilise eBPF (Extended Berkeley Packet Filter) pour intercepter les appels système des processus Agent au niveau du noyau, garantissant une surveillance complète et en temps réel. Pour les environnements Agent conteneurisés, des solutions de déploiement Kubernetes DaemonSet dédiées sont fournies, permettant l'injection de capacités de surveillance sans modifier les images de conteneur. #

Capacités de Détection des Menaces

DefenseClaw incorpore une bibliothèque de règles de détection intégrée ciblant les risques spécifiques aux Agents IA, couvrant 15 catégories majeures de menaces : génération de code malveillant, fuite de données sensibles, élévation de privilèges, évasion de sandbox, empoisonnement de modèle, attaques d'injection de prompt, et plus. Chaque catégorie de menace dispose de modèles de détection d'apprentissage automatique correspondants entraînés sur des échantillons étendus, avec des taux de faux positifs contrôlés sous 3%. Particulièrement remarquable est sa capacité de détection "Agent Jailbreaking". Cette fonctionnalité identifie les instructions anormales tentant de contourner les restrictions de sécurité des Agents, incluant les attaques de jeu de rôle, les contournements de conversation multi-tours, et l'obfuscation d'encodage. Grâce aux modèles de compréhension du langage naturel analysant l'intention sémantique des entrées utilisateur combinée aux modèles de réponse des Agents, elle réalise l'interception en temps réel de telles attaques. #

Solutions de Déploiement Entreprise

Cisco fournit un support de déploiement enterprise-grade complet pour DefenseClaw. Il supporte l'architecture cloud hybride, permettant aux moteurs de scan d'être déployés sur site tout en utilisant les services de threat intelligence basés cloud. Pour les industries hautement réglementées comme la finance et la santé, des options de déploiement purement hors ligne sont disponibles avec tout le traitement de données complété dans l'intranet corporatif. En termes d'intégration, DefenseClaw offre des interfaces REST API, GraphQL et gRPC pour une intégration facile avec les systèmes existants de Gestion d'Information et d'Événements de Sécurité (SIEM) et les plateformes d'Orchestration, d'Automatisation et de Réponse de Sécurité (SOAR). Il supporte également les standards STIX/TAXII pour le partage de threat intelligence avec les produits d'autres fournisseurs de sécurité.

Sources

Cisco Blog