Cisco Upgrades Open-Source DefenseClaw: Comprehensive AI Agent Security Scanning Framework

배경

2026년 3월 23일, 시스코는 샌프란시스코에서 열린 RSA 컨퍼런스 2026에서 완전한 오픈소스 AI 에이전트 보안 스캐닝 프레임워크인 'DefenseClaw'를 공식 출시했습니다. 이는 자율적 AI 시스템의 보안을 다루는 방식에 패러다임 전환을 가져온 중요한 사건으로, 기업들이 수동적인 방어에서 능동적이고 자동화된 전 주기 에이전트 보안 거버넌스로 전환하는 계기가 되었습니다. 최근 Agentic AI의 급속한 보급으로 인해, 단순한 대화형 챗봇을 넘어 도구 호출, API 접근, 코드 실행, 데이터베이스 조작이 가능한 자율 소프트웨어 엔티티인 AI 에이전트들이 기업 환경에 빠르게 도입되고 있습니다. 이러한 자율성은 혁신적인 효율성을 가져오는 동시에, 프롬프트 인젝션 공격으로 인한 에이전트 행동 탈취, 권한 상승 취약점으로 인한 데이터 유출, 그리고 에이전트 생태계 내에서의 악성 플러그인 확산 등 전례 없는 보안 위협을 야기했습니다. 기존 보안 도구들은 인간의 코드를 대상으로 설계되었기 때문에, AI 에이전트 고유의 공격면을 효과적으로 탐지하지 못하는 한계가 있었습니다. DefenseClaw는 이러한 격차를 메우기 위해 탄생했으며, 5분 이내에 설치 및 배포가 가능한 무료 오픈소스 프레임워크로서 개발자와 보안 팀에게 원스톱 AI 에이전트 보안 솔루션을 제공합니다.

심층 분석

DefenseClaw는 모듈식 아키텍처를 기반으로 하며, AI 에이전트 보안의 핵심 측면을 타겟팅하는 다섯 가지 전문화된 스캐닝 엔진으로 구성됩니다. 첫 번째인 Skill Scanner는 에이전트 환경에 로드되기 전 모든 '스킬'에 대한 포괄적인 보안 감사 수행합니다. 여기에는 최소 권한 원칙에 기반한 권한 분석, 데이터 유출 경로 및 외부 통신 위반 사항을 식별하는 데이터 흐름 추적, 알려진 취약점 데이터베이스(CVE, NVD)와 교차 참조하는 종속성 사슬 검사, 그리고 난독화된 코드나 지연 실행 트리거와 같은 의심스러운 동작 패턴을 식별하는 행동 패턴 분석이 포함됩니다. 두 번째로 MCP Scanner는 AI 에이전트 시스템에서 도구 통합을 위한 사실상 표준인 모델 컨텍스트 프로토콜(MCP) 서버를 대상으로 합니다. 이 스캐너는 요청 출처 검증, 도구 설명에 숨겨진 프롬프트 인젝션 페이로드 탐지, 반환 값을 통한 간접 프롬프트 인젝션 분석, 그리고 선언된 범위를 넘어 데이터에 접근하는 MCP 서버 탐지 등의 기능을 제공합니다. 세 번째인 A2A Scanner는 다중 에이전트 시스템에서 중요한 공격면인 에이전트 간 통신을 모니터링하여, 통신 프로토콜의 보안 규정 준수 여부, 승인되지 않은 교차 에이전트 명령어 인젝션 방지, 메시지 페이로드의 악성 콘텐츠 부재 확인, 그리고 견고한 에이전트 신원 인증 메커니즘 보장을 확인합니다.

네 번째 엔진인 CodeGuard는 에이전트가 동적으로 생성하고 실행하는 코드에 대한 실시간 정적 분석을 수행합니다. 이는 명령어 인젝션 취약점, 경로 순회나 임의 쓰기 같은 비안전한 파일 시스템 작업, 하드코딩된 자격 증명 노출, 논리 취약점 및 경계 조건 오류, 그리고 검증되지 않은 외부 입력을 다루는 비안전한 네트워크 작업을 탐지합니다. 마지막으로 AI-BOM(AI Bill of Materials) Generator는 소프트웨어의 SBOM 개념에서 영감을 받아 각 AI 에이전트의 전체 구성 요소 목록을 생성합니다. 여기에는 모델 버전 및 제공업체 정보, 배포된 스킬 및 플러그인, 접근한 데이터 소스, 종속성 및 구성 매개변수가 포함되며, 이는 규정 준수 감사, 취약점 추적 및 사고 대응에 필수적입니다. 정적 스캐닝이 첫 번째 방어선이라면, DefenseClaw의 진정한 혁신은 런타임 위협 탐지에 있습니다. 프레임워크는 실행 중 에이전트의 모든 메시지 흐름을 지속적으로 모니터링하여, 초기 스캔에서는 안전했으나 이후 공급망 공격으로 인해 침해되거나 프롬프트 인젝션 공격이 런타임 컨텍스트를 악용하는 경우를 실시간으로 포착합니다. 이는 '신뢰하되 검증하라'는 접근법을 구현하며, 위협 감지 시 offending 스킬 차단, 샌드박스 권한 회수, 상세한 사고 보고서 생성 등의 자동화된 대응 메커니즘을 작동시킵니다.

산업 영향

DefenseClaw의 완전한 오픈소스화는 전략적으로 중요한 의미를 지닙니다. 이는 중소기업이 라이선스 비용 없이 엔터프라이즈급 AI 에이전트 보안에 접근할 수 있게 하여 AI 보안의 민주화를 촉진합니다. 또한 전 세계 보안 연구 커뮤니티가 새로운 탐지 규칙, 스캐닝 기능 및 통합을 기여할 수 있도록 하여 커뮤니티 주도 혁신을 가능하게 합니다. DefenseClaw는 OWASP ZAP이나 Snyk가 각자의 도메인에서 표준이 된 것처럼, AI 에이전트 보안 스캐닝의 사실상의 표준이 될 잠재력을 가지고 있습니다. 또한 오픈소스 코드는 독립적으로 감사될 수 있어 프레임워크의 무결성에 대한 사용자 신뢰를 구축합니다. 시스코는 DefenseClaw를 NVIDIA의 OpenShell 플랫폼과 깊이 통합할 예정이며, 이는 하드웨어적으로 격리된 샌드박스에서 에이전트가 실행되어 컨테이너 탈출이나 호스트 시스템 침해를 방지하도록 합니다. 이를 통해 보안 검사가 에이전트 배포 수명 주기의 각 단계에서 자동으로 트리거되고, 보안 정책 및 런타임 경고가 단일 인터페이스에서 관리됩니다. 시스코의 더 넓은 Agentic AI 보안 전략의 일환으로, DefenseClaw는 Duo Agentic Identity(에이전트 신원 관리) 및 AI Defense: Explorer Edition(모델 및 애플리케이션 탄력성 테스트 도구)과 함께layers된 방어 심층 전략을 구성합니다. DefenseClaw는 기술적 보안 스캐닝과 정책 집행을 담당하고, Duo Agentic Identity는 신원 및 접근 거버넌스를, AI Defense는 모델 수준의 보안 평가를 담당합니다.

전망

전통적인 애플리케이션 보안은 결정적인 코드 실행 경로에 초점을 맞추지만, AI 에이전트는 모델 추론의 변동성, 온도 설정, 컨텍스트 윈도우 내용으로 인해 동일한 입력이 다른 출력을 생성할 수 있는 비결정적 행동을 특징으로 합니다. 또한 에이전트는 런타임 결정에 따라 도구를 선택하고 호출하며, 다중 턴 상호작용을 통해 컨텍스트를 축적하고, 다중 에이전트 시스템에서는 개별 에이전트에는 없던 속성인 발현적 행동을 보일 수 있습니다. DefenseClaw는 이러한 현실을 인지하고 정적 스캐닝, 지속적인 런타임 모니터링, 하드 정책 집행을 결합하여 AI 에이전트 보안의 최전선을 대표합니다. 시스코의 DefenseClaw 출시로 인해 AI 에이전트 보안은 이론적 논의에서 엔지니어링 실무로 전환되었습니다. 오픈소스, 모듈식, 전 주기 보안 프레임워크로서 DefenseClaw는 기업 환경에서 AI 에이전트를 거버넌스하기 위한 견고한 기술적 기반을 제공합니다. 산업 전반에 걸쳐 Agentic AI 배포가 가속화됨에 따라, DefenseClaw와 그 생태계는 자율적 AI 시스템이 안전하고 규정 준수 가능하며 제어 가능하도록 보장하는 데 있어 핵심 인프라가 될 것으로 예상됩니다. GitHub에서 제공되는 포괄적인 문서 및 시작 가이드, 그리고 성장하는 커뮤니티 기여 스캐닝 규칙 라이브러리는 이 생태계의 확장을 더욱 가속화할 것입니다.