FORGE: 가중치 업데이트 없는 자기진화 에이전트 메모리 메커니즘 및 개체군 방송 프로토콜
본 논문은 복잡하고 결정적 작업을 수행하는 대규모 언어 모델 에이전트의 장기 기억 축적 부재 문제를 해결하도록 설계된 그래디언트 없는 자기진화 에이전트 메모리 프레임워크 FORGE를 제시합니다. FORGE는 개체군 기반 단계적 프로토콜을 채택하며, 내부 루프에서 에이전트는 내부 반성을 통해 실패 궤적을 휴리스틱 규칙, 퓨샷 예제 또는 하이브리드 지식으로 변환하고, 외부 루프에서 최적 인스턴스의 기억이 단계 간에 전파됩니다. CybORG CAGE-2 네트워크 방어 벤치마크에서 평가한 결과, FORGE는 주요 4개 LLM 패밀리(GPT, Claude, Gemini, Llama) 모두에서 제로샷 및 Reflexion 베이스라인을 현저히 초과하여 평균 평가 보상을 1.7배에서 7.7배 향상시키고 실패율을 약 1%로 감소시켰습니다. 아블레이션 연구를 통해 개체군 방송이 성능 향상 핵심 요인이며 퓨샷 예제가 대다수 모델에서 가장 효과적인 것으로 나타났습니다. 이 연구는 자원 효율적인 에이전트 자기진화를 위한 새로운 패러다임을 확립하고 서로 다른 능력 수준의 모델 간 성능 격차를 축소하는 데 기여합니다.
배경
동적이고 적대적인 환경에서 작동하는 대규모 언어 모델(Large Language Model, LLM) 기반 에이전트는 종종 정적인 지식 경계로 인해 중요한 제한 사항에 직면합니다. 전통적으로 에이전트의 의사결정 능력을 향상시키기 위한 접근 방식은 그래디언트 기반 업데이트나 외부 파인튜닝 과정에 크게 의존해 왔습니다. 이러한 방법들은 성능을 개선할 수 있는 잠재력을 지니고 있지만, 실시간 또는 자원이 제한된 애플리케이션에 적용하기에는 종종 prohibitive한 수준의 계산 비용과 배포 복잡성을 초래합니다. 핵심 과제는 비용이 많이 드는 모델 재학습이나 가중치 수정 없이도 에이전트가 장기적인 기억을 축적하고 복잡한 의사결정 작업에 적응할 수 있도록 하는 것입니다. 이러한 격차는 계산적으로 지속 가능하고 확장 가능한 방식으로 경험을 통해 학습할 수 있는 더 효율적이고 경량화된 메커니즘의 개발을 필요로 했습니다.
이러한 중요한 한계를 해결하기 위해 연구자들은 FORGE(Failure-Optimized Reflective Graduation and Evolution)를 소개했습니다. 이는 가중치 업데이트 없이 작동하도록 설계된 혁신적인 자기진화 에이전트 메모리 프로토콜입니다. FORGE는 기존 방법들이 더 강력한 모델로 지식을 증류하거나 모델 파라미터를 업데이트하는 것을 요구하는 것과 달리, 계층적 ReAct 에이전트 아키텍처를 활용하여 자기 생성 자연어 메모리를 통해 의사결정 프로세스를 최적화할 수 있는 패러다임 전환을 의미합니다. 이 아키텍처는 내부 반성 루프와 외부 개체군 방송 루프로 구성된 이중 루프 시스템을 통해 지식의 효율적인 축적과 전파를 가능하게 합니다. FORGE는 메모리 진화를 모델 가중치와 분리함으로써, 기본 구조를 변경하지 않고도 다양한 대규모 언어 모델 패밀리에 적용할 수 있는 유연한 솔루션을 제공합니다.
FORGE의 중요성은 기본 언어 모델의 원래 아키텍처를 유지하면서 프롬프트 엔지니어링을 통해 메모리를 주입할 수 있는 능력으로 더욱 부각됩니다. 이 접근 방식은 높은 일반화 가능성과 유연성을 보장하여, 프로토콜이 서로 다른 LLM 패밀리에 쉽게 적응할 수 있도록 합니다. 프로토콜의 설계는 실패 궤적을 재사용 가능한 지식 아티팩트로 변환하는 데 중점을 둠으로써 전통적인 강화 학습 방법의 비효율성을 해결합니다. 이러한 아티팩트는 휴리스틱 규칙, 퓨샷 예제 또는 하이브리드 형태를 포함하며, 내부 반성을 통해 생성되고 개체군 기반 메커니즘을 통해 전파됩니다. 이 방법은 에이전트의 성능을 향상시킬 뿐만 아니라, 지속적인 모델 업데이트와 관련된 오버헤드를 피함으로써 계산 자원의 사용도 최적화합니다.
심층 분석
FORGE는 기존 학습 프레임워크인 Reflexion을 모방하고 개선하는 정교한 두 층의 루프 아키텍처를 사용합니다. 내부 루프에서 시스템은 작업 실행 중 마주친 실패 궤적을 분석하기 위해 전용 반성 에이전트를 활용합니다. FORGE는 지식 증류를 위해 더 강력한 모델을 의존하는 대신, 동일한 기본 대규모 언어 모델을 사용하여 자기 반성을 수행합니다. 에이전트가 실패할 경우, 반성 에이전트는 실패 시퀀스에서 일반화 가능한 지식을 추출하여 세 가지 유형의 지식 아티팩트로 포맷합니다. 이는 휴리스틱 가이드라인인 규칙(Rules), 퓨샷 데모인 예제(Examples), 또는 이 둘의 조합인 혼합 형태(Mixed)입니다. 이러한 아티팩트는 자연어 메모리로서 에이전트의 프롬프트에 주입되어, 에이전트가 그래디언트 업데이트 없이도 실수로부터 학습할 수 있도록 효과적으로 만듭니다. 이 메커니즘은 학습 과정이 에이전트의 환경 상호작용과 자체 메모리 상태에 내재되어 있음을 보장합니다. 외부 루프는 학습 과정의 다양성과 강건성을 향상시키기 위해 개체군 기반 접근 방식을 도입합니다. FORGE는 에이전트 인스턴스의 개체군을 유지하며, 각 단계가 끝날 때 시스템은 모든 인스턴스의 성능을 평가합니다. 상위 성능을 보이는 인스턴스의 메모리는 나머지 개체군에 방송되어 성공적인 전략의 확산을 촉진합니다. 이 단계에서의 주요 혁신 중 하나는 졸업 메커니즘(Graduation Mechanism)의 도입입니다. 에이전트의 메모리가 특정 수렴 기준에 도달하면, 해당 인스턴스는 활성 개체군에서 제거되고 동결됩니다. 이 과정은 중복 학습에 대한 계산 자원의 낭비를 방지하고, 개체군이 전략의 다양한 세트를 유지하여 지역 최적점에 빠지지 않고 해결 공간의 더 넓은 탐색을 촉진하도록 보장합니다. FORGE의 효용성을 검증하기 위해, 네트워크 방어를 위한 부분 관측 마르코프 의사결정 과정(POMDP)인 CybORG CAGE-2 벤치마크에서 광범위한 평가가 수행되었습니다. 이 벤치마크는 에이전트가 30단계의 시간 범위 내에서 B-line 공격자에 대항해야 하는 매우 확률적이고 복잡한 환경을 제시합니다. 연구는 Gemini-2.5-Flash-Lite, Grok-4-Fast, Llama-4-Maverick, Qwen3-235B 등 네 가지 주요 LLM 패밀리에 걸쳐 FORGE를 테스트했습니다. 제로샷 설정에서 이러한 모델들은 강한 음수 및 무거운 꼬리 분포를 보이는 보상 분포를 나타내어, 복잡한 방어 작업에서의 내재적 어려움을 강조했습니다. 결과는 FORGE가 테스트된 모든 모델에서 제로샷 및 Reflexion 베이스라인을 현저히 초과했음을 보여주었습니다. 구체적으로, 평균 평가 보상은 제로샷 베이스라인 대비 1.7배에서 7.7배 증가했으며, 고립된 단일 스트림 Reflexion 베이스라인 대비 29%에서 72% 증가했습니다. 또한, -100 미만의 보상인 실패율은 약 1%로 감소하여 시스템 신뢰성의 상당한 개선을 나타냈습니다.
아블레이션 연구는 FORGE의 성공을 주도하는 구성 요소에 대한 더 깊은 통찰력을 제공했습니다. 졸업 메커니즘을 제거한 변형은 개체군 방송이 성능 향상의 주요 동력임을 확인시켰고, 졸업 메커니즘 자체는 계산 효율성에 중요함을 알 수 있었습니다. 지식 표현 측면에서 퓨샷 예제는 테스트된 네 가지 모델 중 세 가지에서 가장 높은 보상을 얻으며 가장 효과적인 것으로 입증되었습니다. 그러나 휴리스틱 규칙은 강건한 성능을 유지하면서 토큰 사용을 약 40% 줄임으로써 비용 효율성에서 우월한 것을 보여주었습니다. 주목할 만한 점은, 기본 능력이 약한 모델이 FORGE로부터 더 크게 혜택을 받았다는 것입니다. 이는 프로토콜이 이미 강력한 모델의 이점을 단순히 증폭시키는 것이 아니라, 서로 다른 tiers의 LLM 간 성능 격차를 좁히는 데 도움이 됨을 시사합니다.
산업 영향
FORGE의 도입은 자원이 제한된 환경에서 AI 에이전트 배포에 지대한 영향을 미칩니다. 가중치 업데이트의 필요성을 제거함으로써, FORGE는 계산 자원이 제한된 엣지 디바이스나 실시간 시스템에 정교하고 자기진화하는 에이전트를 배포할 수 있게 합니다. 이 능력은 모델 유지보수 및 업데이트와 관련된 비용을 크게 줄여, 산업 애플리케이션에 고급 AI 의사결정을 더 접근 가능하고 실용적으로 만듭니다. 프로토콜이 자연어 메모리에 의존한다는 점은 에이전트의 진화 과정의 투명성과 해석 가능성을 향상시킵니다. 연구자와 엔지니어는 휴리스틱 규칙이나 예제와 같이 축적된 지식을 직접 검사하고 분석할 수 있으며, 이는 에이전트의 의사결정 논리에 대한 귀중한 통찰력을 제공합니다. 이러한 해석 가능성은 디버깅, 에이전트 행동 개선, 그리고 고위험 환경에서의 안전 및 규제 기준 준수를 보장하는 데 필수적입니다.
사이버 보안 도메인에서 FORGE는 장기적인 기억과 동적 위협에 대한 빠른 적응이 필요한 애플리케이션에 특히 적합합니다. 네트워크 방어 시나리오를 시뮬레이션하는 CybORG CAGE-2 벤치마크는 프로토콜이 정교하고 진화하는 공격으로부터 시스템을 보호하는 잠재력을 보여줍니다. FORGE가 높은 보상 점수를 유지하면서 실패율을 약 1%로 줄일 수 있는 능력은 중요한 인프라 보호에서의 신뢰성을 나타냅니다. 또한, 졸업 메커니즘을 통해 계산 자원을 효율적으로 관리하는 프로토콜의 능력은 지속적인 모니터링과 대응이 필요한 대규모 자동화 운영에 이상적입니다. 과거 실패로부터 학습하고 성공적인 전략을 개체군 전체에 전파함으로써, FORGE는 탄력적이고 적응적인 보안 시스템을 구축하기 위한 견고한 프레임워크를 제공합니다.
오픈소스 커뮤니티는 FORGE의 자기진화에 대한 표준화된 접근 방식으로부터 상당한 혜택을 볼 것입니다. 특정 모델 아키텍처나 가중치 업데이트에 의존하지 않는 프로토콜을 제공함으로써, FORGE는 서로 다른 연구 팀 간에 더 쉬운 비교와 협력을 촉진합니다. 이러한 표준화는 새로운 에이전트 기반 애플리케이션의 개발을 가속화하고 더 협력적인 생태계를 육성할 수 있습니다. 또한, 프로토콜의 유연성은 사이버 보안 외에도 고객 서비스, 자동 거래, 로봇 제어 등 다양한 다른 도메인으로 적응될 수 있습니다. FORGE가 서로 다른 모델 능력 간의 성능 격차를 메꿀 수 있는 잠재력은 고성능 AI에 대한 접근을 민주화하여, 자원이 제한된 조직이 고급 에이전트 기술을 활용할 수 있게 합니다.
전망
앞으로 연구 커뮤니티는 FORGE의 다양한 작업 도메인 전반에 걸친 더 넓은 적용 가능성을 탐색할 준비가 되어 있습니다. 향후 연구는 장기적 문맥 유지가 중요한 대화형 AI나 물리적 상호작용으로부터 적응형 학습이 필요한 로봇 제어 시스템과 같은 영역에서 프로토콜의 효과성을 조사할 수 있습니다. 기억 아티팩트의 표현을 최적화하고 개체군 루프 내의 방송 전략을 정교화하는 것이 주요 관심사가 될 가능성이 높습니다. 연구자들은 더 정교한 하이브리드 지식 형태를 실험하거나 졸업 기준을 동적으로 조정하여 효율성과 성능을 더욱 향상시킬 수 있습니다. 또한, FORGE를 다른 강화 학습 기술과 통합하여 더 견고하고 다재다능한 에이전트 시스템을 생성할 잠재력이 있습니다. FORGE의 개발은 AI 에이전트의 인지 과정을 이해하기 위한 새로운 길을 열기도 합니다. 반성 루프를 통해 생성된 자연어 메모리를 분석함으로써, 연구자들은 에이전트가 휴리스틱을 형성하고 특정 경험에서 일반화하는 방식을 이해할 수 있는 통찰력을 얻을 수 있습니다. 이는 생물학적 기억 고정 과정을 모방하는 더 인간적인 학습 알고리즘의 개발로 이어질 수 있습니다. 프로토콜이 성숙함에 따라, 이는 개체군 내 에이전트들이 협력하고 경쟁하여 복잡한 문제를 해결하는 다중 에이전트 시스템에 대한 새로운 아키텍처를 영감을 줄 수 있습니다. FORGE의 투명성과 해석 가능성에 대한 강조는 자율 시스템이 이해 가능하고 통제 가능하도록 보장하는 책임 있는 AI 개발을 위한 새로운 기준을 설정할 수 있습니다.
마지막으로, FORGE의 자원 효율성의 경제적 함의는 과소평가할 수 없습니다. AI 채택이 증가함에 따라 대규모 모델의 훈련과 유지보수 비용은 여전히 상당한 장벽으로 남아 있습니다. 추가적인 훈련 비용 없이 성능을 향상시킬 수 있는 FORGE의 능력은 산업계를 위한 지속 가능한 진로를 제공합니다. 이 접근 방식은 조직이 기존 모델의 가치를 최대화하면서 메모리 진화를 통해 지속적으로 능력을 향상시킬 수 있게 합니다. 이러한 접근 방식은 더 저렴하고, 확장 가능하며, 적응 가능한 새로운 세대의 AI 서비스로 이어질 수 있습니다. 기술이 진화함에 따라, FORGE와 유사한 프로토콜이 AI 인프라의 필수 구성 요소가 되어, 자율 에이전트가 지능적일 뿐만 아니라 효율적이고, 투명하며, 널리 접근 가능하게 되는 미래를 가능하게 할 것으로 예상됩니다. FORGE의 궤적은 더 모듈화되고 구성 가능한 AI 시스템으로의 전환을 시사합니다. 광범위한 재훈련이 필요한 모놀리식 모델 대신, 미래 시스템은 지속적인 저비용 적응을 가능하게 하는 경량 프로토콜에 의존할 수 있습니다. 이러한 모듈화는 더 빠른 혁신 주기와 동적 시장에서의 AI 솔루션 빠른 배포를 용이하게 할 수 있습니다. CybORG CAGE-2 벤치마크에서의 FORGE의 성공은 이 새로운 패러다임에 대한 개념 증명으로, 지능적인 메모리 관리를 통해 상당한 성능 향상을 달성할 수 있음을 보여주며, 무차별적인 계산 파워가 아닌 한 번에 이를 입증합니다. 분야가 앞으로 나아감에 따라, 이러한 프로토콜을 주류 AI 개발 관행에 통합하는 것은 에이전트 성능과 효율성에 대한 기준을 재정의할 가능성이 높습니다.