FORGE:無權重更新的自進化智能體記憶機制與種群廣播協定

本文提出FORGE協定,一種無需梯度更新的自進化智能體記憶框架,旨在解決大型語言模型智能體在複雜決策任務中缺乏長期記憶積累的問題。FORGE採用基於種群的階段性協定設計:在內部循環中,智能體透過反思將失敗軌跡轉化為啟發式規則、少範例範例或混合知識形式;在外部循環中,最優實例的記憶在階段之間傳播擴散。在CybORG CAGE-2網路防禦基準測試中,FORGE在四種主流大型語言模型家族(GPT系列、Claude系列、Gemini系列、Llama系列)上均顯著超越零範例基線和Reflexion基線,平均評估回報提升1.7至7.7倍,失敗率降至約1%。消融實驗表明,種群廣播機制是性能提升的核心驅動力,而少範例範例在大多數模型上效果最佳。該工作為資源受限環境下智能體實現高效自我進化提供了新範式,尤其有助於縮小不同能力層級模型之間的性能差距。