SearchSwarm:賦予智能體長程深度研究的委託智能
隨著大型語言模型在現實世界複雜任務中的應用日益深入,處理長週期、高上下文需求的任務成為關鍵挑戰。然而,模型的上下文視窗始終有限,傳統單智能體模式難以應對無限增長的語境需求。本文提出了「委託智能」(Delegation Intelligence)的概念,旨在解決主智能體如何有效分解複雜任務、決定何時及向誰委派子任務,並將子智能體的返回結果整合回工作流程的問題。針對此類訓練數據稀缺的現狀,研究團隊以深度研究任務為切入點,設計了一套引導框架(harness),透過約束子智能體的行為並記錄高品質的決策軌跡,合成監督微調數據。最終生成的 SearchSwarm-30B-A3B 模型在 BrowseComp 和 BrowseComp-ZH 基準上分別取得了 68.1 和 73.3 的優異成績,超越了同規模的其他模型。該研究不僅開源了模型權重與訓練數據,更為解決長程智能體任務的上下文瓶頸提供了新的技術路徑。