MASPO:面向LLM驅動多Agent系統的聯合提示優化
基於大語言模型(LLM)的多Agent系統(MAS)在解決複雜協同任務方面展現出巨大潛力,其中Agent通常通過角色特定的提示詞進行編排。儘管提示詞質量至關重要,但由於局部Agent目標與整體系統目標之間存在錯位,跨多個交互Agent聯合優化提示詞仍是一項重大挑戰。為此,作者提出MASPO——一種新穎的框架,能夠自動且迭代地優化整個系統中的所有提示詞。MASPO的核心創新在於其聯合評估機制:不再孤立地評價每個Agent的提示詞,而是從系統全局目標出發,綜合考慮Agent之間的交互效應,從而找到全局最優的提示詞組合。該方法有效彌合了局部優化與全局性能之間的鴻溝,為多Agent系統的高效協同提供了新路徑。