多Agent LLM交易系統:細粒度任務分解勝過粗粒度指令
用 LLM 做金融交易的多 Agent 系統越來越多,但大多數只給模型一個模糊的角色描述就讓它做決策。這篇論文證明了粗粒度角色扮演遠遠不夠——需要將投資分析顯式分解爲細粒度子任務:宏觀經濟分析、財報解讀、技術面分析、新聞情緒提取、綜合決策。每個子任務由專門 Agent 處理,有明確的輸入輸出格式。
在日本股票市場的嚴格防泄漏回測中,細粒度分解的風險調整收益顯著優於粗粒度設計。更深入的分析揭示:系統性能的關鍵不是單個分析的質量,而是分析輸出與下游決策偏好的對齊程度。對 agentic AI 在 AI 交易等專業領域的應用,顯式任務分解勝過角色扮演。這爲 agentic AI 在金融、醫療、法律等專業領域的落地提供了重要的設計原則。
用 LLM 做金融交易的研究已經很多,但大多數只是讓 Agent "扮演"分析師和基金經理,給一個模糊的角色描述就讓它做決策。這篇論文指出:**粗粒度的角色扮演不夠,需要精細化的任務分解**。
系統設計
框架將投資分析拆分爲明確的細粒度子任務:
1. **宏觀經濟分析** — 解讀央行政策、通脹數據、匯率走勢
2. **財報分析** — 解讀損益表、資產負債表、現金流變化
3. **技術面分析** — 識別價格模式、支撐/阻力位、成交量異常
4. **新聞情緒分析** — 從新聞標題和正文提取市場情緒
5. **綜合決策** — 整合以上分析做出買入/賣出/持有決策
每個子任務由專門的 Agent 處理,有明確的輸入輸出格式和評判標準。
實驗設置
使用日本股票市場數據(東證一部),覆蓋:
- 股價和成交量數據
- 上市公司財務報表
- 日經新聞和路透社新聞
- 宏觀經濟指標
嚴格的防泄漏回測:訓練數據和測試數據之間有嚴格的時間分割。
核心發現
1. 細粒度任務分解的風險調整收益**顯著優於**粗粒度角色扮演
2. 系統性能的關鍵驅動力是**分析輸出與決策偏好的對齊程度**——不是分析質量本身,而是分析結果能否被決策模塊有效利用
3. 利用系統輸出與股指的低相關性做投資組合優化,獲得更優的夏普比率
啓示
對於 Agent 在專業領域的應用,"你是一個分析師"這種 prompt 遠遠不夠。需要把專業工作流顯式建模成結構化任務鏈。
Agentic AI 在金融領域的落地
2026 年 agentic AI 的最大爭論之一是:AI Agent 能否真正勝任複雜專業工作?這篇論文給出了一個有條件的“是”——關鍵在於任務架構設計。AI 交易(AI trading)是 agentic AI 最早落地的領域之一,因爲金融市場有明確的反饋信號(盈虧)和可量化的評估指標(夏普比率)。本文的細粒度任務分解方法可以推廣到其他專業領域的多 Agent 系統設計。