多Agent LLM交易系統：細粒度任務分解勝過粗粒度指令

用 LLM 做金融交易的多 Agent 系統越來越多，但大多數只給模型一個模糊的角色描述就讓它做決策。這篇論文證明了粗粒度角色扮演遠遠不夠——需要將投資分析顯式分解爲細粒度子任務：宏觀經濟分析、財報解讀、技術面分析、新聞情緒提取、綜合決策。每個子任務由專門 Agent 處理，有明確的輸入輸出格式。

在日本股票市場的嚴格防泄漏回測中，細粒度分解的風險調整收益顯著優於粗粒度設計。更深入的分析揭示：系統性能的關鍵不是單個分析的質量，而是分析輸出與下游決策偏好的對齊程度。對 agentic AI 在 AI 交易等專業領域的應用，顯式任務分解勝過角色扮演。這爲 agentic AI 在金融、醫療、法律等專業領域的落地提供了重要的設計原則。

用 LLM 做金融交易的研究已經很多，但大多數只是讓 Agent "扮演"分析師和基金經理，給一個模糊的角色描述就讓它做決策。這篇論文指出：**粗粒度的角色扮演不夠，需要精細化的任務分解**。

系統設計

框架將投資分析拆分爲明確的細粒度子任務：

1. **宏觀經濟分析** — 解讀央行政策、通脹數據、匯率走勢

2. **財報分析** — 解讀損益表、資產負債表、現金流變化

3. **技術面分析** — 識別價格模式、支撐/阻力位、成交量異常

4. **新聞情緒分析** — 從新聞標題和正文提取市場情緒

5. **綜合決策** — 整合以上分析做出買入/賣出/持有決策

每個子任務由專門的 Agent 處理，有明確的輸入輸出格式和評判標準。

實驗設置

使用日本股票市場數據（東證一部），覆蓋：

股價和成交量數據
上市公司財務報表
日經新聞和路透社新聞
宏觀經濟指標

嚴格的防泄漏回測：訓練數據和測試數據之間有嚴格的時間分割。

核心發現

1. 細粒度任務分解的風險調整收益**顯著優於**粗粒度角色扮演

2. 系統性能的關鍵驅動力是**分析輸出與決策偏好的對齊程度**——不是分析質量本身，而是分析結果能否被決策模塊有效利用

3. 利用系統輸出與股指的低相關性做投資組合優化，獲得更優的夏普比率

啓示

對於 Agent 在專業領域的應用，"你是一個分析師"這種 prompt 遠遠不夠。需要把專業工作流顯式建模成結構化任務鏈。

Agentic AI 在金融領域的落地

2026 年 agentic AI 的最大爭論之一是：AI Agent 能否真正勝任複雜專業工作？這篇論文給出了一個有條件的“是”——關鍵在於任務架構設計。AI 交易（AI trading）是 agentic AI 最早落地的領域之一，因爲金融市場有明確的反饋信號（盈虧）和可量化的評估指標（夏普比率）。本文的細粒度任務分解方法可以推廣到其他專業領域的多 Agent 系統設計。