什麼是TraderBench？

首個系統性測試AI交易Agent對抗性魯棒性的基準套件，包含五類攻擊：假新聞、市場操縱、數據投毒、模型萃取和延遲攻擊。

AI交易Agent的主要脆弱性是什麼？

67%的LLM交易Agent會根據虛假資訊改變交易決策，顯示出對操縱的嚴重脆弱性。

多機構研究團隊發布了TraderBench，這是首個系統性測試AI交易Agent在對抗性市場環境中魯棒性的基準套件。不同於此前只在歷史數據上回測的評估方式，TraderBench引入了五類對抗性攻擊——假新聞注入、市場操縱模擬、數據投毒、模型萃取和延遲攻擊——模擬真實金融市場中的惡意行為。

測試結果令人警醒：主流LLM交易Agent在假新聞攻擊下決策偏差率高達67%，即使是表現最佳的Agent在面對協調性市場操縱時也出現了顯著虧損。這項工作為AI金融應用的安全性敲響了警鐘。

AI交易系統在過去一年經歷了爆發式增長。從對沖基金到散戶平台，越來越多的交易決策正在從人類轉移到AI Agent。但一個關鍵問題被忽視了：這些Agent在「最壞情況」下表現如何？

傳統的評估方式是歷史回測——在過去10年的市場數據上運行策略，計算回報率和夏普比率。問題是，歷史數據不包含針對AI的對抗性攻擊。

1. **假新聞注入**：將虛假的企業新聞或分析師報告混入Agent輸入

2. **市場操縱模擬**：生成協調性價格操作模式

3. **數據投毒**：在訓練數據中注入細微的篡改

4. **模型萃取**：觀察Agent的交易模式以逆向推算策略

5. **延遲攻擊**：微妙地操縱資訊到達時間

1. **監管必然性**：AI交易的對抗性風險成為監管機構新焦點

2. **安全新市場**：AI交易Agent安全解決方案需求急增

3. **透明度要求**：投資者要求AI交易系統公開脆弱性測試結果