HyperTool:超越逐步工具調用的統一可執行介面
本文針對工具增強型大語言模型智能體中普遍存在的「執行粒度不匹配」問題提出 HyperTool 框架。傳統方法要求模型在推理軌跡中逐步暴露每個工具呼叫的細節,導致上下文視窗被底層決策佔用,效率低下。HyperTool 引入統一的、類似 MCP 的可執行介面,允許模型透過程式碼塊一次性封裝多個原子工具呼叫、值傳遞和中間結果處理,將確定性子程式摺疊為單次外層呼叫。在跨工具組合任務上合成訓練軌跡並在真實 MCP 環境中驗證,實驗顯示顯著效能提升:MCP-Universe 基準上 Qwen3-32B 平均準確率從 15.69% 躍升至 35.29%,Qwen3-8B 從 9.93% 提升至 33.33%,均超越 GPT-OSS 和 Kimi-k2.5 等先進模型。