HyperTool:超越單步調用,重塑工具增強智能體的執行粒度
本文針對當前工具增強大型語言模型(LLM)智能體普遍存在的「執行粒度不匹配」問題,提出了一種創新解決方案——HyperTool。傳統方法將確定性的工具工作流拆解為大量原子化的單步調用,導致推理軌跡冗長且消耗大量上下文視窗,迫使模型處理底層數據流細節。HyperTool引入了一種統一的、可執行的 MCP 風格工具介面,允許模型透過單一程式碼區塊呼叫多個工具、處理返回值並在本地傳遞中間結果,從而將複雜的子程序摺疊為一次外層調用。在 MCP-Universe 基準上的實驗表明,HyperTool 顯著提升了多步工具使用性能:Qwen3-32B 平均準確率從 15.69% 躍升至 35.29%,Qwen3-8B 從 9.93% 提升至 33.33%,超越了 GPT-OSS 和 Kimi-k2.5 等先進模型。