HyperTool:統一介面讓智能體超越逐步呼叫

本文針對工具增強大語言模型智能體中普遍存在的「執行粒度不匹配」問題,提出了一種名為HyperTool的統一工具介面。傳統方法要求模型在推理軌跡中逐步暴露每個原子工具的呼叫、觀察及資料傳遞,導致上下文視窗被大量浪費,並迫使模型處理不需要的底層資料流。HyperTool引入了一種類似MCP風格的介面,將模型可見的執行單元從原子操作升級為程式碼區塊。模型只需透過程式碼區塊呼叫現有工具、操作返回值並在本地傳遞中間結果,即可將確定性的子程序折疊為單次外層呼叫。透過在跨工具組合任務上合成並驗證訓練軌跡,實驗表明在MCP-Universe基準上,Qwen3-32B和Qwen3-8B的平均準確率分別大幅提升至35.29%和33.33%,顯著優於GPT-OSS和Kimi-k2.5,驗證了該介面在多步工具使用中的巨大潛力。

Sources