LLM改進LLM:基於智能體發現的測試時擴展方法

測試時擴展(TTS)透過在推理階段分配額外計算量來提升大型語言模型效能,已成為行之有效的策略。然而,現有TTS方法幾乎全部依賴人工設計——研究人員憑藉經驗手動構建推理模式並調整參數,導致大量計算分配策略尚未被探索。為此,作者提出AutoTTS,一個以環境驅動的全新框架,將研究者的設計對象從單一TTS啟發規則轉變為TTS策略可被自動發現的「環境空間」。AutoTTS的核心在於環境構造:透過設計可評估、可迭代的發現環境,使LLM能夠自主搜尋更優的測試時計算分配方案。此範式將TTS研究從手工調整參數轉向自動化策略發現,大幅拓展了計算分配的空間。