[arXiv] Talk Freely, Execute Strictly：模式門控Agent AI實現靈活且可復現的科學工作流

來自英國研究團隊的論文提出了「模式門控」AI Agent架構，解決了科學工作流中靈活性與可復現性的矛盾。「自由對話」階段允許用自然語言描述，「執行」階段通過JSON Schema進行嚴格驗證。

這種設計不是在靈活性和嚴格性之間做折中，而是讓兩者各自在最適合的階段發揮作用。

已在藥物發現和材料科學工作流中驗證，顯著降低了實驗出錯率。

科學研究對工具有兩個看似矛盾的要求：探索的靈活性和嚴格的可復現性。

不在靈活性和嚴格性之間做折中，而是在不同階段分別啟用。第一階段：無格式約束的自然語言討論。第二階段：JSON Schema驗證。

藥物發現：實驗參數錯誤率從3.2%降至0.4%。材料科學：消除了因自然語言模糊性導致的17%實驗重做率。

設計哲學適用於任何需要「靈活討論+嚴格執行」的場景。

參考來源：