[arXiv] Talk Freely, Execute Strictly：模式门控Agent AI实现灵活且可复现的科学工作流

来自英国研究团队的论文提出了一种「模式门控」（Schema-Gated）的AI Agent架构，解决了科学工作流中灵活性与可复现性的矛盾。传统科学工作流工具要求严格的输入格式和步骤顺序，限制了研究者的探索自由度；而纯LLM方案虽然灵活，却无法保证实验的可复现性。

Schema-Gated架构将交互分为两个阶段：「自由对话」阶段允许研究者用自然语言描述实验意图、讨论方案修改、探索替代路径——这一阶段完全不受格式约束。而当对话转入「执行」阶段时，系统通过预定义的JSON Schema对指令进行严格验证，确保每一步操作都符合可复现性要求。

这种设计的巧妙之处在于，它不是简单地在灵活性和严格性之间做折中，而是让两者各自在最适合的阶段发挥作用。研究者获得了前所未有的交互自由度，同时不牺牲科学研究对可复现性的核心要求。该架构已在药物发现和材料科学的多个工作流中验证，显著降低了实验出错率。

Schema-Gated Agent：科学AI的「自由表达，严格执行」哲学

科学工作流的两难困境

科学研究对工具有两个看似矛盾的要求：

灵活性：研究过程充满了试错、假设修改和意外发现。研究者需要能够随时调整实验方案，探索计划之外的方向。

可复现性：科学的基石。任何实验结果都必须能被其他研究者精确复现，这要求实验过程的每一步都被严格记录和规范化。

传统的实验管理工具（如电子实验笔记本、LIMS系统）倾向于严格性，牺牲了灵活性。而2025-2026年涌现的AI实验助手倾向于灵活性，但可复现性成了问题——当你用自然语言告诉AI「再做一次类似的实验，但稍微调高温度」，「稍微」是多少？这种模糊性在软件开发中可以容忍，在科学研究中则不可接受。

Schema-Gated架构的设计哲学

Joel Strickland等人提出的解决方案优雅而直觉：**不要试图在灵活性和严格性之间找平衡，而是在不同阶段分别启用它们。**

#### 阶段一：自由对话（Talk Freely）

研究者：「我想试试把催化剂从钯换成铂，看看对收率有没有影响。
顺便上次的温度梯度实验，100度那组的结果有点异常，
可能需要重做。」

Agent：「理解。关于催化剂替换，铂在这类反应中通常...（讨论）
关于温度梯度重做，建议保持其他条件不变...（建议）
确认后我准备执行方案。」

这一阶段完全不受格式约束。研究者可以模糊地表达想法、提出假设、讨论替代方案。AI Agent在这个阶段的角色是**科学讨论伙伴**。

#### 阶段二：严格执行（Execute Strictly）

当研究者确认要执行时，系统切换到严格模式：

{
"experiment": {
"type": "catalytic_reaction",
"catalyst": {"element": "Pt", "loading_mg": 50},
"temperature": {"value": 100, "unit": "celsius"},
"duration": {"value": 120, "unit": "minutes"},
"replicate_of": "EXP-2026-0847"
}
}

每个参数都通过JSON Schema验证：催化剂必须是元素周期表中的有效元素，温度必须在设备支持的范围内，时间单位必须标准化。任何不符合Schema的指令都会被拒绝，并要求研究者澄清。

技术实现细节

Schema-Gated架构的关键技术组件：

1. **对话状态追踪器**：监控对话是否从「讨论」转入「执行」意图

2. **Schema Registry**：预定义各类实验操作的JSON Schema，支持扩展

3. **自然语言→Schema映射器**：将自由对话中确认的参数精确映射到Schema字段

4. **验证引擎**：在执行前对映射结果进行完整性和一致性检查

5. **审计日志**：记录从自由对话到Schema映射的完整链路，确保可追溯

验证结果

研究团队在两个领域验证了该架构：

药物发现：在化合物筛选工作流中，Schema-Gated Agent将实验参数错误率从传统LIMS的3.2%降至0.4%，同时将实验方案修改的平均时间从45分钟缩短至12分钟。

材料科学：在热处理实验中，严格的温度/时间Schema验证消除了之前因自然语言模糊性导致的17%的实验重做率。

超越科学的应用潜力

Schema-Gated的设计哲学实际上适用于任何需要「灵活讨论+严格执行」的场景：

**金融交易**：自由讨论投资策略，严格执行交易指令
**医疗诊断**：灵活讨论症状和鉴别诊断，严格执行检查和处方
**法律合同**：自由协商条款，严格生成法律文本
**软件部署**：灵活讨论架构方案，严格执行部署配置

与现有Agent框架的关系

| 框架 | 灵活性 | 严格性 | 可复现性 |

|------|--------|--------|----------|

| LangChain Agent | 高 | 低 | 低 |

| 传统LIMS | 低 | 高 | 高 |

| Schema-Gated | 高（讨论）+ 高（执行） | 高（执行） | 高 |

启示

Schema-Gated架构最大的贡献不是技术本身，而是它提出的哲学命题：**AI Agent不需要在自由和约束之间做选择，而是需要学会在合适的时机切换模式。**这一思想可能影响下一代AI Agent框架的设计方向。

参考来源：

[arXiv论文](https://arxiv.org/list/cs.AI/current)
药物发现工作流实验数据
材料科学验证报告