SkillComposer:以结构化序列预测重构LLM智能体技能调度范式
针对大型语言模型智能体在复杂任务中面临的多技能组合选择瓶颈,研究提出SkillComposer框架。该框架突破传统独立检索或排序的局限,将技能组合形式化为结构化序列预测任务,通过约束自回归解码器在一次生成中联合确定激活的技能子集、数量及执行顺序。基于真实人工策展技能库的训练数据,在SkillsBench基准上的实验显示,在GPT-5.2-Codex与Gemini-3-Pro-Preview两个生产级编码智能体上,相比无技能基线,任务通过率分别提升23.1和18.2个百分点。该方法不仅超越前三名检索策略,更在降低提示词令牌成本的同时达到与黄金技能检索上限相当的性能,为智能体模块化知识调度提供了新范式。
随着大型语言模型智能体在解决复杂现实任务中展现出巨大潜力,技能(Skills)作为封装了程序性知识和指令的模块化包,成为了提升智能体能力的关键组件。然而,随着技能库规模的扩大及其在跨任务、跨领域中的复用性增强,如何从海量技能中选出最合适的组合已成为核心瓶颈。现有的主流方法主要分为两类:一类是将智能体的推理过程暴露给整个技能集合,另一类则依赖于嵌入向量或基于大语言模型的重新排序器进行技能检索。尽管这些方法提供了有价值的见解,但它们普遍存在一个根本性缺陷,即忽视了技能组合的结构化本质。技能组合并非简单的独立选择,而是一个联合决策过程,涉及确定激活哪些技能、激活多少个技能以及这些技能以何种顺序执行。这三个维度相互依赖,无法被解耦处理。本文的核心贡献在于正式定义了结构化技能组合问题,即给定一个具体任务和技能库,预测一个可执行的技能计划,该计划需联合指定激活的子集、数量及执行顺序,从而填补了现有研究在结构化决策建模上的空白。 为了解决上述挑战,作者提出了SkillComposer框架,将结构化技能组合实例化为任务条件化的技能序列预测问题。在技术实现上,SkillComposer采用了一种约束自回归解码器,直接作用于技能标识符。这种设计的精妙之处在于,它允许智能体在一次解码传递中,联合生成技能子集、数量和执行顺序,使得后续技能对前序技能的依赖关系能够被自然且准确地捕捉。传统的检索方法往往需要多次迭代或复杂的后处理逻辑,而SkillComposer通过序列生成的方式,将复杂的组合优化问题转化为标准的语言建模任务。为了训练这一模型,研究团队构建了一个包含任务-组合对的大型训练集,这些数据源自一个真实存在且经过人工策展的高质量技能库。这种基于真实场景数据构建的训练策略,确保了模型能够学习到具有实际意义的技能依赖关系和执行逻辑,而非仅仅是表面的语义匹配。通过这种方式,SkillComposer不仅简化了推理流程,还提高了技能调用的准确性和效率。 在实验评估环节,研究团队从两个关键维度对SkillComposer进行了全面测试:一是在保留的测试集上评估技能组合的质量,二是在SkillsBench基准上评估其在下游任务中的成功率。实验选取了两个极具代表性的生产级编码智能体平台:GPT-5.2-Codex和Gemini-3-Pro-Preview,以验证方法在不同底层模型上的泛化能力。结果显示,SkillComposer的表现显著优于基线方法。具体而言,在GPT-5.2-Codex上,其任务通过率比无技能基线提升了23.1个百分点;在Gemini-3-Pro-Preview上,提升幅度达到18.2个百分点。更为重要的是,SkillComposer的性能不仅超越了传统的Top-3检索策略,甚至在降低提示词令牌成本的同时,达到了与黄金技能检索(Gold-skill retrieval)上限相当的水平。这一结果有力地证明了结构化联合决策在技能组合中的优越性。消融实验进一步发现,当解耦技能选择、数量和顺序时,性能显著下降,验证了联合建模的必要性。此外,通过对比不同检索策略,研究还发现SkillComposer在长尾技能组合上的表现尤为出色,这得益于其对技能间依赖关系的深层理解。 SkillComposer的提出对开源社区、工业落地及后续研究具有深远的意义。在工业落地方面,通过降低提示词令牌成本并提高任务成功率,该方法能够显著降低大模型智能体的运行成本,使其在资源受限的生产环境中更具可行性。对于开源社区而言,基于真实人工策展技能库构建的数据集和框架,为其他研究者提供了可复现的基准和参考实现,有助于推动智能体技能管理领域的标准化。在后续研究方面,SkillComposer证明了将结构化决策融入自回归生成的可行性,这为探索更复杂的智能体规划、多智能体协作以及动态技能库管理提供了新的思路。未来的工作可以进一步探索如何自动构建和更新技能库,以及如何将SkillComposer扩展至非编码领域的复杂任务中。总体而言,该研究不仅解决了一个具体的工程瓶颈,更为构建更加智能、高效和可靠的大型语言模型智能体系统奠定了重要的理论基础和技术支撑。