Anthropic 测试 AI 代理真实交易：代理经济开始从演示走向市场验证

Anthropic 近期搭建了一个用于实验的分类信息市场，让 AI 代理分别扮演买家与卖家，在真实商品与真实资金条件下完成实际交易。这一尝试的意义不在于市场规模，而在于验证“代理对代理商业”是否能从任务自动化进一步迈向交易自动化。它也把支付、信任、权限、责任归属与平台治理等问题提前摆上台面，为未来 AI 代理参与数字商业提供了更接近现实的观察样本。

Anthropic 最近进行的一项实验，把外界对 AI 代理的想象从“能帮人做事”进一步推进到了“能代表人做交易”。这家公司搭建了一个分类信息市场，让 AI 代理分别扮演买家和卖家，并且不只是停留在对话模拟、订单沙盘或内部测试，而是在真实商品、真实资金的条件下推进实际交易。这个实验之所以受到关注，并不只是因为它新鲜，而是因为它触碰到了 AI 商业化演进中一个更难也更关键的阶段：如果代理不只是回答问题、整理信息、预约服务，而是能够在市场中独立完成搜索、比价、沟通、下单、收款、履约等链条中的部分动作，那么所谓“代理经济”就不再只是概念，而是在向可运行的商业结构靠近。从表面看，这像是一个很小的测试市场，但从产业意义看，它相当于给未来的机器商业关系做了一次压力测试。过去一年多，围绕 AI 代理的讨论主要集中在效率层面：它能不能替用户查资料、写邮件、调用工具、操作软件、执行多步骤任务。相比之下，让代理进入交易场景，难度明显更高。因为交易不是单纯的信息处理，它还涉及目标冲突、价格判断、资源约束、支付确认、身份验证、可信度评估、风险承担以及事后追责。也正因为如此，Anthropic 的这次尝试有一种“把 AI 从办公室带到市场里”的意味。市场不会因为模型输出流畅就自动成立，真正的商业行为需要规则、边界、信任和执行结果，而这些恰恰是代理落地最容易暴露问题的地方。这项实验选择分类信息市场作为载体，本身也很有代表性。分类市场天然包含供需匹配、商品描述、询价、协商、成交等要素，既不像证券市场那样高度制度化，也不像企业采购那样流程冗长，因此非常适合作为代理交易能力的早期试验场。买家代理要理解需求，筛选候选商品，比较条件，决定是否联系卖家；卖家代理则要根据库存、定价、描述信息和沟通策略回应询问，推动成交。看起来这些环节都不复杂，但任何一个环节一旦进入现实世界，都不是简单的文本补全就能稳妥解决。比如，商品信息是否足够准确、价格是否需要动态调整、付款权限能否安全交给代理、代理是否会误解用户偏好、遇到纠纷时责任由谁承担，这些问题都会迅速把一个看似顺畅的演示推入复杂的现实。因此，Anthropic 这次实验最值得看的，不是“代理成功买到了什么、卖出了什么”，而是它验证了哪些前提。首先，它验证的是代理是否能够在明确目标下完成跨步骤的交易行为。过去很多 AI 产品虽然号称具备代理能力，但大多局限于单一任务自动化，真正到了要与外部主体互动、在不完全信息下作出决策时，系统稳定性会明显下降。交易场景要求代理具备更强的持续推理和状态管理能力，它不能只会生成看上去合理的话，还要知道当前流程走到了哪一步、还缺什么信息、下一步该联系谁、什么时候应该停止并回到用户确认。对研究者和平台运营者而言，这比跑通一个聊天脚本更接近现实世界的要求。其次，这个实验验证的是“代理之间能否形成基本商业秩序”。当买家和卖家都由 AI 代理承担时，交易不再是人机协作，而更接近机器与机器之间的协调。这意味着传统电商平台中的部分功能可能被重新定义。过去平台主要服务人类用户，强调界面设计、搜索排序、商家运营和客服体验；未来如果大量请求来自代理，平台可能需要考虑完全不同的一套基础设施，例如机器可读的商品描述、标准化的报价接口、可验证的库存状态、可编程的支付与退款规则、适合代理调用的信誉系统等。换句话说，面向人的互联网长期依赖的是页面、按钮和文案，面向代理的互联网可能更依赖结构化数据、权限协议和执行接口。Anthropic 搭建测试市场的意义，就在于它让这些原本抽象的问题变得具体可讨论。再往深一层看，这项实验其实也是对“AI 代理商业化边界”的提前探路。当前市场上，很多公司都在展示代理如何帮助用户完成复杂任务，例如安排行程、处理行政流程、管理工作流、调用 SaaS 服务等，但真正牵涉到资金流动时，整个行业会立刻变得谨慎。因为一旦涉及真实金钱，容错空间急剧缩小。一个摘要写得不够完美，最多影响体验；一次交易下错单、汇错款、误判条件，直接就是经济损失，甚至可能引发法律问题。正因如此，真实交易实验的价值在于它能帮助行业判断：哪些环节适合完全自动化，哪些环节必须保留人工确认，哪些环节需要新的风控和授权机制。这些答案不会只影响 Anthropic 自己，也会影响未来所有试图把 AI 带进商业流程的平台和应用开发者。从商业逻辑上说，代理对代理交易之所以重要，是因为它指向一个比“聊天助手订阅费”更大的市场想象空间。单纯提供问答或写作功能，商业模式相对直接，但天花板也更容易被看见；而一旦 AI 代理能在采购、销售、定价、售后、谈判、履约协调中承担真实职责，那么它就可能进入交易佣金、企业服务费、流程自动化平台费甚至金融增值服务等更深层的价值链。也就是说，代理不只是软件工具，而可能成为数字经济中的新型参与者。谁掌握代理的身份体系、支付权限、执行接口和信任网络，谁就有机会在未来的商业基础设施中占据核心位置。Anthropic 作为模型公司，做这样一个市场实验，也可以被理解为一种前瞻布局：它不满足于证明模型聪明，而是开始测试模型能否在经济活动中承担角色。不过，任何关于代理经济的乐观叙事，都必须同时面对现实约束。第一个约束就是信任。人们愿意让代理查资料、整理纪要，并不代表愿意让它动用真实资金。哪怕代理只是在用户授权下行动，如何定义授权范围仍然是一个复杂问题。用户是允许它在某个价格区间内自主下单，还是只允许它完成询价后等待确认？如果商品描述存在歧义，代理是否可以自行判断替代方案？如果卖家代理给出含糊承诺，买家代理有没有能力识别风险？这些都决定了代理能够获得多大自主权，而自主权的大小，又直接决定代理商业场景能否真正提升效率。第二个约束是责任归属。传统电商里，出了问题通常可以追溯到商家、平台或用户自身操作；但当中间多了一层代理，责任关系会变得更加模糊。假如买家代理误读了需求，或者卖家代理发布了不准确的信息，平台要追责的是背后的用户、代理提供商，还是平台本身的规则设计？如果未来多个代理由不同公司提供，还会牵涉跨平台责任界面。正因为如此，代理对代理交易不只是技术试验，也是一种治理试验。谁来审计代理行为、谁来保存决策记录、哪些决策可撤销、哪些步骤必须留痕，这些都会成为实际落地前绕不过去的问题。第三个约束来自市场机制本身。真正的市场不是把两个机器人放在一起聊天就自然形成的，它需要标准、激励与约束。卖家代理如果为了成交而过度承诺，买家代理如果为了节省预算而忽视质量风险，最后都会损害市场效率。人类市场经过长期演化，形成了信用评价、售后规则、支付托管、争议处理等一整套机制；而面向代理的市场，则需要把这些机制重新翻译成机器可执行的规则。也就是说，未来的代理市场可能不是今天网页市场的简单复制，而更像是一层新型协议网络。商品要有结构化语义，条款要可解析，支付要可限权，行为要可验证，争议要有回滚与仲裁路径。Anthropic 的测试市场虽然规模有限，却把这些方向提前显露出来。从行业竞争格局看，这类实验也说明大型 AI 公司正在把目光从模型能力竞赛延伸到应用制度设计。过去几年，行业叙事主要是参数规模、推理能力、工具调用、上下文长度与多模态能力；而现在，一个越来越实际的问题是：模型再强，如果无法安全接入资金、平台与供应链，它在商业流程中的价值仍然有限。反过来，如果一家企业能够建立可信的代理执行框架，把模型能力与授权、支付、审计和合规体系组合起来，那么它对企业客户和平台生态的吸引力会大得多。也因此，Anthropic 的实验更像是一种信号：下一阶段的竞争，不只是“谁的模型更会说”，而是“谁能让代理在现实世界中更可靠地做事，并且承担有限但真实的经济职能”。对创业公司和平台方而言，这件事也提供了一个重要启发：未来很多数字产品可能需要同时服务两类用户，一类是人类用户，另一类是代表人类执行任务的 AI 代理。今天的网站、应用和交易系统，大多默认操作者是人，因此流程设计强调可视化、交互引导和人工判断；但未来一旦代理成为高频操作主体，系统就必须补上机器接口、权限分级和异常兜底。比如，商品目录是否足够标准化，库存和价格是否可以实时读取，是否支持细粒度授权，订单状态是否适合自动追踪，客服与售后是否能被代理理解和处理。这些过去常被视作后台效率问题的能力，未来可能直接决定平台是否能进入“代理友好型市场”的第一梯队。从消费者视角看，代理交易的潜力同样明显。很多购物和采购行为本质上是重复性的信息筛选与规则判断，例如按预算寻找符合条件的设备、对比多个版本的服务方案、追踪某类商品何时降价、为固定需求周期性补货等。如果代理能够在明确边界内承担这些工作，人类用户获得的不只是省时间，而是对交易流程的重新分工。人把目标和偏好交代清楚，代理在市场里执行搜索、沟通和初步决策，必要时再把关键节点交回给人确认。这样的协作模式，可能会先在标准化程度高、纠纷概率低、决策规则清晰的品类中出现，然后再慢慢扩展到更复杂的服务交易场景。当然，距离真正成熟的代理市场还有很长的路。它不仅需要更稳定的模型能力，也需要更严格的产品设计原则。代理并不适合被无条件放权，相反，它更适合在被限制的权限框架内逐步扩展职责：先做信息搜集和候选筛选，再做询价和条件比较，再进入限额下单或固定规则采购，最终才可能在某些场景中完成更完整的闭环。这个过程很像自动驾驶的发展路径，不会一步跨到完全自治，而是通过不断明确边界与责任，逐层放开能力。Anthropic 用真实商品和真实资金做测试，恰好说明行业已经开始接受一个事实：代理商业不是只靠演示视频和产品愿景就能说服市场，它需要在真实约束中证明自己。综合来看，Anthropic 搭建代理对代理交易测试市场，是 AI 行业从“能生成内容”走向“能参与经济活动”的一个小而关键的样本。它未必代表代理商业已经成熟，却明确提示了未来的方向：AI 代理不只是工作助手，还可能成为市场中的执行者、协调者甚至交易参与者。真正值得持续观察的，不只是实验是否成功完成了几笔交易，而是它是否能推动行业形成一套更清晰的原则：代理在什么条件下可以代表用户行动，市场如何向代理开放接口，支付与信用如何适配机器参与者，平台又该如何在效率与风险之间建立新平衡。如果这些问题逐步得到回答，那么所谓“代理经济”才可能从口号变成结构，从展示变成基础设施，从想象变成可以运行的商业现实。

Sources

TechCrunch AI