从Tokenmaxxing到成本焦虑:企业AI投资回报的量化困境与理性回归
今年初硅谷盛行的"Tokenmaxxing"风潮正迅速退去,企业开始直面AI高昂的使用成本。据报道,Uber在数月内耗尽全年AI预算,部分公司削减Claude许可证,标志着AI采购策略的重大转折。NEA合伙人Tiffany Luck指出,尽管AI工具部署量持续攀升,但大多数企业仍难以量化实际回报。这一现象表明,行业正从盲目追求技术采用的狂热期,转向对价值与成本进行审慎评估的新阶段,企业亟需建立更精细的AI投入产出评估体系。
今年早些时候,硅谷科技圈流行着一个略显戏谑却极具代表性的术语——“Tokenmaxxing”,意指不计成本、尽可能多地消耗AI令牌以最大化模型使用量的行为。彼时,众多科技巨头的首席执行官们极力鼓励员工在各类工作场景中激进地引入人工智能工具,仿佛只要使用量足够大,技术红利便会自动降临。然而,随着账单的如期而至,这股狂热浪潮迅速降温。据TechCrunch等媒体披露,出行巨头Uber在短短几个月内便耗尽了其全年的AI专项预算,这一案例成为行业成本失控的缩影。与此同时,部分企业已开始采取收缩策略,例如针对特定业务线削减Claude等高级大模型的许可证权限,采购团队也被迫重新审视并调整既有的AI支出计划。NEA合伙人Tiffany Luck近期指出,尽管AI工具的部署数量仍在持续攀升,但大多数企业正陷入如何准确量化其实际投资回报率的挣扎之中,这标志着整个行业正从无序的部署狂潮转向对价值进行冷静评估的关键节点。
深入剖析这一现象背后的技术与商业逻辑,我们可以发现“Tokenmaxxing”的本质是企业在技术不确定性下的防御性焦虑与探索性试错。在生成式AI爆发的初期,企业普遍存在“错失恐惧症”(FOMO),担心不全面拥抱AI会在竞争中落后。因此,管理层倾向于通过鼓励全员高频使用来快速积累数据、打磨工作流并验证技术边界。然而,大语言模型的成本结构具有显著的规模效应与非线性特征。随着并发请求量的激增,推理成本往往呈指数级增长,尤其是当企业从简单的问答场景转向复杂的代码生成、长文档分析或多步推理任务时,令牌消耗量会远超初期预估。此外,许多企业在部署初期缺乏细粒度的成本监控机制,未能区分高价值场景与低效滥用。这种粗放式的管理方式导致AI从一种提升效率的工具,异化为吞噬预算的黑洞。Tiffany Luck所强调的“量化困境”,核心在于企业尚未建立起将AI使用数据与业务KPI(如代码提交率、客服解决时长、内容产出效率)紧密挂钩的评估模型。没有清晰的ROI定义,企业便无法判断哪些AI交互产生了真实价值,哪些仅仅是资源浪费。
这一转变对行业竞争格局及相关利益方产生了深远影响。对于云服务商和大模型提供商而言,单纯依靠“用量增长”的叙事已难以维持高估值,市场开始关注其服务的实际商业转化能力。Uber等头部企业的预算危机向市场释放了明确信号:AI不再是无需考虑边际成本的公共品,而是需要严格成本控制的商业基础设施。这促使AI供应商不得不从“卖算力”转向“卖解决方案”,提供更具性价比的专用模型、优化推理效率或推出基于结果付费的商业模式。对于中小企业而言,这一趋势既是挑战也是机遇。挑战在于,它们可能因缺乏规模效应而面临更高的单位成本压力;机遇在于,那些能够率先建立精细化AI治理框架、精准定位高ROI应用场景的企业,将在下一轮竞争中建立起显著的效率壁垒。同时,这也催生了新兴的AI成本优化(FinOps for AI)工具市场,帮助企业管理令牌消耗、优化提示词效率并监控异常使用行为。
展望未来,企业AI战略将进入“精耕细作”阶段。我们预计,越来越多的公司将设立专门的AI治理委员会,负责制定内部AI使用政策、成本分摊机制及效果评估标准。技术层面,小型化、专用化的模型将在特定垂直领域取代通用大模型,以降低成本并提高准确性。此外,随着评估体系的成熟,AI采购将从“全面铺开”转向“精准打击”,企业将更倾向于为那些能直接证明效率提升或收入增长的特定场景付费。值得关注的信号是,那些能够成功将AI成本纳入常规运营指标,并实现从“探索期”到“规模化盈利期”过渡的企业,将在未来的市场洗牌中占据主导地位。对于投资者和行业观察者而言,关注点应从AI工具的采用率转向其实际产生的经济效益,这将是一场关于技术落地能力与商业智慧的持久战。