怎么使用语音模式？

在终端中输入/voice命令即可切换。

目前约5%用户，计划数周内全面推送。

竞品有语音功能吗？

GitHub Copilot和Cursor目前都没有原生语音支持。

Claude Code 语音模式上线：从键盘敲击到自然对话，AI 编程交互范式迎来根本性重构

Q: 怎么使用语音模式？

在终端中输入/voice命令即可切换。

Q: 开放范围？

目前约5%用户，计划数周内全面推送。

Anthropic 正式为终端 AI 编程助手 Claude Code 推出语音交互功能，开发者只需在终端输入 /voice 即可切换至语音模式，通过自然语言指令完成代码重构、调试及架构讨论等复杂任务。该功能目前正以 5% 的比例向用户灰度开放，预计数周内全面推送。这一举措标志着 AI 编码工具从单一的文本交互迈向多模态交互时代，旨在降低上下文切换的认知负荷，提升开发效率。

Anthropic 近日宣布为其终端原生 AI 编程助手 Claude Code 引入了一项备受瞩目的新功能——语音模式。这一更新并非简单的界面优化，而是对开发者与 AI 协作流程的一次底层重构。根据官方披露的信息，开发者只需在终端界面中输入特定的命令标识，即可瞬间从传统的文本输入模式切换至语音交互状态。在这一模式下，开发者无需再频繁地在键盘敲代码、在浏览器查阅文档以及在思维中构建逻辑之间进行切换，而是可以直接通过口头指令来驱动代码的生成、重构与调试。目前，该功能正处于小范围的灰度测试阶段，仅对约 5% 的用户开放，Anthropic 计划在接下来的数周内根据测试反馈进行迭代，并最终向所有用户全面推送。这一时间表的紧凑程度，显示出 Anthropic 对于多模态交互在编程场景中落地潜力的极度自信，也预示着 AI 辅助编程工具正在加速从“辅助工具”向“协作伙伴”的角色转变。

从技术原理与交互逻辑的深层分析来看，语音模式的引入解决了长期困扰开发者的一大痛点：认知负荷的碎片化。在传统的 AI 编码工作流中，当开发者面对复杂的代码重构或架构调整时，往往需要在多个应用窗口间来回跳转，或者在脑海中长时间维持一个庞大的上下文结构，然后用精炼的文本指令发送给 AI。这种过程不仅效率低下，而且容易因表达不清导致 AI 理解偏差。语音交互的核心优势在于其“意图表达”的自然性与连续性。人类在口头描述问题时，往往能更流畅地阐述背景、约束条件和最终目标，这种非结构化的自然语言对于大语言模型而言，反而可能比经过精心修饰的提示词包含更多的语义线索。Claude Code 的语音模式背后，依托的是高精度的语音识别技术与强大的语义理解能力的深度融合。它不仅仅是将语音转写为文本，更重要的是在实时流式处理中，保持对代码上下文、文件结构以及之前对话历史的连贯记忆。这意味着，当开发者说“重构这个函数”时，AI 能够结合当前的光标位置、文件内容以及之前的对话语境，精准地定位目标代码块，并执行相应的修改、测试及版本控制操作。这种“所想即所得”的交互体验，极大地缩短了从创意到代码实现的距离，使得编程过程更加接近于人类自然的思维流动。

这一功能的推出，对当前的 AI 编程赛道竞争格局产生了深远的影响，尤其是对标产品 GitHub Copilot 和 Cursor 构成了直接的压力测试。目前，Copilot 和 Cursor 虽然也推出了各自的语音功能或类似的交互优化，但大多停留在辅助层面，或者集成度不如 Claude Code 这样深入终端底层。Claude Code 的语音模式之所以具有差异化竞争力，在于其“终端原生”的定位。它不是在浏览器插件或独立编辑器中运行，而是直接嵌入到开发者的工作流核心——终端中。这意味着语音指令可以直接触发 shell 命令、运行测试套件、管理 Git 版本，甚至处理复杂的构建流程。对于从事后端开发、系统编程或 DevOps 工作的开发者而言，这种深度集成带来的效率提升是颠覆性的。此外，这也加剧了 AI 编程工具在“多模态交互”上的军备竞赛。未来的竞争焦点将不再仅仅是代码生成的准确率，而是如何更自然、更无缝地整合视觉、语音、文本等多种输入方式，以适配不同场景下的开发需求。例如，在代码审查时，语音可能比文本更快捷；在架构设计时，结合草图与语音的交互可能比纯文本更有效。Anthropic 此举显然是在抢占这一高地，试图通过提供更自然的交互入口，来锁定那些对开发效率有极致追求的高价值用户群体。

展望未来，Claude Code 语音模式的全面普及只是 AI 编程交互演进的一个起点。我们可以预见，接下来的发展将围绕“上下文感知的多模态融合”展开。例如，结合屏幕共享功能的语音交互将成为可能，开发者只需指着屏幕上的报错信息说“这里有个 bug”，AI 就能自动定位问题并给出修复建议，无需手动复制粘贴代码片段。此外，随着视觉语言模型的进一步成熟，语音与图形界面的结合也将更加紧密，开发者可以通过手绘架构图并辅以语音说明，让 AI 自动生成相应的代码骨架。对于企业级用户而言，如何确保语音交互中的数据隐私与安全，以及如何将这种交互模式集成到现有的 CI/CD 流程中，将是需要重点关注的信号。Anthropic 需要在开放创新与合规安全之间找到平衡，而整个行业也将借此机会重新审视“人机协作”的定义。当编程不再仅仅是与键盘和屏幕的对话，而是与 AI 伙伴的自然交谈时，软件开发的门槛将被进一步降低，而创造力的释放空间将被无限放大。这一变革才刚刚开始，其深远影响将在未来几年内逐步显现。

Claude Code 语音模式上线：从键盘敲击到自然对话，AI 编程交互范式迎来根本性重构

Sources