Tenstorrent发布TT-QuietBox 2:首款RISC-V桌面AI工作站,全开源堆栈

AI芯片公司Tenstorrent在GDC 2026上正式发布TT-QuietBox 2(代号Blackhole),这是业界首款基于RISC-V架构、可提供万亿次浮点运算级推理能力的桌面AI工作站。该系统采用液冷静音设计,搭载4颗Blackhole处理器(共480个Tensix核心+64个RISC-V大核),128GB GDDR6显存,可在本地运行最高1200亿参数的模型。最关键的是,其软件栈从编译器到内核完全开源(TT-Forge/TT-Metalium/TT-LLK),售价$9,999起。这意味着推理已超越训练成为AI主要负载,本地AI工作站时代正式来临——开发者无需依赖云服务即可运行大规模模型,且拥有完整的硬件透明度。

Tenstorrent发布TT-QuietBox 2:RISC-V桌面AI工作站的破局之作

2026年3月,Tenstorrent正式发布TT-QuietBox 2——一台被定义为"首款RISC-V桌面AI工作站"的设备。这不是一款普通的硬件更新,而是一次对整个AI计算生态的主动挑战:从芯片架构到软件堆栈,全面押注开源。对于长期被Nvidia CUDA生态所主导的AI基础设施市场而言,这款设备的出现值得认真审视。

硬件核心:RISC-V与Wormhole的组合

TT-QuietBox 2的核心是Tenstorrent自研的Wormhole n150s AI加速芯片,搭配基于RISC-V架构的宿主处理器。这一组合在业界颇为罕见——大多数AI工作站依然选择x86(Intel/AMD)或ARM作为主处理器,Tenstorrent的选择是一种明确的技术声明:RISC-V不只是嵌入式场景的选项,它正在向桌面高性能计算迈进。

Wormhole芯片采用Tenstorrent独有的"Tensix"计算核心架构,专为Transformer类模型的大规模推理与训练设计。与GPU的SIMT(单指令多线程)模型不同,Tensix核心通过片上网络(NoC)互联,每个核心独立运行,具备更细粒度的数据流控制能力。这种设计在处理稀疏计算和混合精度任务时理论上具有效率优势,尤其是当模型规模大到单卡无法容纳时,多芯片扩展的代价也更小。

整机定位为"桌面工作站"——静音设计(QuietBox命名的来源)、紧凑机身——这意味着Tenstorrent希望将专业AI计算能力带到个人开发者和小型团队的办公桌上,而不仅仅是数据中心机房。

全开源堆栈:真正的差异化筹码

如果说Wormhole芯片是TT-QuietBox 2的硬件护城河,那么"全开源软件堆栈"才是这款产品最具战略意义的主张。

Tenstorrent的软件体系TT-Metalium(底层内核运行时)和TT-BUDA(高层编译器/框架)均已开源,托管于GitHub。这与Nvidia的封闭CUDA生态形成鲜明对比。用户不仅可以查看源码,还可以修改、定制、甚至在自己的硬件上重新编译整个计算栈。

对开发者而言,这意味着:

可观测性与可控性

当模型推理出现性能瓶颈,开发者可以深入到内核调度层面排查,而不是依赖Nvidia Nsight等黑箱工具。对于需要极致性能优化的场景(比如高频交易中的模型推理、医疗影像实时分析),这种透明度是无价的。

硬件锁定风险降低

Nvidia CUDA生态的最大弊端之一是"锁定效应"——一旦代码深度依赖CUDA,迁移到其他平台的成本极高。开源堆栈理论上允许社区维护跨平台抽象层,降低未来迁移成本。

学术与研究价值

对于AI系统研究者而言,能够在真实硬件上观察完整的软件-硬件交互,是用模拟器无法替代的体验。TT-QuietBox 2有望成为AI系统研究的新型实验平台。

然而,开源并不等同于成熟。当前TT-Metalium的文档完善程度、社区活跃度、以及第三方框架(PyTorch、JAX)的集成质量,仍与CUDA生态存在相当差距。这是Tenstorrent面临的核心挑战。

市场定位:夹缝中的机会

从定价和定位来看,TT-QuietBox 2面向的是一个相对特殊的细分市场:有较强技术能力、关注成本效益、愿意接受非主流工具链的AI开发者或研究机构。

这个市场并不小。随着大模型应用落地加速,越来越多的中小企业和独立开发者需要在本地部署推理服务,云端推理的持续成本让许多人重新考虑自建基础设施。TT-QuietBox 2的桌面形态正好切入这一需求——既比GPU服务器便宜,又比纯CPU推理快得多。

竞争对手方面,AMD的ROCm生态和Intel的oneAPI也在推进开放,但两者都在追赶Nvidia的生态惯性,而非从头构建。Tenstorrent的优势在于它从一开始就以"开放"为设计原则,而非事后补救。

背后的人:Demis Hassabis与Jim Keller

Tenstorrent并非无名之辈。公司CEO Jim Keller是半导体行业的传奇人物,曾主导AMD Zen架构和Apple A系列芯片的设计,被誉为"CPU架构师中的架构师"。他对开放计算的信念不是公关口号,而是有深厚的技术根基支撑。

公司的投资方阵容同样豪华,包括三星、现代等战略投资者,以及多家顶级风险基金。这使得Tenstorrent在资金层面拥有持续研发的底气,不会因为短期市场压力而放弃长期开放路线。

挑战与疑问

当然,TT-QuietBox 2面临的挑战不可回避:

软件生态的成熟度是最大的不确定因素。目前大多数AI工程师的工作流深度依赖PyTorch + CUDA,迁移到Tenstorrent平台需要额外的学习成本和潜在的性能调优工作。如果开箱即用的体验不够顺畅,即使硬件性能再好,市场采用率也会受限。

性能基准的透明度也需要独立验证。Tenstorrent公布的内部基准测试数据往往在理想条件下测得,真实工作负载下的表现如何,需要更多第三方评测。

RISC-V生态的整体成熟度仍在追赶。尽管RISC-V近年来发展迅速,但在高性能计算领域,相关的工具链、操作系统支持、以及开发者社区规模与x86/ARM相比仍有差距。

战略意义:一颗投向AI基础设施的石子

从更宏观的视角来看,TT-QuietBox 2的意义超越了单一产品本身。它代表了一种正在萌芽的趋势:AI计算基础设施的去Nvidia化和开源化。

当AI工作负载日益多样化(从边缘推理到数据中心训练),单一的CUDA生态越来越难以高效覆盖所有场景。多元化的硬件生态不仅有利于降低成本,也有助于推动AI技术本身的进步——当更多研究者能够深入硬件层面实验,创新的边界才会真正扩展。

Tenstorrent能否凭借TT-QuietBox 2在这场竞争中站稳脚跟,取决于接下来12-24个月软件生态的成长速度。但无论结果如何,它已经为AI桌面工作站市场提供了一个真正值得认真对待的选项——这本身已经是一种贡献。