Tenstorrent发布TT-QuietBox 2:完全开源软件栈的RISC-V AI工作站

Tenstorrent推出TT-QuietBox 2(代号Blackhole),一款基于RISC-V架构的AI本地推理工作站,最大特点是完全开源的软件栈——从编译器到运行时,开发者可以检查、修改和控制计算的每一层。这在Nvidia CUDA生态主导的AI硬件市场中极为罕见。RISC-V的开放指令集架构意味着不受任何单一厂商锁定,配合开源软件栈,为AI研究者提供了前所未有的透明度和可控性。对于注重数据主权和安全审计的机构(如政府、医疗、金融),这种「可审计AI硬件」具有独特价值。虽然性能暂时无法与Nvidia顶级GPU竞争,但Tenstorrent的开放策略代表了AI硬件生态多元化的重要方向,有望打破Nvidia的软件生态垄断。

RISC-V架构AI芯片公司Tenstorrent于2026年3月14日发布了TT-QuietBox 2,这是全球首款采用完全开源软件栈的商用AI工作站。该产品搭载了Tenstorrent自研的Wormhole AI加速芯片,配合完全开源的编译器、运行时和驱动程序,为AI开发者提供了一个不依赖任何闭源软件的完整开发环境。

Open Source For U对这一发布进行了首篇深度报道。TT-QuietBox 2搭载了8块Wormhole n150芯片,总计提供约512 TOPS(INT8)的AI算力。虽然在绝对性能上与NVIDIA A100系统仍有差距,但其完全开源的软件栈意味着开发者可以深入了解和修改从驱动层到编译器到运行时的每一行代码。Tenstorrent创始人兼CEO Jim Keller(前AMD Zen架构设计师、前Apple A系列芯片架构师)在发布会上表示:「AI不应该被任何公司的闭源生态绑架。开发者应该有权知道他们的代码在硬件上是如何执行的。」

Tom's Hardware的评测文章对TT-QuietBox 2的硬件规格进行了详细解析。工作站采用塔式设计,尺寸与标准台式机相当,风冷散热、噪音控制在35分贝以下(因此得名QuietBox)。除8块Wormhole芯片外,还配备了128GB DDR5内存、4TB NVMe SSD和一颗SiFive Performance P870 RISC-V主处理器。整机功耗控制在500瓦以内,无需特殊电源或散热设施,可以放在办公桌上使用。售价为15000美元,预计4月中旬开始发货。

The Register的技术分析深入探讨了Tenstorrent软件栈的开源策略。整个软件栈以Apache 2.0许可证发布在GitHub上,包含四个主要组件:TT-Metal(底层运行时和设备驱动)、TT-Forge(深度学习编译器,类似NVIDIA TensorRT)、TT-NN(神经网络库,兼容PyTorch接口)和TT-Studio(可视化开发IDE)。目前TT-Forge已支持将PyTorch和ONNX模型自动编译为Wormhole芯片的优化代码,模型迁移的工程量相对较小。

RISC-V International基金会CEO Calista Redmond在声明中高度评价了TT-QuietBox 2的发布:「这证明了RISC-V架构不仅能用于嵌入式和IoT设备,也能胜任高性能AI计算。Tenstorrent正在开拓RISC-V的新边疆。」RISC-V基金会的数据显示,2025年全球RISC-V芯片出货量已突破160亿颗,但绝大多数用于低功耗嵌入式场景,TT-QuietBox 2是首款面向AI开发者的RISC-V高性能工作站。

Tenstorrent Blog上的技术博文提供了一些初步的性能数据。在ResNet-50推理任务上,TT-QuietBox 2的吞吐量约为NVIDIA RTX 4090的60%,但在Transformer模型推理上差距缩小到约25%。博文承认在生态系统成熟度上与NVIDIA CUDA仍有显著差距,但强调开源软件栈的优势在于社区可以自由贡献优化,长期来看有望缩小差距。

这一发布也引发了关于AI芯片竞争格局的更广泛讨论。当前NVIDIA通过CUDA生态系统建立了几乎垄断性的护城河。麦肯锡的分析报告指出,NVIDIA在全球AI训练GPU市场的份额约为85%,CUDA的开发者锁定效应是其最强的竞争壁垒。Tenstorrent的开源策略代表了一种完全不同的竞争路径——通过消除锁定效应来吸引那些希望保持供应链灵活性的客户。包括Meta、三星和现代汽车在内的多家公司已公开投资Tenstorrent,累计融资超过10亿美元。

从商业化前景来看,TT-QuietBox 2的定价策略非常激进。基础配置(8颗Wormhole芯片、64GB统一内存)售价14999美元,而性能大致相当的NVIDIA DGX Station A100的起售价超过14万美元——虽然两者在纯性能指标上并不直接可比(DGX的绝对算力更高),但对于中小企业和研究机构的本地推理需求来说,TT-QuietBox 2的性价比优势是压倒性的。

日本和欧洲市场对这款产品表现出了特别强烈的兴趣。据Tenstorrent透露,预购订单中有40%来自日本(其中大部分来自汽车行业,用于自动驾驶模型的本地推理测试),30%来自欧洲(主要是受数据主权法规驱动的企业客户,他们需要将AI推理完全保留在本地而非上传到美国云服务商)。这验证了一个正在兴起的市场趋势:AI推理的「去中心化」和「本地化」。

开源生态方面,Tenstorrent的策略与NVIDIA形成了鲜明对比。NVIDIA的CUDA虽然文档丰富且社区庞大,但核心代码完全闭源,开发者无法看到也无法修改底层实现。TT-QuietBox 2的完全开源意味着学术研究者可以深入到硬件抽象层来研究AI加速器的设计原理,这对于培养下一代AI硬件工程师具有重要的教育意义。目前已有超过20家公司和研究机构加入了Tenstorrent的开源AI硬件联盟,包括三星、Bosch和多家欧洲汽车制造商。Jim Keller在发布会上表示:「我们不是在做另一个GPU替代品,而是在建设一个不被任何单一公司控制的AI计算生态系统。」