Tenstorrent, TT-QuietBox 2 공개: 완전 오픈소스 스택의 최초 RISC-V 데스크톱 AI 워크스테이션

전설적 칩 아키텍트 짐 켈러가 이끄는 Tenstorrent가 컴파일러부터 커널까지 완전 오픈소스 스택을 갖춘 세계 최초 RISC-V 데스크톱 AI 워크스테이션 TT-QuietBox 2를 공개했습니다. 가격 9,999달러, 수냉 시스템에 Blackhole ASIC 4기 탑재, BlockFP8 기준 2,654 TFLOPS 성능, 128GB GDDR6 + 256GB DDR5로 1,200억 파라미터 모델 로컬 실행이 가능합니다. 2026년 2분기 출하 예정.

배경

2026년 3월, 전설적인 칩 아키텍트 짐 켈러(Jim Keller)가 이끄는 Tenstorrent는 GDC 2026에서 업계의 이목을 집중시키는 제품을 공개했습니다. 바로 'TT-QuietBox 2'로, 이는 코드명 'Blackhole'을 가진 세계 최초의 RISC-V 기반 데스크톱 AI 워크스테이션입니다. 이 기기는 단순한 하드웨어 업데이트를 넘어, NVIDIA의 CUDA 생태계가 장악하고 있는 AI 컴퓨팅 인프라 시장에 대한 명확한 도전장이자 대안입니다. Tenstorrent는 칩셋 아키텍처부터 운영체제 커널에 이르기까지 전 스택을 완전한 오픈소스로 제공함으로써, 개발자들이 클라우드 의존 없이 대규모 모델을 로컬에서 실행할 수 있는 새로운 패러다임을 제시했습니다.

TT-QuietBox 2의 핵심 하드웨어는 Tenstorrent가 자체 개발한 Wormhole n150s AI 가속 칩과 RISC-V 아키텍처 기반의 호스트 프로세서를 결합한 형태입니다. 대부분의 AI 워크스테이션이 여전히 x86(인텔, AMD)이나 ARM을 주 프로세서로 채택하는 것과 달리, Tenstorrent가 RISC-V를 선택한 것은 임베디드 분야를 넘어 데스크톱 고성능 컴퓨팅 영역으로 RISC-V가 진화하고 있음을 증명하려는 기술적 선언입니다. 이 시스템은 4개의 Blackhole ASIC을 탑재하여 BlockFP8 정밀도 기준 2,654 TFLOPS의 연산 성능을 발휘하며, 128GB의 GDDR6와 256GB의 DDR5 메모리를 갖추고 있어 최대 1,200억 파라미터 규모의 모델을 로컬에서 구동할 수 있습니다.

가격은 9,999달러로 책정되었으며, 2026년 2분기부터 전 세계적으로 출하될 예정입니다. 이 제품은 데이터센터용 거대 서버가 아닌, '데스크톱'이라는 폼팩터에 집중했습니다. 수냉 쿨링과 저소음 설계(QuietBox)를 적용하여 일반 사무실 환경에서도 전문적인 AI 컴퓨팅 작업을 수행할 수 있도록 했습니다. 이는 AI 기술이 연구실이나 대형 기업 데이터센터에서 벗어나, 개인 개발자와 소규모 팀의 책상 위까지 확산되고 있음을 시사하는 중요한 지표입니다.

심층 분석

TT-QuietBox 2의 가장 강력한 차별화 요소는 '완전한 오픈소스 스택'입니다. Tenstorrent는 TT-Metalium(하드웨어 런타임), TT-LLK(저수준 커널), 그리고 TT-Forge(컴파일러) 등 소프트웨어의 모든 레이어를 GitHub에 오픈소스로 공개했습니다. 이는 NVIDIA의 CUDA 생태계가 가진 폐쇄성과 정면으로 대립하는 전략입니다. 개발자는 단순히 코드를 실행하는 것을 넘어, 컴파일러의 최적화 과정부터 하드웨어 스케줄링에 이르기까지 전체 파이프라인의 소스를 직접 검토하고 수정할 수 있습니다. 이는 AI 시스템 연구자에게 시뮬레이션이 아닌 실제 하드웨어에서의 상호작용을 관찰할 수 있는 귀중한 실험 플랫폼이 됩니다.

하드웨어 아키텍처 측면에서 Tenstorrent의 Tensix 코드는 NVIDIA GPU의 SIMT(단일 명령어 멀티스레딩) 방식과 근본적으로 다릅니다. Tensix 코드는 온칩 네트워크(NoC)를 통해 상호 연결되며, 각 코어가 독립적으로 데이터를 처리합니다. 이 구조는 Transformer 모델과 같은 대규모 연산에서 데이터 흐름의 세분화된 제어가 가능하게 하여, 특히 희소 연산(sparsity)과 혼합 정밀도 작업에서 효율적인 이점을 제공합니다. 또한, Tenstorrent는 전통적인 DRAM 대역폭 병목 현상을 우회하기 위해 연산 유닛과 고밀도 SRAM을 단일 다이(SoC) 내에 통합했습니다. 이는 메모리 접근 지연을 줄이고 에너지 효율성을 높이는 설계로, 로컬 AI 워크스테이션에서 요구되는 높은 처리량과 낮은 지연 시간을 동시에 만족시킵니다.

실제 성능 검증도 눈여겨볼 만합니다. GDC 2026에서 공개된 라이브 데모에서 TT-QuietBox 2는 Llama 3.1 70B 모델을 초당 476.5개의 토큰 속도로 처리했으며, GPT-OSS 120B 추론과 Flux 이미지 생성, Wan 2.2 비디오 합성 등 다양한 창작 워크로드에서도 안정적으로 작동했습니다. 이는 단순한 벤치마크 수치를 넘어, 실제 복잡한 AI 애플리케이션에서 경쟁력 있는 성능을 입증한 사례입니다. Ubuntu 24.04와 Tenstorrent의 TT-Studio를 기본 제공하여 One-Click 배포가 가능하도록 한 점도 진입 장벽을 낮추는 데 기여했습니다.

산업 영향

TT-QuietBox 2의 등장은 AI 하드웨어 시장의 구조적 변화를 예고합니다. 현재 AI 인프라 시장은 NVIDIA의 CUDA 생태계가 독점하다시피 한 상태이며, 이는 개발자를 특정 벤더에 묶어두는 '벤더 락인(Vendor Lock-in)' 효과를 낳았습니다. 코드가 CUDA에 깊게 의존할수록 다른 플랫폼으로의 마이그레이션 비용은 기하급수적으로 증가합니다. 반면, Tenstorrent의 오픈소스 접근 방식은 이러한 락인 효과를 해소하고, 커뮤니티가 주도하는 크로스 플랫폼 추상화 레이어의 성장을 촉진할 잠재력을 가지고 있습니다. 이는 장기적으로 AI 소프트웨어 생태계의 다양성과 혁신 속도를 높이는 긍정적 요인으로 작용할 수 있습니다.

또한, 이 제품은 '로컬 AI(Local AI)' 시대의 도래를 가속화합니다. 클라우드 추론 서비스는 지속적인 비용 부담과 데이터 주권(Data Sovereignty) 문제를 야기합니다. 특히 금융, 의료, 법률 등 민감한 데이터를 다루는 중소기업(SMB)이나 연구 기관에게, 클라우드에 데이터를 올리는 것은 허용되지 않거나 비효율적인 선택일 수 있습니다. TT-QuietBox 2는 120B 파라미터 모델 수준의 강력한 성능을 데스크톱 가격대에 제공함으로써, 기업들이 자체 인프라를 구축하여 AI를 활용하는 새로운 기준을 제시했습니다. 이는 클라우드 의존도를 낮추고 데이터 프라이버시를 강화하는 방향으로 산업 트렌드를 전환시킬 것입니다.

경쟁 구도에서도 의미 있는 변화가 예상됩니다. AMD의 ROCm과 인텔의 oneAPI도 개방형 생태계를 지향하고 있지만, 이들은 여전히 NVIDIA의 생태적 우위를 따라잡는 데 주력하는 반면, Tenstorrent는 처음부터 '오픈'을 설계 원칙으로 삼았습니다. Jim Keller CEO의 반도체 업계 내 명성과 삼성, 현대 등 전략적 투자자들의 지원은 Tenstorrent가 단기적인 시장 압력 없이 장기적인 생태계 구축에 집중할 수 있는 자금을 보장합니다. 이는 단순한 하드웨어 경쟁을 넘어, AI 컴퓨팅의 민주화를 주도하는 새로운 주체의 등장으로 해석될 수 있습니다.

전망

TT-QuietBox 2가 성공하기 위해 해결해야 할 가장 큰 과제는 소프트웨어 생태계의 성숙도입니다. 현재 대부분의 AI 엔지니어는 PyTorch와 CUDA를 기반으로 한 워크플로우에 익숙해져 있습니다. Tenstorrent 플랫폼으로 전환하려면 추가적인 학습 비용과 성능 튜닝 작업이 필요하며, TT-Metalium의 문서화 완성도, 커뮤니티 활성화 수준, 그리고 주요 프레임워크와의 통합 품질이 CUDA 생태계에 비해 아직은 미흡한 실정입니다. 만약 '출고 후 즉시 사용(Out-of-the-box)' 경험이 매끄럽지 않다면, 하드웨어의 우수한 성능에도 불구하고 시장 채택 속도는 제한될 수 있습니다.

또한, 공개된 성능 데이터의 투명성과 독립적인 검증이 필요합니다. Tenstorrent가 발표한 벤치마크는 이상적인 조건에서 측정된 내부 데이터일 가능성이 높으며, 실제 복잡한 워크로드에서의 성능은 제3자의 평가가 필요합니다. 특히 RISC-V 아키텍처는 고성능 컴퓨팅 분야에서 x86이나 ARM에 비해 도구 체인(Toolchain)과 OS 지원, 개발자 커뮤니티 규모에서 아직追赶 단계에 있습니다. 이러한 생태계 격차를 얼마나 빠르게 좁히느냐가 Tenstorrent의 성패를 가를 것입니다.

그러나 더 넓은 시각에서 볼 때, TT-QuietBox 2는 AI 컴퓨팅 인프라의 'NVIDIA 비(非)화'와 '오픈소스화'라는 거대한 흐름의 시작점을 알리는 신호탄입니다. AI 워크로드가 에지 추론부터 데이터센터 훈련까지 다양해지면서, 단일 생태계로는 모든 요구를 효율적으로 충족하기 어려워지고 있습니다. 2026년은 AI 기술이 실험실을 넘어 산업 현장으로 본격적으로 정착하는 전환점이 될 것으로 예상됩니다. Tenstorrent가 다음 12~24개월 동안 소프트웨어 생태계를 얼마나 빠르게 성장시킬지는 불확실하지만, TT-QuietBox 2는 이미 AI 데스크톱 워크스테이션 시장에 진지하게 고려해야 할 진정한 대안을 제시했습니다. 이는 AI 하드웨어 시장의 다극화를 촉진하고, 궁극적으로 기술 혁신의 지평을 넓히는 중요한 기여가 될 것입니다.

Sources

GamesBeat