Tenstorrent, TT-QuietBox 2 출시: 완전 오픈소스 RISC-V AI 워크스테이션
Tenstorrent TT-QuietBox 2(Blackhole)는 완전 오픈소스 소프트웨어 스택의 RISC-V AI 워크스테이션으로, Nvidia CUDA 지배에 도전.
배경
2026년 3월 14일, RISC-V 아키텍처 기반 AI 칩 기업 텐스트로렌트(Tenstorrent)는 TT-QuietBox 2를 출시했다. 이 제품은 '블랙홀(Blackhole)'이라는 코드명으로 불리며, 컴파일러부터 런타임, 드라이버에 이르기까지 소프트웨어 스택 전체가 완전히 오픈소스로 공개된 세계 최초의 상용 AI 워크스테이션이라는 점에서 큰 주목을 받고 있다. 텐스트로렌트의 창립자이자 CEO인 짐 켈러(Jim Keller)는 출시 행사에서 "AI는 어떤 기업의 독점적인 오픈소스 생태계에 인질로 잡혀서는 안 된다. 개발자는 자신의 코드가 하드웨어에서 어떻게 실행되는지 알 권리가 있다"고 강조하며, Nvidia CUDA 생태계가 주도하는 현재의 AI 하드웨어 시장에 대한 대안적 비전을 제시했다.
TT-QuietBox 2는 텐스트로렌트의 자체 개발 Wormhole AI 가속기 칩 8개를 탑재하여 약 512 TOPS(INT8)의 AI 연산 성능을 제공한다. 비록 절대 성능 면에서는 Nvidia A100 시스템에 미치지 못하지만, 핵심 가치는 투명성에 있다. 개발자는 드라이버 레벨부터 컴파일러, 런타임에 이르기까지 모든 코드를 검사하고 수정할 수 있으며, 이는 데이터 주권과 보안 감사에 민감한 정부, 의료, 금융 기관들에게 '감사 가능한 AI 하드웨어'로서 독특한 가치를 지닌다. 특히 RISC-V의 개방형 명령어 집합 아키텍처는 단일 벤더 종속성을 피할 수 있게 해주며, 오픈소스 스택과 결합되어 AI 연구자들에게 전례 없는 통제력을 제공한다.
심층 분석
TT-QuietBox 2의 기술적 구성은 효율성과 호환성을 최우선으로 고려한 설계 철학을 반영한다. 이 워크스테이션은 8개의 Wormhole n150 칩 외에도 128GB DDR5 메모리, 4TB NVMe SSD, 그리고 SiFive Performance P870 RISC-V 호스트 프로세서를 탑재하고 있다. 전체 시스템 전력 소모는 500W 미만으로, 특별한 전원 공급 장치나 냉각 인프라 없이도 사무실 책상 위에 놓을 수 있으며, 공기 냉각 방식을 사용하여 소음을 35데시벨 이하로 유지한다. 이러한 하드웨어 스펙은 'QuietBox'라는 이름이 시사하듯, 소음과 열 관리에 대한 세심한 공학적 해결책을 보여준다.
소프트웨어 스택은 GitHub에서 Apache 2.0 라이선스로 공개되었으며, 네 가지 주요 구성 요소로 이루어져 있다. 먼저, TT-Metal은 낮은 수준의 런타임과 장치 드라이버 역할을 하며, TT-Forge는 Nvidia TensorRT와 유사한 딥러닝 컴파일러로 PyTorch 및 ONNX 모델을 Wormhole 칩용 최적화된 코드로 자동 컴파일한다. TT-NN은 PyTorch와 호환되는 인터페이스를 제공하는 신경망 라이브러리이며, TT-Studio는 시각적 개발 IDE를 제공한다. 이를 통해 개발자는 기존 생태계와의 마이그레이션을 비교적 수월하게 처리할 수 있다. 텐스트로렌트 블로그에 따르면, ResNet-50 추론 시 TT-QuietBox 2의 처리량은 Nvidia RTX 4090의 약 60% 수준이었으나, Transformer 모델 추론에서는 이 격차가 약 25%까지 좁혀졌다.
가격 전략도 경쟁력 있다. 기본 구성(8개 Wormhole 칩, 64GB 통합 메모리)의 가격은 14,999달러로, 유사한 성능의 Nvidia DGX Station A100이 14만 달러 이상인 것과 비교하면 압도적인 가성비 차이를 보인다. 비록 원자력 연산 지표상 두 제품은 직접 비교하기 어렵지만, 중소기업과 연구기관의 로컬 추론 수요에는 TT-QuietBox 2가 훨씬 실용적인 선택지가 될 수 있다. 짐 켈러 CEO는 "우리는 또 다른 GPU 대안을 만들고 있는 것이 아니다. 우리는 어떤 단일 기업도 통제하지 않는 AI 컴퓨팅 생태계를 구축하고 있다"고 명시했다.
산업 영향
텐스트로렌트의 오픈소스 전략은 AI 칩 경쟁 구도에 새로운 변수를 던졌다. McKinsey의 분석 보고서에 따르면 Nvidia는 전 세계 AI 훈련 GPU 시장의 약 85%를 점유하고 있으며, CUDA의 개발자 잠금 효과(Developer Lock-in)가 가장 강력한 경쟁 장벽이다. 텐스트로렌트는 이러한 잠금 효과를 제거함으로써 공급망 유연성을 원하는 고객들을 끌어들이는 완전히 다른 경쟁 접근법을 취하고 있다. 메타(Meta), 삼성(Samsung), 현대자동차(Hyundai Motor) 등 다수의 주요 기업들이 텐스트로렌트에 공개적으로 투자했으며, 누적 투자액은 10억 달러를 넘어섰다.
글로벌 RISC-V 칩 출하량은 2025년 160억 개를 돌파했으나, 대부분 저전력 임베디드 애플리케이션에 사용되었다. RISC-V 재단 CEO 칼리스타 레몬드(Calista Redmond)는 "이 발표는 RISC-V 아키텍처가 임베디드 및 IoT 애플리케이션을 넘어 고성능 AI 컴퓨팅에서도 능력을 입증했음을 보여준다"며 텐스트로렌트가 RISC-V의 한계를 넓히고 있다고 평가했다. TT-QuietBox 2는 AI 개발자를 타겟으로 한 첫 번째 RISC-V 고성능 워크스테이션이라는 점에서 상징적인 의미를 지닌다.
시장 반응도 주목할 만하다. 일본과 유럽 시장에서 특히 강한 관심이 나타났는데, 사전 주문의 40%는 일본 자동차 산업에서 자율주행 모델의 로컬 추론 테스트를 위해 들어왔고, 30%는 유럽 기업 고객들로부터 나왔다. 유럽 고객들은 데이터 주권 규정으로 인해 AI 추론을 미국 클라우드 제공업체로 업로드하지 않고 온프레미스에서 완전히 유지해야 했기 때문이다. 이는 AI 추론의 '분산화'와 '현지화'라는 emerging market trend를 입증하는 사례다. 또한 삼성, 보쉬(Bosch) 및 여러 유럽 자동차 제조사를 포함하여 20개 이상의 기업과 연구 기관이 텐스트로렌트의 오픈소스 AI 하드웨어 얼라이언스에 가입했다.
전망
단기적으로(3-6개월), 텐스트로렌트의 출시 경쟁사들의 빠른 대응이 예상된다. AI 업계에서 주요 제품 출시나 전략 조정은 보통 수주 내에 경쟁사의 유사 제품 가속화 또는 차별화 전략 수정을 유발한다. 또한 독립 개발자와 기업 기술 팀들은 향후 몇 달 동안 제품 평가를 완료할 것이며, 이들의 채택 속도와 피드백이 이 사건의 실제 영향력을 결정할 것이다. 투자 시장에서도 관련 섹터의 자금 조달 활동이 단기적으로 변동할 수 있으며, 투자자들은 최신 개발 상황에 따라 각사의 경쟁 지위를 재평가할 것이다.
장기적으로(12-18개월), TT-QuietBox 2는 다음과 같은 추세의 촉매제가 될 수 있다. 첫째, AI 능력의 상품화 가속화이다. 모델 간 능력 격차가 좁혀짐에 따라 순수한 모델 능력만으로는 지속 가능한 경쟁 우위가 되기 어렵다. 둘째, 수직 산업별 AI 심화이다. 범용 AI 플랫폼은 깊이 있는 산업별 솔루션으로 대체될 것이며, 산업 전문 지식(Know-how)을 가진 기업들이 우위를 점할 것이다. 셋째, AI 네이티브 워크플로우의 재설계이다. 기존 프로세스를 AI로 보완하는 것을 넘어, AI 능력을 중심으로 전체 워크플로우를 재설계하는 흐름이 강화될 것이다. 넷째, 글로벌 AI 구도의 분화이다. 각 지역은 자체적인 규제 환경, 인재 풀, 산업 기반에 따라 고유한 AI 생태계를 발전시킬 것이다.
향후 발전 상황을 추적할 때 주목해야 할 신호들은 다음과 같다. 주요 AI 기업들의 제품 출시 리듬과 가격 전략 변화, 오픈소스 커뮤니티의 관련 기술 재현 및 개선 속도, 규제 기관의 반응과 정책 조정, 기업 고객의 실제 채택률과 갱신율 데이터, 그리고 관련 인재의 이동 방향과 급여 변화 등이 있다. 이러한 지표들은 이 사건의 장기적 영향과 AI 업계의 다음 단계 방향성을 더 정확하게 판단하는 데 도움이 될 것이다. 텐스트로렌트의 도전이 단순한 하드웨어 대체를 넘어, AI 컴퓨팅의 민주화와 생태계 다양화에 기여할지 주목된다.