즈푸 GLM-5 오픈소스 744B 모델: Huawei Ascend 칩으로 전체 훈련, 환각률 사상 최저

즈푸AI의 GLM-5는 총 파라미터 744B, 활성 파라미터 40B의 MoE 아키텍처 오픈소스 LLM이다. 28.5조 토큰으로 훈련, Huawei Ascend 칩+MindSpore로 전체 훈련하여 NVIDIA 비의존. MIT 라이선스, 205K 컨텍스트 윈도우, 추론·코딩·에이전트 벤치마크에서 오픈소스 최고 수준.

배경

2026년 2월, 중국 AI 기업 즈푸(Zhipu AI)가 공개한 GLM-5는 글로벌 오픈소스 대형언어모델(LLM) 시장에서 파장을 일으킨 주요 사건으로 기록되었다. 총 파라미터 7440억 개, 활성 파라미터 400억 개를 가진 Mixture of Experts(MoE) 아키텍처를 채택한 GLM-5는 28.5조 토큰의 방대한 데이터로 학습되었다. 이 모델의 가장 주목할 만한 특징은 전 과정 NVIDIA 하드웨어 없이, 오직 화웨이(Huawei)의昇腾(Ascend) 칩과 MindSpore 프레임워크만을 사용하여 훈련되었다는 점이다. MIT 라이선스로 공개된 GLM-5는 205K의 긴 컨텍스트 윈도우를 지원하며, DeepSeek의 Sparse Attention(DSA) 기술을 도입하여 장문 처리 효율성을 극대화했다.

이 발표는 단순한 기술 업그레이드를 넘어, 2026년 초 미국산 칩 수출 통제 하에서도 중국 AI 산업이 독자적인 생태계를 구축하고 있음을 증명하는 상징적인 사건이다. OpenAI가 1100억 달러의 역사적 투자를 유치하고, Anthropic의 시가총액이 3800억 달러를 돌파하며 xAI가 SpaceX와 합병하여 1.25조 달러의 가치를 형성하는 등 글로벌 AI 경쟁이 격화되는 가운데, GLM-5의 등장은 기술적 자립성과 상업화 전환의 중요한 이정표로 평가받는다. 업계 분석가들은 이를 단순한 벤치마크 경쟁이 아닌, AI 산업의 구조적 변화와 공급망 재편의 신호로 해석하고 있다.

심층 분석

GLM-5의 기술적 혁신은 하드웨어 의존도 탈피와 알고리즘 최적화라는 두 가지 축에서 확인할 수 있다. 먼저, 화웨이昇腾 칩과 MindSpore 프레임워크의 결합은 NVIDIA의 CUDA 생태계에 대한 대안적 경로의 실증적 성공을 의미한다. 과거 중국 AI 기업들이 NVIDIA GPU에 의존할 수밖에 없었던 구조적 한계를, 화웨이의 하드웨어 성능과 소프트웨어 스택의 성숙도를 통해 극복한 것이다. 이는 미국산 반도체 제재가 중국 AI 발전의 발목을 잡지 못하며, 오히려 국내 칩 생태계 성장을 촉진하는 역설적인 결과를 낳았음을 보여준다.

소프트웨어 및 알고리즘 측면에서는 DeepSeek Sparse Attention(DSA) 기술이 핵심 역할을 했다. 205K에 달하는 긴 컨텍스트 윈도우에서도 계산 자원을 효율적으로 분배함으로써, 장문 문서 분석 및 복잡한 추론 작업에서의 성능 저하를 최소화했다. 또한 즈푸AI가 자체 개발한 'slime'이라는 비동기 강화학습(Reinforcement Learning) 인프라는 훈련 효율성을 획기적으로 높였다. 이 시스템은 모델의 학습 과정에서 발생하는 병목 현상을 해결하여, 더 적은 자원으로도 높은 품질의 정렬(Alignment)을 달성할 수 있게 했다. 그 결과 GLM-5는 오픈소스 모델 중 역사상 최저 수준의 환각(Hallucination)률을 기록하며 신뢰성을 입증했다.

성능 면에서 GLM-5는 추론, 코딩, 에이전트(Agent) 벤치마크에서 오픈소스 모델 중 최상위권을 기록했으며, 클로디아(Claude) Opus 4.5와 GPT-5.2와 동등한 성능을 보인다고 주장한다. 특히 3월에 출시된 GLM-5-Turbo는 OpenClaw 및 자동화 에이전트 시나리오에 최적화되어, 긴 체인의 에이전트 작업에서 지연 시간(latency)과 처리량(throughput)을 대폭 개선했다. 이는 GLM-5가 단순한 텍스트 생성을 넘어, 실제 업무 자동화와 복잡한 문제 해결을 위한 에이전트 플랫폼으로서의 잠재력을 입증했음을 시사한다.

산업 영향

GLM-5의 등장은 AI 산업의 공급망과 개발자 생태계에 중대한 영향을 미치고 있다. 우선, 하드웨어 측면에서 NVIDIA 중심의 일원화된 생태계에서 다극화된 구조로의 전환을 가속화하고 있다. 화웨이昇腾 칩의 성공적인 활용은 다른 중국 AI 기업들에게도 국내 칩을 대체재로 고려하도록 유도하며, 글로벌 반도체 시장의 수요 구조를 변화시키고 있다. GPU 공급이 여전히 긴박한 상황에서,昇腾 칩 기반의 훈련 파이프라인은 새로운 대안으로서의 가치를 인정받고 있으며, 이는 향후 AI 인프라 투자 방향에도 영향을 줄 것으로 예상된다.

소프트웨어 및 개발자 생태계에서는 오픈소스 모델의 경쟁력이 더욱 중요해지고 있다. MIT 라이선스로 공개된 GLM-5는 기업 및 개발자들이 자유롭게 수정하고 배포할 수 있게 함으로써, 상업용 모델에 대한 의존도를 낮추는 효과를 낳았다. 이는 '백모대전(수많은 모델의 경쟁)' 구도에서 개발자들이 기술 선택 시 가격, 라이선스, 생태계 건강성 등 더 다양한 요소를 고려하게 만드는 계기가 되었다. 또한, GLM-5의 성공은 중국 내 DeepSeek, 퉁이천원(통의천문), Kimi 등 다른 국산 모델들의 경쟁을 더욱 치열하게 만들며, 글로벌 오픈소스 AI 생태계의 판도를 재편하는 요인으로 작용하고 있다.

인재 시장에서도 파급 효과가 나타나고 있다. AI 연구원 및 엔지니어들은 이제 단순히 모델의 성능뿐만 아니라, 해당 모델이 구축된 하드웨어 및 소프트웨어 생태계의 지속 가능성을 중시하는 경향이 강해졌다. GLM-5와 같은 성공 사례는 국내 칩 생태계와 연계된 인재들의 가치를 상승시키고 있으며, 이는 장기적으로 중국 AI 산업의 인적 자원 구조에도 변화를 가져올 것으로 보인다.

전망

단기적으로(3~6개월), GLM-5의 영향력은 경쟁사의 빠른 대응과 개발자 커뮤니티의 수용도를 통해 가시화될 것이다. OpenAI, Anthropic 등 주요 기업들은 GLM-5의 성능에 대응하기 위해 자체 모델의 업데이트 속도를 높이거나, 가격 전략을 조정할 가능성이 크다. 개발자들과 기업 기술 팀들은 GLM-5를 실제 프로젝트에 적용하며 피드백을 제공할 것이며, 이 과정에서 모델의 실용성과 안정성이 검증되면 오픈소스 생태계 내에서의 입지는 더욱 공고해질 것이다. 또한, 투자 시장에서는 GLM-5의 성공이 화웨이昇腾 칩 관련 기업 및 즈푸AI와 같은 오픈소스 중심 기업들에 대한 재평가를 유도할 것으로 예상된다.

장기적으로(12~18개월), GLM-5는 AI 기술의 상품화와 수직 산업 심화라는 두 가지 트렌드를 가속화하는 촉매제 역할을 할 것이다. 모델 간의 성능 격차가 좁혀지면서 순수한 모델 능력만으로는 지속 가능한 경쟁 우위가 되기 어려워지고, 특정 산업의 지식(Know-how)과 결합된 솔루션의 가치가 더욱 부각될 것이다. GLM-5와 같은 고성능 오픈소스 모델은 이러한 수직 산업 솔루션의 기반 기술로 널리 활용될 가능성이 높다. 또한, AI가 기존 업무 프로세스를 보완하는 수준을 넘어, AI를 중심으로 한 새로운 워크플로우를 설계하는 'AI 네이티브' 시대로의 전환이 가속화될 전망이다.

글로벌 AI 생태계는 지역별 규제 환경, 인재 풀, 산업 기반에 따라 더욱 분화될 것이다. 중국은 자체 칩 생태계와 오픈소스 모델을 통해 미국, 유럽, 기타 지역과 차별화된 경로를 모색하고 있으며, GLM-5는 이러한 '중국형 AI 스택'의 완성도를 보여주는 사례가 되었다. 향후 데이터 프라이버시, AI 의사결정의 투명성, 국경 간 AI 거버넌스协调 등 새로운 도전 과제가 대두됨에 따라, GLM-5와 같은 투명하고 검증 가능한 오픈소스 모델의 중요성은 더욱 커질 것이다. 투자자들은 이제 과열된 시장 분위기에서 실제 경쟁력을 갖춘 기업들을 선별하는 데 집중할 것이며, GLM-5의 성공은 이러한 가치 평가 기준의 변화를 선도할 것으로 보인다.