DeepMind 데이비드 실버, 인간 데이터 없이 학습하는 AI 개발에 11억 달러 투자 유치

전 DeepMind 연구원 데이비드 실버가 몇 달 전 설립한 영국 AI 연구기관 '이펜터블 인텔리전스'가 11억 달러를 조달, 기업 가치는 51억 달러에 달한다. 동사는 인간의 레이블이나 시범 데이터에 의존하지 않고 자율 학습하는 AI 시스템을 개발하며, AI 산업이 감독 기반 학습에서 생체 영감형 범용 지능으로 전환하는 전환점을 보여주고 있다.

배경

2026년 4월, 인공지능 산업은 전례 없는 분기점을 맞이했습니다. 구글 딥마인드(DeepMind)의 전직 수석 연구원이자 알파고(AlphaGo)와 알파제로(AlphaZero) 개발의 핵심 인물인 데이비드 실버(David Silver)가 설립한 영국 AI 스타트업 '이펜터블 인텔리전스(Ineffable Intelligence)'가 무려 11억 달러의 자금을 조달했다고 발표했습니다. 이 자금 조달 라운드는 동사의 기업 가치를 51억 달러로 평가했으며, 이는 현재 AI 스타트업 역사상 가장 큰 규모의 투자 중 하나로 기록되었습니다. 이 사건은 단순한 금융 거래를 넘어, 인공지능 개발의 패러다임이 기존 방식에서 근본적으로 전환될 수 있음을 시사하는 중요한 신호로 받아들여지고 있습니다.

이펜터블 인텔리전스의 핵심 비전은 인간의 레이블이 달린 데이터나 시범 데이터에 의존하지 않고도 자율적으로 학습할 수 있는 AI 시스템을 구축하는 것입니다. 현재 시장 지배적인 위치를 차지하고 있는 대규모 언어 모델(LLM)과 강화학습(RLHF) 프레임워크는 방대한 양의 인간이 생성하거나 정제된 데이터를 필요로 합니다. 그러나 실버와 그의 팀은 이러한 인간 데이터에 대한 과도한 의존이 비용 문제를 초래할 뿐만 아니라, AI가 진정한 범용 지능(AGI)으로 진화하는 데 본질적인 장벽이 된다고 믿습니다. 이번 거액의 투자는 자본 시장과顶级 기술 전문가들이 이러한 새로운 기술 노선에 대한 강한 신뢰를 보내고 있음을 보여줍니다.

심층 분석

이펜터블 인텔리전스가 추구하는 기술적 접근 방식은 기존 AI의 한계를 극복하기 위한 시도입니다. 현재 주류인 AI 모델들은 통계적 확률에 기반하여 다음 토큰을 예측하는 방식으로 작동하며, 이는 자연어 처리 등에서 뛰어난 성과를 거두었지만 인과 추론 능력의 부재와 환각(Hallucination) 발생 등의 한계를 드러내고 있습니다. 또한, 이러한 모델들은 훈련 데이터의 품질과 시점에 지식을 제한받으며, 개방적이고 동적인 환경에서 지속적으로 스스로를 개선하는 능력이 부족합니다.

반면, 이펜터블 인텔리전스는 인지과학의 '구체적 지능(Embodied AI)'이나 '세계 모델(World Model)' 개념에 더 가까운 경로를 탐구합니다. 이는 AI가 인간이 제공하는 '정답'을 암기하는 대신, 시뮬레이션 또는 실제 환경과의 직접적인 상호작용을 통해 시행착오를 겪으며 물리 법칙과 사회적 상호작용에 대한 내재적 이해를 구축하도록 하는 것입니다. 예를 들어, 자율 학습 로봇은 인간이 어떻게 물건을 잡아야 하는지 미리 가르치지 않아도, 수백만 번의 가상 실험을 통해 중력, 마찰력, 물체의 강체 특성 등을 스스로 발견할 수 있습니다.

실버가 딥마인드 시절 알파제로를 통해 입증한 '자기 대항(Self-play)' 학습은 이러한 비전의 이론적 토대를 제공합니다. 알파제로는 인간 데이터 없이 단순히 '이기기'라는 목표만으로 수백만 가지의 변형을 탐색하며 인간을 초월한 전략을 발견했습니다. 이펜터블 인텔리전스는 이러한 개념을 정의된 보상 함수가 없는 열린 환경으로 확장하고 있습니다. 이를 위해서는 AI가 자체적으로 목표를 생성하는 내재적 동기(Intrinsic Motivation) 메커니즘과, 환경의 내부 표현을 구축하여 결과를 예측하는 모델 기반 강화학습(Model-based Reinforcement Learning) 기술의 혁신이 필요합니다. 11억 달러의 자금은 이러한 고투자의 알고리즘 실험을 위한 컴퓨팅 자원을 확보하는 데 사용될 것입니다.

산업 영향

이펜터블 인텔리전스의 등장은 기존 AI 산업 생태계에 중대한 영향을 미칠 것으로 예상됩니다. 현재 AI 경쟁은 주로 컴퓨팅 인프라, 데이터 독점, 모델 규모 확대에 집중되어 있으며, 오픈AI(OpenAI), 구글 딥마인드, 앤트로픽(Anthropic) 등 주요 기업들이 막대한 자금과 데이터 우위를 바탕으로 높은 진입 장벽을 구축해 왔습니다. 그러나 데이터 수집 비용의 상승과 인간 주석 데이터의 한계에 직면하면서, 기존 성장 모델의 지속 가능성에 대한 우려가 커지고 있습니다.

이펜터블 인텔리전스의 성공은 '데이터 hungry' 모델에 대한 대안이 존재함을 입증하며, 자본과 인재가 자율 학습 및 강화학습 연구로 재배치되는 계기가 될 수 있습니다. 만약 자율 학습 기술이 실질적인 돌파구를 마련한다면, 고품질 인간 데이터를 보유한 기업의 우위가 약화되고, 강력한 알고리즘 능력과 시뮬레이션 환경 구축 능력을 갖춘 기업이 새로운 경쟁 우위를 점할 수 있습니다. 이는 기존 AI 거대 기업들이 기술 스택을 재평가하고 무감독 학습 및 자율 탐색 방향으로 빠르게 전환하도록 압박할 것입니다.

또한, 이 트렌드는 데이터 주석 서비스 산업에도 영향을 미칠 것입니다. AI 시스템이 인간 데이터 없이 학습할 수 있게 되면, 대규모 인간 개입 훈련에 대한 수요가 감소하여 데이터 라벨링 기업들의 시장이 위축될 수 있습니다. 반면, 시뮬레이션 환경 제공, 컴퓨팅 인프라, 고급 알고리즘 연구 기업들의 가치 상승이 기대됩니다. 특히 자율 학습은 물리적 상호작용에 적합하므로, 로봇공학 및 구두체 AI 분야에 대한 관심이 재점화될 가능성이 높습니다.

전망

앞으로 이펜터블 인텔리전스의 발전 궤적은 AI 기술 진화의 중요한 지표가 될 것입니다. 단기적으로 시장은 해당사의 기술 원형이 복잡한 작업에서 기존 강화학습 알고리즘을 능가하는 자율 학습 능력을 갖추었는지 주시할 것입니다. 중기적으로 이 기술 노선이 타당성이 입증된다면, 자율 학습 분야로 새로운 스타트업 물결이 형성되고顶尖 인재와 자본이 유입되는 AI 창업의 새로운 물결을 이끌 수 있습니다.

장기적으로 이는 AI 발전이 '인간 모방'에서 '인간 초월' 단계로 진입하는 전환점이 될 수 있습니다. AI가 더 이상 인간 지식의 단순 복사본이 아니라, 독립적인 인지 능력을 갖춘 에이전트로 진화할 수 있음을 의미합니다. 물론 이 과정은 막대한 기술적 도전과 불확실성을 수반합니다. 자율 학습 AI의 행동은 더 예측 불가능하며, 인간 감독 없이도 인간의 가치와 일치하도록 보장하는 것은 어려운 과제입니다.

하지만 데이비드 실버의 이러한 시도는 AI의 궁극적 목표가 다음 단어를 더 잘 예측하는 것이 아니라, 세계를 더 잘 이해하고 적응하는 것임을 상기시킵니다. 이펜터블 인텔리전스가 이 비전을 실현할 수 있다면, 그것은 인공지능 역사에서 진정한 이해의 시대로 나아가는 전환점이 될 것입니다. 11억 달러의 투자는 이러한 미래에 대한 베팅이며, 산업이 새로운 패러다임을 수용할 준비가 되어 있음을 보여줍니다. 이 탐구 과정에서 주류와 다른 시도는 진보적인 AI의 핵심 열쇠를 담고 있을 수 있으므로, 기술적 다양성을 존중하고 개방적인 태도를 유지하는 것이 중요합니다.

Sources

TechCrunch AI