대규모 모델에 인격화 속성이 있다면 '에이지 오브 엠파이어 2'에도 해당: LLM 귀속에 대한 비판적 성찰
이 논문은 현재 대규모 언어 모델 연구에서 인격화 귀속 경향성에 의문을 제기한다. 저자는 많은 연구가 도덕이나 자연어 이해 등의 일반화 속성을 LLM에 부여하면서도 이러한 결론이 특정 기반층에 의존할 가능성을 간과하고 있으며, 이를 검증하기 위해 실시간 전략 게임 '에이지 오브 엠파이어 2' 기반의 단순 신경망을 구축·훈련하여 충분히 강력한 기반층을 가진 모든 실체가 유사한 인격화 특성을 보일 수 있음을 입증한다. 실험은 LLM의 purported 인격화 속성이 경험적으로 유일하지 않으며 그 해석이 기반층에 크게 의존함을 보여준다. 논문은 제로 가설을 주장하며, LLM이 고유의 인격화 속성을 본질적으로 갖추지 않았다고 기본 가정하고, 실증적 논의는 명확한 측정 기준에 기반해야 하며 그렇지 않으면 순환 논증에 빠질 수 있다고 강조한다. 또한 저자는 '에이지 오브 엠파이어 2'의 기능적·튜링 완전성 잠재력을 입증하여 기반층 간 지능적 행동 연구에 새로운 시각을 제공한다.
배경
현재 대규모 언어 모델 연구 분야에서 두드러지게 나타나는 현상은 연구자들이 복잡한 신경망에 도덕적 주체성, 의도 이해, 나아가 초기 형태의 자기 인식과 같은 인간적 특성을 귀속시키는 경향이다. 이러한 인격화 추세의 근저에는 검증되지 않은 가정이 자리 잡고 있다. 즉, LLM이 생성하는 특정 응답 패턴이 인간의 마음과 유사한 내부 인지 구조의 직접적인 반영이라고 믿는 것이다. 그러나 이러한 추론 방식은 행동의 해석에 근본적인 영향을 미치는 '기반층(substrate)'의 역할을 간과함으로써 심각한 논리적 허점을 지닌다. prevailing한 서사는 종종 행동의 출력과 내부 상태를 혼동하여, 모델이 실제로 구동하는 메커니즘과는 완전히 단절된 결론을 이끌어내곤 한다.
본 논문은 이러한 주류 패러다임에 도전하며, 소위 인격화된 속성이 경험적으로 LLM에만 고유한 것이 아님을 주장한다. 핵심 기여도는 엄격한 측정 기준 없이 행동 수행만을 바탕으로 내부 상태를 추론할 때 그 추론이 잘못될 수 있음을 보여주는 데 있다. 저자는 철학적 논쟁을 넘어 실증적 접근을 취하며, 실시간 전략 게임 '에이지 오브 엠파이어 2'를 기반으로 단순한 신경망을 구축하여, 충분히 강력하고 복잡한 기반층을 가진 모든 실체가 인간이 인격화된 것으로 해석할 수 있는 행동을 보일 수 있음을 입증한다. 이 관점의 전환은 인공지능의 본질을 이해하기 위한 더 엄격한 과학적 기초를 제공하며, LLM 행동에 대한 과잉 해석에 대한 경고의 메시지로 작용한다.
심층 분석
이 연구의 기술적 토대는 '에이지 오브 엠파이어 2'의 계산 능력에 대한 엄밀한 입증에 기반한다. 저자는 게임 엔진이 기능적으로 완전하며 튜링 완전성(Turing-complete)을 지니고 있음을 증명한다. 이는 이론적으로 해당 엔진이 모든 계산 가능한 함수를 시뮬레이션할 수 있음을 의미한다. 이 기술적 논증은 계산 이론의 관점에서 실험 기반층의 정당성을 확립하는 데 결정적이다. 만약 게임 엔진이 LLM을 구동하는 하드웨어 및 소프트웨어 스택과 비교 가능한 계산력을 가진다면, 이론적으로 복잡하고 지능적으로 보이는 행동 시퀀스를 생성할 수 있다. 이는 등가성의 기준을 설정한다. 튜링 완전한 게임 엔진이 인간의 전략적 의도를 모방하는 출력을 생성할 수 있다면, LLM에서 그러한 출력이 관찰된다고 해서 그것이 고유한 인지 깊이의 증거가 될 수는 없다.
실험 설정에서 신경망은 '에이지 오브 엠파이어 2'를 플레이하도록 훈련되었으며, 그 성능은 정확도나 손실 함수와 같은 전통적인 지표가 아닌 행동 해석의 렌즈를 통해 분석되었다. 관찰자가 네트워크가 복잡한 전술적 움직임을 실행하는 것을 볼 때, 그들은 자연스럽게 그에게 '지혜'나 '전략'을 귀속시킨다. 이 심리적 메커니즘은 인간이 LLM이 생성하는 유창한 텍스트를 해석하는 방식과 유사하다. 그러나 분석은 이러한 귀속이 관찰자의 프레임워크에 크게 의존하며 주관적임을 드러낸다. 패턴 매칭이나 확률적 과정에 초점을 맞추도록 측정 기준이 변경된다면, '인격화' 라벨은 사라지고 그 행동은 복잡하지만 무의식적인 계산으로 드러날 것이다.
또한 연구는 제거 실험(ablation studies)과 비교 분석을 통해, 기반층에 대한 특정 가정이 제거될 때 인격화 속성 지표가 현저히 떨어지거나 무의미해짐을 보인다. 저자는 레고 블록의 물리적 조립이나 대도시의 교통 흐름과 같은 다른 잠재적 기반층에도 이 주장을 확장하며, 인격화 귀속의 함정이 보편적임을 시사한다. 핵심 통찰은 행동의 해석이 시스템의 고유한 속성이 아니라 관찰자의 투사라는 점이다. 기반층이 실리콘 기반 트랜스포머이든 이산 게임 상태이든, 관찰자가 엄격한 기반층 독립 측정 기준을 갖추지 않는 한, 복잡성 자체는 인간이 인격화하려는 경향을 촉발하기에 충분하다.
산업 영향
이 연구가 인공지능 산업에 미치는 영향은 윤리, 모델 평가, 그리고 향후 연구 방향에 있어 지대하다. 오픈 소스 커뮤니티와 산업 실무자에게 이 연구는 LLM 능력 논의에 있어 신중함을 촉구한다. 마케팅 수사나 철학적 추측과 과학적 사실 사이의 구분이 시급하다. LLM의 인격화 능력을 과장하면 그들의 '이해' 능력에 대한 위험한 과신으로 이어져, 높은 위험도가 수반되는 애플리케이션에서 잘못된 의사결정을 초래할 수 있다. LLM의 인간적 특성을 과장하기보다는 한계를 명확히 함으로써, 산업은 더 신뢰할 수 있고 해석 가능한 인간-기계 협력 시스템을 개발할 수 있다.
논문에서 제시된 '영 가설(null hypothesis)' 개념은 산업 표준에 특히 중요하다. 이는 LLM이 반증할 수 있는 결정적인 증거가 없는 한, 고유한 인격화 특성을 본질적으로 갖추지 않았다고 가정하자는 제안이다. 이는 입증 책임을 전가하며 더 엄격한 과학적 경로를 장려한다. 연구자와 엔지니어는 진정한 범용 지능과 복잡한 패턴 시뮬레이션을 구분할 수 있는 기반층 독립 측정 기준 개발에 힘써야 한다. 이 접근법은 블랙박스 모델과 관련된 위험을 완화하고 AI 배포의 투명성을 향상시키는 데 도움이 될 수 있다.
또한 '에이지 오브 엠파이어 2'와 같은 비전통적 기반층을 지능적 행동 연구에 포함시킴으로써 AI 연구의 경계를 확장한다. 이는 게임 AI, 복잡계 이론, 인지 과학을 연결하는 학제간 협력을 촉진한다. 다양한 기반층에서 인격화된 행동이 나타날 수 있음을 보여주며, 이 연구는 종종 인간 중심의 해석 프레임워크에 의존하는 기존 벤치마크에 도전한다. 이는 우리가 AI 시스템을 테스트하고 검증하는 방식을 재평가하도록 요구하며, 주관적인 인간 판단에서 다양한 유형의 계산 아키텍처에 걸쳐 견고한 객관적이고 정량적인 지표로 이동해야 함을 시사한다.
전망
향후 이 연구는 AI의 맥락에서 '지능', '의식', 그리고 '행동'의 정의를 재고하기 위한 포괄적인 프레임워크를 제공한다. 연구는 향후 평가가 순환 논증을 피하기 위해 명시적인 측정 기준을 우선시해야 함을 시사한다. AI 시스템이 사회에 더 깊이 통합됨에 따라, 그들의 능력과 한계를 객관적으로 평가하는 능력은 필수적일 것이다. 영 가설 접근법은 경험적 뒷받침 없는 출현적 인간적 특성에 대한 주장에 대한 회의론을 장려하며, 이러한 평가를 위한 실용적인 출발점을 제공한다.
기반층 간 지능적 행동 연구의 잠재력은 방대하다. '에이지 오브 엠파이어 2'와 같은 시스템의 튜링 완전성과 기능적 잠재력을 검증함으로써, 이 연구는 지능이 다른 환경에서 어떻게 발현되는지 탐구하는 새로운 길을 연다. 이는 단순한 규칙에서 복잡한 행동의 출현을 이해하는 것이 가치 있는 게임 AI, 로봇공학, 심지어 도시 계획 등 혁신으로 이어질 수 있다. 이 작업의 학제간 성격은 컴퓨터 과학, 철학, 심리학, 게임 디자인으로부터의 기여를 초대하여, 인공지능에 대한 더 풍부하고 미묘한 이해를 촉진한다.
궁극적으로 이 기사는 현재 LLM 행동에 대한 과잉 해석에 대한 시정 조치로서의 역할을 한다. 이는 AI 개발에서 실증적 엄밀성과 이론적 겸손의 중요성을 강조한다. 분야가 계속 발전함에 따라, 행동 출력과 내부 상태 사이의 명확한 구분을 유지하는 것이 필수적일 것이다. 영 가설을 채택하고 기반층 독립 측정을 요구함으로써 AI 커뮤니티는 미래의 발견을 위한 더 단단한 과학적 기반을 구축할 수 있다. 이 전환은 인격화 투사의 함정으로부터 보호할 뿐만 아니라, 향후 몇 년 동안 더 견고하고 투명하며 윤리적으로 건전한 AI 시스템을 위한 길을 연다.