UTokyo Releases 14.2B-Param Japanese Medical Multimodal Model

배경

2026년 3월, 도쿄대학 첨단과학기술연구센터(RCAST)와 일본 리켄(RIKEN)의 공동 연구진은 142억 파라미터 규모의 일본어 특화 의료 멀티모달 기반 모델을正式发布했습니다. 이 모델은 안도 겐이치로 특별연구원, 쿠로세 유스케 특임강사, 하라다 다츠야 교수 등 핵심 연구진에 의해 개발되었으며, 2026년 3월 9일부터 13일까지 열린 자연어처리학회 제32회 연차총회에서 공식 발표되었습니다. 이 기술은 단순한 학술적 성과를 넘어, 일본 의료 AI 생태계에서 '일본어 특화', '의료 전문성', '병원 내 로컬 배포 가능성'이라는 세 가지 차원이 교차하는 독특한 생태적 지위를 차지하고 있습니다. 특히 이 모델은 외부 클라우드 서비스와의 연결 없이도 병원 내부 서버에서 작동하도록 설계되어, 환자 개인정보 보호와 AI 기반 진단 보조라는 두 가지 목표를 동시에 달성할 수 있는 실용적인 솔루션을 제시합니다.

일본 의료 시스템은 영어 기반의 글로벌 의료 AI 모델들이 직면하지 못한 고유한 장벽과 요구사항을 가지고 있습니다. 일본 의료 현장에서는 진료 기록, 검사 보고서, 환자 소통이 거의 전적으로 일본어로 이루어지며, 기존 영어 의료 AI인 Google Med-PaLM 2나 Microsoft BioGPT는 이러한 현지화 없이 바로 적용하기 어렵습니다. 또한 일본의 개인정보보호법(APPI) 및 관련 의료 데이터 규정은 환자 데이터의 국경 간 전송에 엄격한 제한을 두고 있어, 해외 클라우드에 의료 데이터를 업로드하는 것은 법적 리스크와 신뢰성 문제를 야기합니다. 더구나 일본은 65세 이상 인구가 29%를 넘어선 초고령 사회로, 의료 수요 증대에 비해 의사 및 간호사 인력 증가는 제한적이므로, AI를 통한 의료 자원 효율화는 국가적 시급사항입니다.

심층 분석

142억 파라미터라는 모델 규모의 선택은 수백억에서 수조 파라미터를 자랑하는 현재의 거대 언어 모델(Large Language Model) 트렌드 속에서 '중규모'로 보일 수 있으나, 이는 실용성을 위한 신중한 기술적 타협입니다. NVIDIA A100 또는 H100 GPU가 탑재된 병원 내부 서버에서 추론을 실행할 수 있는 이 규모는, 민감한 환자 데이터를 외부로 유출하지 않으면서도 실시간 임상 보조에 필요한 지연 시간(latency) 요구사항을 충족시킵니다. 700억 파라미터 이상의 초거대 모델에 비해 추론 속도가 현저히 빠르기 때문에, 임상 현장에서 2초와 30초의 응답 시간 차이는 모델의 실제 유용성을 결정짓는 핵심 요소가 됩니다. 또한 미국 초거대 기업들에 비해 대규모 컴퓨팅 클러스터 접근이 상대적으로 제한된 일본의 GPU 환경에서, 이 규모는 모델의 성능과 학습 가능성 사이의 최적점을 찾았습니다.

모델의 멀티모달 아키텍처는 흉부 X-ray, CT 스캔, MRI, 병리 슬라이드와 같은 의료 영상 데이터와 진료 기록, 검사 보고서, 임상 가이드라인과 같은 일본어 텍스트 데이터를 동시에 처리할 수 있습니다. 이를 통해 모델은 의료 영상의 초기 분석 및 일본어 설명 생성, 주요 임상 정보의 구조화된 요약 추출, 영상과 텍스트 정보를 결합한 임상 질문 답변, 그리고 텍스트 기반 영상 검색이나 영상 기반 문헌 검색과 같은 다양한 임상 보조 작업을 수행할 수 있습니다. 이러한 멀티모달 융합 능력은 단순한 정보 처리를 넘어, 방사선과나 병리과 등 특정 진료 과목의 워크플로우에 깊게 통합될 수 있는 잠재력을 지니고 있습니다.

가장 주목할 만한 기술적 결정 중 하나는 학습 데이터 전략입니다. 연구진은 일본어 의료 코퍼스를 처음부터 구축하는 대신, '영어 데이터 처리 → 일본어 변환' 전략을 채택했습니다. 이는 방대한 영어 의료 문헌과 데이터셋의 자원을 활용하여 번역 및 적응 과정을 거쳐 일본어 학습 데이터로 전환한 것입니다. 동시에 연구진은 ChatGPT 등 대형 언어 모델의 출력을 학습 데이터로 사용하지 않았음을 명시했습니다. 이는 모델 증류(distillation)로 인한 저작권 및 이용약관 분쟁을 피하고, 학습 데이터의 학술적 독립성과 규제 준수를 보장하며, 의료 분야에서 치명적인 오진 위험을 초래할 수 있는 LLM의 환각(hallucination) 현상이 의료 컨텍스트로 전파되는 것을 방지하기 위한 결정입니다. 이러한 접근법은 모델이 사용 제한이 없는 완전한 오픈 라이선스로 배포될 수 있는 기반이 되었습니다.

산업 영향

경쟁 모델과의 비교 분석을 통해 이 모델의 독창성이 더욱 명확해집니다. Google Med-PaLM 2는 약 5400억 파라미터를 가지며 영어에 특화되어 있고 멀티모달 지원이 제한적이며 폐쇄형 모델입니다. Microsoft BioGPT는 15억 파라미터로 오픈소스이지만 영어 전용이며 멀티모달 기능이 없습니다. OpenBioLLM과 MedCLIP 역시 영어 기반이거나 멀티모달 기능이 부족합니다. 반면, 도쿄대학 모델은 '일본어 + 멀티모달 + 오픈소스 + 병원 내 배포 가능'이라는 조합을 제공하며, 현재 공개된 어떤 모델도 이러한 기능의 조합을 제공하지 않습니다. 이는 일본 의료 AI 생태계를 위한 범주를 정의하는 Release로 평가받습니다.

단기적으로 2026년부터 2027년까지, 여러 대학 부속 병원에서 영상 판독 보조 및 진료 기록 요약과 같은 저위험 임상 애플리케이션을 위한 파일럿 배포가 예상됩니다. 이러한 파일럿은 실제 환경에서의 성능 데이터를 생성하는 데 중요한 역할을 할 것입니다. 또한 오픈소스 공개로 인해 일본 전역의 의학 연구 기관이 방사선과나 병리과 등 특정 과목에 맞춰 모델을 파인튜닝하고, 특정 진단 워크플로우에 맞춘 전문 하위 모델을 개발할 수 있게 되었습니다. 일본의 의료 IT 기업들(JMDC, M3 등)은 이 기반 모델을 바탕으로 상업화된 AI 보조 진단 제품을 개발할 수 있는 입지에 있으며, 이는 하위 상업 생태계를 창출할 것으로 보입니다.

중장기적으로 2027년부터 2030년까지, 이 모델의 '영어 데이터 → 현지 언어 변환' 학습 전략이 유효함이 입증된다면, 한국, 대만, 태국 등 비영어권 국가들도 이를 복제하여 글로벌 멀티모달 의료 AI 발전을 주도할 수 있습니다. 이는 모델 자체를 넘어 방법론적 기여를 의미합니다. 또한 더 많은 병원이 병원 내 AI 시스템을 배포함에 따라, 관련 하드웨어 표준, 보안 인증, 운영 절차 등이 일본 의료 기관의 주도하에 산업 표준으로 형성될 가능성이 높습니다. 병원 내 AI의 확산은 환자 개인정보를 유지하면서 다기관 간 연산 학습(Federated Learning)을 가능하게 하는 새로운 의료 데이터 거버넌스 모델을 촉발하여, 희귀병 연구 및 인구 수준의 건강 분석에 중요한 기능을 수행할 것입니다.

전망

이 모델의 등장은 일본 의료 AI 분야의 이정표이지만, 몇 가지 도전 과제도 존재합니다. 의료 AI는 진단 보조용이라도 엄격한 임상 시험과 규제 승인을 거쳐야 하며, 일본의 의약품 의료기기법(PMDA) 프레임워크 하에서 실제 임상 배포에는 2~3년의 검증 주기가 필요합니다. 또한 번역을 통해 변환된 학습 데이터에는 의료 용어의 부정확한 번역이나 문화적 맥락의 차이가 존재할 수 있어, 지속적인 품질 보증과 도메인 전문가의 검토가 필요합니다. 병원 내 배포는 클라우드 배포의 중앙 관리 편의성 없이 각 병원별로 모델 업데이트를 수행해야 하므로, 의료 기관의 IT 부서에 운영상 과중을 초래할 수 있습니다. 또한 A100, H100과 같은 고급 GPU의 조달 비용은 여전히 높아, IT 예산이 제한된 중소형 병원의 배포를 제한할 수 있습니다.

더불어 AI 보조 판독이 오진으로 이어질 경우, AI 시스템, 개발자, 담당 의사 간 책임 소재가 일본의 현재 법적 프레임워크 하에서 명확하지 않습니다. 이러한 규제 불확실성은 채택 속도를 늦출 수 있습니다. 그럼에도 불구하고, 도쿄대학의 142억 파라미터 일본어 의료 멀티모달 모델은 일본어 의료 AI의 격차를 메울 뿐만 아니라, '오픈소스, 병원 내 배포 가능한 멀티모달 의료 모델'이라는 새로운 패러다임을 확립했습니다. 이는 전 세계 비영어권 국가들의 의료 AI 개발에 참조 가능한 경로를 제공합니다.

글로벌 의료 AI 경쟁이 치열해지는 속에서, 이 모델의 오픈소스 전략은 일본 의료 AI 생태계 구축을 가속화할 것으로 기대됩니다. 임상 검증이 진행되고 애플리케이션 시나리오가 확장됨에 따라, 이 모델은 일본의 의료 디지털 전환을 위한 핵심 인프라 중 하나가 될 잠재력을 지니고 있습니다. 이 프로젝트는 세계 수준의 의료 AI가 수조 파라미터 모델이나 막대한 클라우드 컴퓨팅 인프라를 필요로 하지 않음을 보여주며, 규모, 학습 데이터, 배포 아키텍처에 대한 신중한 설계 결정을 통해 동시에 강력하고 접근 가능하며 대상 시장의 규제 및 문화적 요구사항에 부합하는 모델을 생성할 수 있음을 입증했습니다. 이는 유사한 제약 조건을 faced한 다른 국가들의 의료 AI 개발 프로그램에 귀중한 교훈을 제공합니다.