日本數位廳啟動「政府AI源內」實證:18萬公務員將使用7款國產LLM
日本數位廳宣佈啟動大規模生成AI實證項目「政府AI源內」,覆蓋全部中央省廳約18萬名公務員,選定7款國產LLM。
背景
2026年3月,日本数字厅(庁)正式宣布启动大规模生成AI实证项目——「AI源内」(政府AI源内)。项目覆盖全部中央省厅约18万名公务员,计划实施期为2026年5月至2027年3月,历时近一年。这是日本政府迄今规模最大、范围最广的AI应用实证,也是全球同类政府AI项目中少有的大规模实践。
「源内」这一命名取自江户时代博学家平贺源内,寓意探索与创新精神,体现了日本政府在数字化转型道路上的文化自信与战略雄心。
核心技术分析
七款国产LLM的战略选型
项目明确选定七款国产大型语言模型(LLM),刻意回避了GPT-4、Claude、Gemini等主流海外商业模型,入围名单包括:
- **NTT「tsuzumi 2」**:NTT集团自研,针对日语优化的企业级LLM,在法律文书、行政公文等正式文体上表现突出
- **KDDI × ELYZA「Llama-3.1-ELYZA-JP-70B」**:基于Meta开源Llama 3.1微调,由ELYZA团队进行日语深度适配,70B参数规模保证了推理能力
- **软银「Sarashina2 mini」**:软银与CyberAgent共同开发,"mini"版本强调推理效率与部署成本的平衡
- **NEC「cotomi v3」**:NEC自有研发,强调企业安全合规与私有化部署能力
- 另有三款模型尚待官方公布
实证架构设计
项目采用统一接入平台架构,公务员通过数字厅提供的标准化界面访问各款LLM,使用场景涵盖:
1. 行政文书起草与审核
2. 法规解读与政策问答
3. 会议纪要整理
4. 跨部门信息检索与汇总
5. 公民服务回复生成
关键设计原则包括:**数据主权保护**(所有输入输出不外流至境外服务器)、**多模型并行评测**(同一任务可对比不同模型输出)、**人工审核机制**(AI输出须经公务员确认才可正式使用)。
安全与隐私框架
面对政府行政信息的高度敏感性,项目制定了严格的数据安全规范:
- 所有模型在日本境内数据中心部署(onshore hosting)
- 输入内容实行分级管控,秘密级别以上文件禁止输入AI系统
- 完整的操作日志与审计追踪
- 定期的AI输出质量与偏见评估
竞品对比
| 项目 | 国家 | 规模 | 模型选择 | 特点 |
|------|------|------|----------|------|
| 日本政府AI源内 | 日本 | 18万人 | 7款国产LLM | 强调技术自主、多模型并行 |
| GovGPT | 新加坡 | 15万人 | 混合(含OpenAI) | 注重实用效率 |
| Tchap AI | 法国 | 部分公务员 | Mistral为主 | 欧洲主权AI路线 |
| DARPA AI Asst. | 美国 | 军事/研究系统 | 混合私有 | 安全级别最高 |
日本模式与法国"主权AI"路线最为接近,但日本的规模更大,且对本土产业扶持的意图更为明显。
行业影响
对日本AI产业的提振效应
这一项目对日本国产LLM企业意义深远:
- **规模化真实场景数据**:18万专业用户产生的真实使用反馈,是日本AI企业最宝贵的训练资源
- **商业信用背书**:政府级采用为各企业的商业化营销提供了强力支撑
- **竞争格局重塑**:获选的7家企业将在政府市场形成显著先发优势,可能进一步加速市场集中度
对全球政府AI采购政策的示范
日本的选择向其他国家政府传递了明确信号:AI主权(AI Sovereignty)不仅是地缘政治议题,更是数字基础设施安全的核心要素。预计欧盟、韩国、印度等将加速本土LLM的政府采购政策。
潜在风险与挑战
- **性能差距**:部分国产LLM与GPT-4o、Claude 3.7等顶级产品在通用能力上仍有差距,可能影响实际使用满意度
- **公务员AI素养**:大规模推广需要配套系统性的AI使用培训
- **AI生成内容的法律责任**:政府文件如含AI错误如何归责,尚缺法律框架
- **跨部门标准不统一**:各省厅对AI辅助行政的接受程度差异较大
未来展望
政府AI源内项目的一年期实证结束后,数字厅预计将在2027年上半年发布全面评估报告,涵盖效率提升量化数据、用户满意度、安全事件记录、以及对国产LLM市场的影响分析。
从更长远的视角来看,这一项目可能成为日本"行政AI化"战略的奠基石。日本政府的目标不仅是提高行政效率,更是通过政府这一最大规模的企业客户,为本土AI产业提供支撑,最终在全球AI竞争中确保日本的技术主权地位。
随着大阪世博会(2025)带来的数字化展示机会,以及2027年G7期间对AI治理的关注,日本政府AI项目将持续吸引国际目光,成为"负责任AI应用"的东亚样板案例。