Why did Japan choose domestic LLMs over GPT or Claude for this project?

The core reasons are data sovereignty and strategic autonomy. Government administrative data is highly sensitive, and routing it through foreign servers creates security risks. Japan also aims to support its domestic AI industry through government procurement. This mirrors France's Mistral-first approach but at substantially larger scale.

What data value does the 180,000-official pilot generate?

This is one of the most valuable assets for Japan's AI industry. Real-world usage data from 180,000 professional users in genuine administrative contexts reveals actual model strengths and weaknesses, and provides real training signals for administrative-domain optimization. No laboratory can simulate this scale and authenticity—it's decisive for model iteration of the selected companies.

What safety mechanisms govern AI-generated content for officials?

Four layers: content access controls (classified documents prohibited from AI input); onshore hosting (all models run in Japanese data centers); mandatory human review (AI outputs must be verified by officials before official use); and complete audit trails. This ensures AI functions as an assistive tool, not an autonomous decision-maker.

日本數位廳啟動「政府AI源內」實證：18萬公務員將使用7款國產LLM

日本數位廳宣佈啟動大規模生成AI實證項目「政府AI源內」，覆蓋全部中央省廳約18萬名公務員，選定7款國產LLM。

背景

2026年3月，日本数字厅（庁）正式宣布启动大规模生成AI实证项目——「AI源内」（政府AI源内）。项目覆盖全部中央省厅约18万名公务员，计划实施期为2026年5月至2027年3月，历时近一年。这是日本政府迄今规模最大、范围最广的AI应用实证，也是全球同类政府AI项目中少有的大规模实践。

「源内」这一命名取自江户时代博学家平贺源内，寓意探索与创新精神，体现了日本政府在数字化转型道路上的文化自信与战略雄心。

核心技术分析

七款国产LLM的战略选型

项目明确选定七款国产大型语言模型（LLM），刻意回避了GPT-4、Claude、Gemini等主流海外商业模型，入围名单包括：

**NTT「tsuzumi 2」**：NTT集团自研，针对日语优化的企业级LLM，在法律文书、行政公文等正式文体上表现突出
**KDDI × ELYZA「Llama-3.1-ELYZA-JP-70B」**：基于Meta开源Llama 3.1微调，由ELYZA团队进行日语深度适配，70B参数规模保证了推理能力
**软银「Sarashina2 mini」**：软银与CyberAgent共同开发，"mini"版本强调推理效率与部署成本的平衡
**NEC「cotomi v3」**：NEC自有研发，强调企业安全合规与私有化部署能力
另有三款模型尚待官方公布

实证架构设计

项目采用统一接入平台架构，公务员通过数字厅提供的标准化界面访问各款LLM，使用场景涵盖：

1. 行政文书起草与审核

2. 法规解读与政策问答

3. 会议纪要整理

4. 跨部门信息检索与汇总

5. 公民服务回复生成

关键设计原则包括：**数据主权保护**（所有输入输出不外流至境外服务器）、**多模型并行评测**（同一任务可对比不同模型输出）、**人工审核机制**（AI输出须经公务员确认才可正式使用）。

安全与隐私框架

面对政府行政信息的高度敏感性，项目制定了严格的数据安全规范：

所有模型在日本境内数据中心部署（onshore hosting）
输入内容实行分级管控，秘密级别以上文件禁止输入AI系统
完整的操作日志与审计追踪
定期的AI输出质量与偏见评估

竞品对比

| 项目 | 国家 | 规模 | 模型选择 | 特点 |

|------|------|------|----------|------|

日本模式与法国"主权AI"路线最为接近，但日本的规模更大，且对本土产业扶持的意图更为明显。

行业影响

对日本AI产业的提振效应

这一项目对日本国产LLM企业意义深远：

**规模化真实场景数据**：18万专业用户产生的真实使用反馈，是日本AI企业最宝贵的训练资源
**商业信用背书**：政府级采用为各企业的商业化营销提供了强力支撑
**竞争格局重塑**：获选的7家企业将在政府市场形成显著先发优势，可能进一步加速市场集中度

对全球政府AI采购政策的示范

日本的选择向其他国家政府传递了明确信号：AI主权（AI Sovereignty）不仅是地缘政治议题，更是数字基础设施安全的核心要素。预计欧盟、韩国、印度等将加速本土LLM的政府采购政策。

潜在风险与挑战

**性能差距**：部分国产LLM与GPT-4o、Claude 3.7等顶级产品在通用能力上仍有差距，可能影响实际使用满意度
**公务员AI素养**：大规模推广需要配套系统性的AI使用培训
**AI生成内容的法律责任**：政府文件如含AI错误如何归责，尚缺法律框架
**跨部门标准不统一**：各省厅对AI辅助行政的接受程度差异较大

未来展望

政府AI源内项目的一年期实证结束后，数字厅预计将在2027年上半年发布全面评估报告，涵盖效率提升量化数据、用户满意度、安全事件记录、以及对国产LLM市场的影响分析。

从更长远的视角来看，这一项目可能成为日本"行政AI化"战略的奠基石。日本政府的目标不仅是提高行政效率，更是通过政府这一最大规模的企业客户，为本土AI产业提供支撑，最终在全球AI竞争中确保日本的技术主权地位。

随着大阪世博会（2025）带来的数字化展示机会，以及2027年G7期间对AI治理的关注，日本政府AI项目将持续吸引国际目光，成为"负责任AI应用"的东亚样板案例。