DeepMind 創設者のデイヴィッド・シルバー氏、11億ドル調達で「人間のデータを学習しないAI」を構築

数ヶ月前に元 DeepMind 研究者デイヴィッド・シルバー氏が設立した英国のAIラボ「Ineffable Intelligence」が、11億ドルの資金調達を51億ドルのバリュエーションで完了した。同社は人間のラベル付けデータや模倣データに頼らず自律学習するAIの開発を目指しており、業界が教師あり学習から生物学的にインスパイアされた汎用知能への転換点を示している。

背景と概要

英国に拠点を置く人工知能（AI）ラボ「Ineffable Intelligence」が、2026年4月27日付でTechCrunch AIにより報じられた通り、11億ドル規模の資金調達を完了した。このラウンドにより、同社の企業価値（バリュエーション）は51億ドルに達している。この企業は、数ヶ月前に元DeepMindの核心研究者であるデイヴィッド・シルバー氏によって設立されたばかりの新興企業である。この調達額は、AIスタートアップにおける単一ラウンドの記録を更新する規模であり、投資家たちが次世代のAI技術路線に対してどのような期待を寄せているかを如実に示している。デイヴィッド・シルバー氏は、DeepMind在籍中にAlphaGoやAlphaZeroの開発を主導したことで知られる。これらのシステムは、囲碁やチェスといった複雑な戦略ゲームにおいて人間を超えた性能を達成したが、その核心には人間の専門家データやラベル付けされたデータに依存せず、自己対戦と自律的な試行錯誤を通じて学習する強化学習の手法があった。Ineffable Intelligenceは、この技術的ルーツを継承し、現在の主流である教師あり学習や人間のフィードバックを用いた強化学習（RLHF）とは一線を画す、生物学的な学習プロセスに近いアプローチを追求している。

深掘り分析

Ineffable Intelligenceの技術的 thesis は、人間のラベル付けデータが汎用知能を訓練するための最適ではない基盤であるという前提に立っている。現在、OpenAIをはじめとする主要なAI企業が開発するモデルは、インターネット上のテキストや画像による大規模事前学習と、人間のフィードバックによる微調整に大きく依存している。しかし、このアプローチはリソースを大量に消費し、人間が作成したデータの質やバイアスに内在的な限界を抱えている。一方、Ineffable Intelligenceは、人間の模倣データへの依存を排除し、エージェントが試行錯誤を通じて物理法則や言語、社会的相互作用の根本原理を発見できるシステムの構築を目指している。技術的な課題は、明示的な人間のガイダンスなしに有用な行動を学習するための報酬関数と探索戦略の設計にある。Silver氏の過去のAlphaZeroにおける成功は、勝敗という単純かつ客観的な報酬関数により、システムが数百万のバリエーションを探索し、人間の知識を超えた新たな戦略を発見できた点に象徴される。Ineffable Intelligenceは、この概念を報酬が事前に定義されていないオープンエンドな環境へ拡張する必要がある。これには、AIが自らの目標や学習目的を生成する内在的動機付けのメカニズムが不可欠であり、11億ドルの資金は、こうした複雑なアルゴリズムを実験するための計算資源を提供する。

業界への影響

Ineffable Intelligenceの巨額な資金調達は、AI業界に即座な波及効果をもたらしている。これは、市場を支配しているデータ依存型のモデルに対し、 viable な代替案が存在するという仮説を検証するものとなった。この動きは、自律的学習や強化学習に焦点を当てたスタートアップや研究ラボへの資本と人材の再配分を促す可能性がある。また、既存の大手企業も、競争力を維持するために自己教師あり学習への研究加速を余儀なくされるだろう。さらに、この潮流はデータ注釈やラベリングサービスに依存する企業のビジネスモデルを揺るがす可能性がある。AIシステムが人間のデータなしに学習可能になるにつれ、人間を介したトレーニングの需要は減少し、データラベリングfirmの市場は縮小するかもしれない。その代わりに、シミュレーション環境、計算インフラ、高度なアルゴリズム研究を提供する企業への価値連鎖のシフトが進むと考えられる。自律的学習は物理的な相互作用に適しているため、ロボティクスや具現化AIへの関心も高まり、製造や物流、自律走行車などの実世界アプリケーションへの統合が加速するだろう。

今後の展望

Ineffable Intelligenceの軌跡は、AIの未来における重要なテストケースとなる。同社が堅牢な自律学習システムの構築に成功すれば、AIのパフォーマンスと効率の基準を再定義する可能性がある。人間のデータなしに学習する能力は、新モデルの開発に必要なコストと時間を劇的に削減し、リソースに限りのある組織でも高度なAI能力を活用できる民主化をもたらす。また、インタラクションを通じて訓練されたエージェントは、静的なデータセットで訓練されたものよりも新規な状況への適応力が高い傾向があり、技術のレジリエンスも向上する。規制面でも、自律的なAIシステムの台頭に対応した新たな枠組みの整備が進むだろう。政府や国際機関は、モデルの訓練データよりも、AIの行動や成果そのものを規制する方向へシフトする可能性がある。Ineffable Intelligenceの取り組みは、人間の監督に依存しないシステムにおける安全性とアライメントを確保するためのモデルを提供し、医療や金融といった自律的意思決定が重大な影響を持つ他業界にも影響を与えるだろう。11億ドルという投資は、業界が新しいパラダイムを受け入れる準備ができていることを示す賭けであり、その成否が今後数年間のAI開発の方向性を決定づけることになる。

Sources

TechCrunch AI