コンピューター科学者やテック起業家たちは、物理的な環境と直接的に相互作用できる身体化された「ワールドモデル」AIシステムの開発を進めている [1, 2]。
この移行は、AI業界における根本的な転換を意味する。静的な言語処理を超えて、これらのシステムは新たな産業能力を解き放ち、物理的インフラへの大規模な投資を促進する可能性がある。
研究者たちは、現在のAI開発が停滞期(プラトー)に達しつつあると考えている。大規模言語モデルはデジタル上の生産性を変革したが、依然として実体のある世界からは切り離されたままだ。身体化された知能への新たな焦点は、空間的な関係性や物理的な因果関係を理解するAIを構築することで、このギャップを埋めることを目的としている [1, 2]。
スタンフォード大学のAI研究者であるMaya Patel博士は、「言語モデルは天井に達しつつある。次のフロンティアは、物理世界を理解し、そこで行動できるAIを構築することだ」と述べた [1]。
開発は現在、シリコンバレーからアジアの各拠点に至るまで、世界的なテックハブ全体で拡大している [1, 2]。この動きは単なる学術的なものではなく、テクノロジーセクターにおける次なる経済成長の主要な原動力になると見なされている。
この転換により、ハードウェア需要の急増が予想される。身体化AIは、現実世界の環境をシミュレーションし相互作用するために、大幅に多くの処理能力を必要とするため、基盤となるインフラを急速に拡張しなければならない。
CME Groupのアナリストは、「我々はAIスーパーサイクルの瀬戸際にいる。身体化された知能をサポートするために、データセンターへの支出とクラウドインフラが爆発的に増加するだろう」と述べた [2]。
これらのワールドモデルシステムは、テキスト生成よりも物理的な相互作用を優先させる点で、これまでの反復モデルとは異なる。目標は、複雑な環境をナビゲートし、物理的な存在を必要とするタスクを実行できるエージェントを構築することであり、AIを画面の中から現実世界へと移行させることにある [1, 2]。
“「言語モデルは天井に達しつつある。次のフロンティアは、物理世界を理解し、そこで行動できるAIを構築することだ」”
身体化AIへの移行は、テキストや画像に焦点を当てた生成AIの初期ブームが成熟期に入ったことを示唆している。もしAIが物理空間をナビゲートするための「ワールドモデル」を統合することに成功すれば、経済的影響はソフトウェアのサブスクリプションから、ロボティクスや特化型データセンターへの大規模な設備投資へと移り、AIハードウェアのグローバルサプライチェーンを根本的に変えることになるだろう。


