Anthropicは木曜日、AI企業は高度なAIシステムの開発を一時停止、または減速させるための、協調的かつ検証可能な方法を確立すべきであると述べた [1]

この提案は、AIの進化速度が、それを管理するために設計された安全策の枠組みを上回っているという、業界リーダーの間で高まる懸念を浮き彫りにしている。もし技術が人間のリスク管理能力を超えて進化すれば、これらのシステムに対する人間の制御を失う可能性がある [1, 2]。

2026年6月4日に公開されたブログ記事の中で、同社はフロンティアAI開発者間での世界的な合意を呼びかけた [1]。その目的は、単に合意されるだけでなく「検証可能」なメカニズムを構築し、特定のリスクしきい値に達した際に、参加するすべての研究所が確実に停止措置を遵守するようにすることである [1]

Anthropicは、「リスクが高まった場合に開発を停止させる、協調的で検証可能な方法が必要だ」と述べている [1]

同社の警告は、高度なAIの予測不能性に焦点を当てている。これらのシステムは急速に向上するため、その能力と、潜在的な害を軽減する社会の能力との乖離が広がる可能性がある。その結果、休息なしに開発を継続するには危険すぎるというシナリオが現実味を帯びることになる [1, 2]。

この提案は、すべての研究を直ちに停止することを要求するものではないが、「非常用(ブレイク・グラス)」プロトコルの存在を主張している。このようなシステムがあれば、競合する研究所間の競争圧力にさらされることなく、業界が一度立ち止まって安全策を評価することが可能になる [1]

「リスクが高まった場合に開発を停止させる、協調的で検証可能な方法が必要だ」

検証可能な一時停止を求めるAnthropicの呼びかけは、AIセーフティに関する議論が理論的な段階から、具体的かつ業界全体にわたるガバナンスへの要求へと移行したことを反映している。「検証可能」なメカニズムを強調することで、競争の激しい商業環境においては信頼だけでは不十分であることを同社は認めている。これは、AI業界において「軍拡競争」のリスクが、地球規模の安全に対する主要な脅威と見なされる段階に達していることを示唆している。