Anthropicは2026年6月9日、MythosクラスのAIモデル「Claude Fable 5」をリリースしたと発表した。

今回のローンチは、同社が新規株式公開(IPO)の準備を進める中で、スタートアップとしての安全性への対応能力を実証することを目的としている。厳格なガードレールを実装することで、Anthropicは高リスク領域における自社技術の悪用を防止することを目指している。

新モデルには、生物学およびサイバーセキュリティに関連するクエリへの回答を遮断するために特別に設計されたセーフガードが組み込まれている。これらの制限は、AIが生物兵器の開発やサイバー攻撃の実行に利用されるリスクを軽減することを意図したものだ。

モデルの利用可能性については、情報源によって報告が分かれている。一部の報告では、Anthropicがこれらのセーフガードを適用した上でモデルを一般に広く公開したとしているが、別の報告では、Mythosクラスモデルは少数のユーザーに限定されているか、あるいはサイバーセキュリティ上の懸念から公開が保留されているとしている。

今回の公表に先立ち、約2カ月間にわたる限定的なロールアウト期間が設けられていた [1]。この段階的なリリースにより、同社は広範なローンチの前に、安全フィルターの有効性をテストすることができた。

Anthropicは、競争の激しいAI市場において「安全性第一」の代替案としての地位を確立しようとしている。危険なコンテンツの生成を防止することへの注力は、非上場スタートアップから公開企業へと移行する同社のコーポレートアイデンティティの中核をなしている。

新モデルには、生物学およびサイバーセキュリティに関連するクエリへの回答を遮断するために特別に設計されたセーフガードが組み込まれている。

Claude Fable 5のリリースは、AIの能力と安全性の間にある緊張関係を浮き彫りにしている。生物学やサイバーセキュリティといった特定の知識領域を制限することで、Anthropicは、強力なツールが革新と危害の両方に利用され得るという「デュアルユース(軍民両用)」問題の解決を試みている。この戦略的な動きは、IPOを前に、同社のリスク管理体制について規制当局や潜在的な投資家に安心感を与えることを意図している可能性が高い。