Anthropicは2026年6月9日、MythosクラスのAIモデルの一般公開版として「Claude Fable 5」をリリースした。

今回のリリースは、高度な知能に伴う壊滅的なリスクを軽減しつつ、高性能AIを一般公開するための重要な一歩となる。同社は厳格なガードレールを実装することで、実用性とグローバルな安全性のバランスを図る狙いだ。

この一般公開は、ウォール街に衝撃を与えた限定公開から2ヶ月後 [1] に行われた。新バージョンのClaude Fable 5は、より強力なMythosクラスのアーキテクチャから派生したモデルである。ツールが兵器化されるのを防ぐため、Anthropicは高リスク領域での回答を具体的にブロックする安全対策を統合した。

同社によると、これらのセーフガードは、生物学やサイバーセキュリティ [2] といった分野で、実行可能な情報を提供することを防ぐよう設計されている。制限のないモデルは、生物学的脅威の創出や高度なサイバー攻撃の実行を支援する可能性があるため、これらの領域は高リスクであると見なされている。

一部の報告ではこのモデルを「Claude Mythos 5」と呼んでいたが、他の情報源では「Claude Fable 5」として特定している [3]。同社は、広範な導入前にモデルが中核となる安全原則を遵守することを確実にするため、これらの安全レイヤーの展開に注力した。

Anthropicは、このような強力なモデルを一般公開する上で、安全対策は不可欠であるとしている。同社は引き続きモデルのパフォーマンスを監視し、既存のガードレールを回避させる可能性のある脆弱性を特定し、修正していく方針だ。

Anthropicは、MythosクラスのAIモデルの一般公開版として「Claude Fable 5」をリリースした

Claude Fable 5のリリースは、強力なAIを導入したいという商業的動機と、安全性の整合性を確保するという倫理的必要性との間で高まる緊張を浮き彫りにしている。生物学やサイバーセキュリティといった特定の領域を制限することで、Anthropicは、モデルの生の能力が、制限なしに一般公開できる現在の安全しきい値を超えていることを認めている。