Anthropicは2026年4月7日、新モデル「Claude Mythos Preview」を発表した[1]。これを受け、サイバーセキュリティ上の悪用への懸念から、世界的な議論が巻き起こっている。

このモデルのリリースが重要視されるのは、意図しない機能によって、悪意のある者がハッキングを自動化し、大規模な誤情報キャンペーンを展開することが可能になるためだ。AIがデジタル攻撃を実行できる速度が向上したことで、政府や民間セクターは警戒を強め、評価を進めている。

サイバーセキュリティの専門家は、「Mythos」としても知られるこのモデルが重大な脅威になると指摘する。AIがデジタル操作や自動ハッキングに悪用される可能性があるという[1], [2], [3]。これらの懸念は世界的な規模に達しており、各国政府やITセクターからも注目を集めている[2]

リスクの深刻さについては、アナリストの間で意見が分かれている。一部の報告書では、この脅威は「前例がない」としている[3]。一方で、モデルが脅威であることは認めつつも、「ゲームのルールを書き換えるほどではない」とする見方もある[1]

さらに別の分析では、このモデルが既存のサイバーセキュリティの状況を根本的に変えることはない可能性が示唆されている[2]。これは、攻撃ツールへのアクセスは容易になるものの、デジタルシステムの根本的な脆弱性が依然として主要な標的であることを意味している。

入手可能な報告書の中では、Anthropicはこれらの具体的なサイバーセキュリティ上の批判に対し、詳細な公的回答を示していない。大規模言語モデルの急速な展開と、AI主導の脅威に対抗するセキュリティ専門家の防御能力との間の緊張状態は続いている。

Claude Mythos Previewは、自動ハッキングを可能にするサイバーセキュリティ上の脅威であると評されている。

Claude Mythos Previewを巡る論争は、AIの革新とグローバルセキュリティとの間に生じている摩擦を浮き彫りにしている。もしこのモデルが高度なサイバー攻撃のハードルを実際に下げるのであれば、「AI対AI」の防御システムへの移行を余儀なくされる可能性がある。しかし、脅威の状況が根本的に変わらないのであれば、リスクの本質は新たな能力ではなく、攻撃件数の増加にあることになる。