Anthropicは、より誠実であり、情報が不足している場合にそれを認めるように設計された人工知能モデル「Claude Opus 4.8」をリリースした [1]

この開発は、生成AIにおける最も根深い問題の一つである「ハルシネーション」への対策である。モデルに「分かりません」と言わせるトレーニングを施すことで、Anthropicはシステムの回答に対するユーザーの信頼性と信頼性を高めることを目指している [2], [3]

同社は、このモデルがこれまでで最も誠実なバージョンであると述べた [3]。報告によると、このモデルは虚偽の主張の頻度を減らし、自身の知識ベースの限界をより正確に特定できるように特別に構築されたという [2], [4]

モデルの性能データは、テスト環境によって異なる。一部の報告では、Claude Opus 4.8が誠実さのベンチマークでほぼ満点を獲得したとしている [2]。しかし、別の評価では、モデルが依然として特定の誤りに陥りやすいことが示唆されている。ある独立した評価では、テスターがモデルに対して10個の「誠実さの罠」を仕掛けた [5]。その特定のテストにおいて、法律に基づいたプロンプトがモデルの誠実さの制約を突破できたことが判明した [5]

こうした矛盾はあるものの、今回のリリースは、AI開発の方向性が「自信」よりも「透明性」へとシフトしていることを示している。その目標は、大規模言語モデルがトレーニングデータの欠落に直面した際に、答えを捏造する傾向から脱却することにある [2], [4]

Anthropicは公式サイトでリリースを発表し、このアップデートはその後、世界各国のテックニュースメディアによって報じられた [1], [6]。このモデルは、Opusシリーズを洗練させる同社の継続的な取り組みの一環として、2024年に導入された [2], [3]

Claude Opus 4.8は、より誠実で、情報不足を認められるモデルとして展開されている。

Claude Opus 4.8のリリースは、AI業界が単純な能力の追求から信頼性の重視へと移行していることを示唆している。これまでのモデルは知識の幅広さに焦点を当てていたが、「誠実さ」が強調されたことは、情報の欠如を認識する能力が、企業や専門的な導入において不可欠な機能と見なされるようになったことを意味する。しかし、独立したテストで依然としてモデルを「突破」できるという事実は、ハルシネーションの完全な排除が依然として未解決の技術的課題であることを示している。