OpenAI、プロンプト注入攻撃を防ぐ「ロックダウンモード」を導入

OpenAIは、プロンプト注入（プロンプトインジェクション）攻撃を軽減するため、インターネット接続機能を無効化するChatGPTのセキュリティ機能「Lockdown Mode（ロックダウンモード）」を導入した [1, 2]。

今回のアップデートは、外部データがボットの動作を操作できてしまうという、大規模言語モデル（LLM）における重大な脆弱性に対処するものだ。オープンウェブへのアクセスを制限することで、極めて機密性の高いデータを管理する組織や個人に対し、より安全な環境を提供することを目指している [1, 2]。

Lockdown Modeでは、具体的にライブウェブ閲覧やディープリサーチなどの機能が無効化される [1, 2]。これらのツールは最新情報の収集に有用である一方、ウェブサイトに埋め込まれた悪意のある指示にAIが不注意にさらされるリスクがある。プロンプト注入と呼ばれるこうした攻撃は、AIがユーザーの元の指示を上書きする隠しコマンドを含むウェブページを読み込んだ際に発生する [1, 2]。

OpenAIは、この機能がユーザーや組織にさらなる保護手段を提供すると述べている [1, 2]。同社は、多くの企業がAIを内部ワークフローに統合する中で懸念が高まっているデータ漏洩や不正なコマンド実行のリスクを低減させる手段として、このツールを位置づけている [1, 2]。

ユーザーは、セッションごとの特定のニーズに応じてこのモードを切り替えることができる。機能を無効化することでAIがリアルタイムデータを取得する能力は制限されるが、その代わりとして、悪意のある攻撃者が利用可能な攻撃領域（アタックサーフェス）を大幅に削減できる [1, 2]。

今回の動きは、AIセキュリティを強化しようとする業界全体の広範なトレンドに沿ったものである。モデルがインターネットやサードパーティ製アプリケーションと相互作用する権限を持つにつれ、「間接的プロンプト注入」の可能性が高まっており、エンタープライズ級のセキュリティを実現するためにはLockdown Modeのような隔離ツールが不可欠となっている [1, 2]。

“OpenAIは、インターネット接続機能を無効化するために設計されたChatGPTのセキュリティ機能「Lockdown Mode」を導入した”

Lockdown Modeの導入は、AIの利便性重視からセキュリティ重視への転換を意味している。ユーザーが手動でAIとライブウェブの接続を切断できるようにすることで、OpenAIは、ウェブ統合型LLMの現在のアーキテクチャが本質的に外部操作に対して脆弱であることを認めた形だ。これにより、リスクの高いプロフェッショナルな環境において「キルスイッチ」が必要不可欠となったことが浮き彫りになった。

OpenAI、プロンプト注入攻撃を防ぐ「ロックダウンモード」を導入

出典

関連記事

At Least Nine Dead After Molten Steel Spill at Visakhapatnam Plant

PCB Drops Shaheen Afridi From Test Squad

Japanese Food Companies Raise Prices, Reduce Product Sizes

Comments