OpenAIは、生成AIへのプロンプト攻撃を無効化し機密情報を保護する「ロックダウンモード」を発表した。これにより、企業がAIを業務導入する際のデータ漏洩リスク低減が期待され、AIの安全性への信頼回復が試される。

プロンプトインジェクションを物理的に遮断する仕組みとは?

OpenAIが新たに導入した「ロックダウンモード」は、AIモデルに対するプロンプトインジェクション攻撃を無効化し、機密情報の流出を物理的・論理的に遮断するセキュリティ機能である。Engadgetの報道によれば、外部からの不正な命令を制限し、モデルの挙動を厳格に制御することで、ハッカーによる攻撃の余地を最小限に抑える仕組みだ。特に、外部へのネットワークリクエストを制限することで、データ流出の最終段階を防ぐことを主目的としている。

なぜ今、AIの「守り」を強化する必要があるのか?

生成AIの業務導入が加速する一方で、AIの指示を悪用して本来のガードレールを突破し、機密情報を引き出すプロンプトインジェクション攻撃が深刻化している。Googleの脅威インテリジェンスチームの報告では、悪意のあるプロンプトインジェクションペイロードが2025年11月から2026年2月の間に32%増加したとされており、企業ユーザーの不安払拭が喫緊の課題となっている。今回の措置は、このような攻撃の増加に対応するものである。

業務効率とセキュリティのトレードオフをどう解消するか?

ロックダウンモードは、AIの汎用性をあえて制限することで安全性を担保するアプローチをとる。OpenAIの技術文書によれば、ライブウェブブラウジングがキャッシュコンテンツに限定され、Deep ResearchやAgent Modeなどの高度な機能が無効化される。API経由の利用においてどの程度のパフォーマンス低下を招くのか、また誤検知によって業務効率が阻害されないかといった実用面での検証が、導入を検討するシステム管理者の間で不可欠となるだろう。

「守りのAI」への転換は企業に何をもたらすか?

この「守りのAI」への転換は、企業がAIを導入する際の最大の懸念であったデータ漏洩リスクを軽減し、業務利用の安全性を向上させる。The Decoderの分析によれば、企業はセキュリティを優先した運用が可能になる一方、AIの柔軟な活用とのバランスを再定義する必要に迫られる。特定の業務環境においてセキュリティを優先した運用が可能になるが、AIの持つ本来の可能性をどこまで引き出せるかという課題も同時に生じる。

進化する攻撃手法に「いたちごっこ」で対抗できるのか?

プロンプトインジェクションは「フロンティアの、困難な研究課題」とOpenAI自身が位置づけており、攻撃側も日々新たな手法を模索し続けている。提供されるセキュリティ機能が、攻撃側の進化速度を上回ることができるのか、あるいは単なる「いたちごっこ」に終わるのかが今後の焦点である。単一のモード切り替えだけでなく、AIの安全性に関する包括的なガバナンスのあり方を業界全体に示すリーダーシップがOpenAIには求められている。