ServiceNowの研究チームとエディンバラ大学が、AIエージェントによる新たな機密漏洩リスク「モザイク効果」を発表した。外部検索クエリの断片を組み合わせることで、意図せず企業の内部情報が推論されるという。この発見は、AIの利便性とプライバシー保護の深刻なトレードオフを浮き彫りにしている。

なぜAIの「賢さ」が機密漏洩の引き金になるのか?

ServiceNowの研究チームが発表した「MosaicLeaks」は、AIエージェントが社内の非公開文書とウェブ上の公開情報を組み合わせて調査を行う際、外部検索クエリが機密情報を漏洩させる「モザイク効果」を引き起こすことを明らかにした。個々のクエリは無害に見えても、複数のクエリを積み重ねることで、攻撃者はパズルを組み立てるように内部情報を復元できてしまう。Hugging Faceの技術ブログによれば、この現象はタスク遂行能力を向上させるためにモデルを最適化すると、皮肉にも漏洩リスクが増大する傾向にある。モデルが検索精度を高めるためにクエリに文脈を詰め込むほど、外部から観測可能な「手がかり」が増えてしまうためである。

漏洩率を34%から9.9%へ引き下げる「PA-DR」の仕組みとは

研究チームは、このモザイク効果に対処するため、「Privacy-Aware Deep Research(PA-DR)」という強化学習手法を提案した。このアプローチは、タスクの成功報酬とプライバシー保護の報酬を同時に最適化することで、漏洩率を大幅に低減しつつ、一定の回答精度を維持することを目指す。ServiceNowの研究論文によれば、PA-DRは漏洩率を34.0%から9.9%へ低減させることに成功した。従来のプロンプトによる漏洩防止策が性能低下を招くか、漏洩を十分に防げないという課題に対し、PA-DRは性能とプライバシー保護の両立に道筋を示している。

情シス担当者はAIの「独り言」をどう管理すべきか?

AIエージェントの普及は、企業にとって全く新しいセキュリティ課題を提示している。従来のファイアウォールやアクセス制御では、AIエージェントが自律的に生成する外部検索クエリのログから機密情報が漏洩するリスクを防ぐことは困難である。これは、AIの「賢さ」を享受する代償として、その「独り言」がいかに外部に漏れ出し、悪用され得るのかを企業が再定義する必要があることを意味する。情シスやセキュリティ運用担当者は、クエリログの監視や匿名化に加え、エージェントの行動をリアルタイムで分析する新たな戦略を根本から再構築することが求められる。

性能と安全性のトレードオフをどう乗り越えるべきか

生成AIエージェント市場は急速に拡大しており、Gartnerの予測によれば2027年までに企業の60%がAIエージェントを導入するとされている。しかし、プロンプト制御の限界が露呈する中で、AIの性能追求がそのままセキュリティリスクに直結するというジレンマは、開発現場にとって極めて厄介な課題である。PA-DRのようなアーキテクチャレベルの対策が、今後のAIエージェント開発の標準となる可能性が高い。企業は、AIの利便性を享受しつつ、いかにしてその潜在的なセキュリティリスクを管理し、性能と安全性のトレードオフを乗り越えるかが今後の焦点となる。