OpenAIは、医療分野の回答精度を飛躍的に高めた「GPT-5.5 Instant」を全無料ユーザー向けに提供開始した。医師による厳格な評価プロセスを導入し、緊急性の判断や不確実性の説明能力を強化したことで、AIが単なる情報検索ツールから専門的な判断支援へと進化しつつある。

なぜ「医師による評価」が医療AIの転換点となるのか?

OpenAIが2026年5月にリリースした「GPT-5.5 Instant」は、同社のAIモデルにおける医療知能の転換点となる可能性がある。週に2億3,000万人以上が健康相談にChatGPTを利用する現状において、誤情報の提供は致命的なリスクを孕むため、その精度と安全性の確保は喫緊の課題であった。今回のアップデートでは、モデルの推論能力向上に加え、医師ネットワークによる「医師主導の評価」を開発プロセスに組み込んだ点が最大の特徴である。この取り組みにより、緊急時の医療機関への誘導や不確実性の適切な説明といった、臨床現場で不可欠な判断能力が強化されたとOpenAIは報告している。

事実誤認率71%減を支える技術的・運用的アプローチとは?

GPT-5.5 Instantの導入により、健康関連の回答における事実誤認の可能性が指摘された割合は、過去2か月間で71%減少したとOpenAIの監視システムは示している。この大幅な改善は、HealthBench Professionalのような専門的な評価指標と医師のフィードバックを統合したアプローチによって実現された。同社の発表によれば、GPT-5.5 Instantは、医師が作成した回答と比較しても、精度、コミュニケーション、完全性、健康上の意思決定の有用性において、一部の評価項目で高いスコアを記録した。特に、患者の状況に応じた文脈の理解や「レッドフラッグ(危険信号)」の見落とし防止において、従来のモデルを上回るパフォーマンスを見せている。

患者がAIを「健康のパートナー」として活用するために必要な視点

GPT-5.5 Instantの登場は、医療・健康分野におけるAIの信頼性を向上させ、専門的な判断支援ツールとしての実用性を高めるものと期待される。しかし、AIがより人間らしく説得力のある情報を提供するようになることで、ユーザーがAIを過度に信頼し、専門医への受診を遅らせるリスクも否定できない。患者の52%が健康状態の調査にAIを利用する一方で、78%は医師がAI由来の情報を検証することを期待しているという調査結果もあり、ユーザーがAIの限界を正しく認識し、適切な医療判断の補助として活用するためのリテラシー教育が不可欠である。

AIによる医療助言の限界と長期的な臨床的検証の行方

AIがどれほど洗練された回答を生成しようとも、それはあくまで統計的な確率に基づく出力であり、個別の患者が抱える複雑な既往歴や身体的背景を完全に把握できるわけではない。医師による評価がモデルの振る舞いを改善させたとしても、それは「医療的助言」の代用として認定されたことを意味しない。米国医師会(AMA)は、AIが医師の判断に取って代わることはできず、透明性、説明責任、医師による意味のある監視が不可欠であると強調している。今後は、AIの回答が医療現場の意思決定に与える影響について、長期的な臨床的アウトカムの検証が求められるだろう。