OpenAI、医療知能を強化した「GPT-5.5 Instant」を公開。医師の評価で人間を凌駕する精度へ

OpenAIは、医療分野の対話能力を大幅に向上させた「GPT-5.5 Instant」を全ユーザー向けに提供開始した。同社の技術文書によれば、医師による厳格な評価とフィードバックをモデル学習に組み込むことで、AIによる健康相談の信頼性と安全性を飛躍的に高める狙いがある。

なぜ医師の評価がAIの医療判断力を変えたのか？

OpenAIが発表した「GPT-5.5 Instant」は、医師が定義した評価基準（ルーブリック）を学習プロセスに組み込んだ点が画期的である。これにより、緊急性の判断、不確実性の説明、追加情報の聞き取りといった、臨床現場で不可欠な判断力がAIモデルに強化された。従来のモデルが持つ推論能力に加え、医療専門家による実践的な視点が学習データに反映されたことで、AIの医療知能は新たな段階に入ったと言える。

事実誤認を71%削減した医療特化モデルの性能とは？

OpenAIの発表によれば、GPT-5.5 Instantは実運用環境でのモニタリングにおいて、事実誤認を招く回答の割合が過去2カ月で71％減少した。さらに、医師によるブラインドテストでは、GPT-5.5 Instantの回答が人間の医師の回答よりも高く評価されている。特に地域ごとの医療事情への適応や、危険信号（レッドフラッグ）の見落とし防止において、従来のモデルや人間を上回るパフォーマンスを示したとされる。

週2.3億人の健康相談を支えるAIに求められる安全性とは？

現在、週に2億3,000万人以上が健康やウェルネスに関する相談にChatGPTを利用している。医療情報が人々の健康に直接影響を与える性質を鑑み、OpenAIはモデルの回答精度と安全性の向上を最優先課題に据えてきた。AIが提供する情報の信頼性は、誤った自己診断や不適切な対応を防ぐ上で極めて重要であり、今回の強化はそうした社会的要請に応えるものと見られる。

AIによる医療アドバイスは「補助」としてどう機能するのか？

AIの医療知能向上は、医療情報の民主化を促進する可能性を秘める。しかし、企業がAIを医療現場に導入する際には、既存のITインフラとの統合、運用負荷の増大、データレジデンシー、セキュリティ対策といった実務的な課題が伴う。AIが提供する情報はあくまで「補助」として位置づけ、個別の患者背景や複雑な臨床判断に最終責任を持つのは人間であるという前提を、システム設計と運用ポリシーの両面で明確にすることが不可欠である。

医療現場への本格導入に向けた法的・倫理的課題は何か？

AIが「医師より優れている」と評価されたとしても、それは特定の評価基準に基づく統計的な結果に過ぎない。医療には個別の患者背景や複雑な臨床判断が伴うため、AIが提示する「正解」が常に個々の患者にとって最適とは限らない。誤った医療アドバイスが提供された場合の責任分界点、法規制への適合、そして日本のような独自の保険制度や診療ガイドラインを持つ国々での正確性の担保など、社会的な合意形成と制度設計が今後の本格導入に向けた重要な焦点となる。

OpenAI、医療知能を強化した「GPT-5.5 Instant」を公開。医師の評価で人間を凌駕する精度へ

参照ソース

関連記事