研究:医療LLMの診断精度は「人間との対話」を介して大きく低下する

watanabe

2025.07.15

英オックスフォード大学の研究者はこのほど、医療知識に優れる3種のLLM(GPT-4o、Llama 3、Command R+)が、一般人にどれほど効果的に医療アドバイスを提供できるかを検証した。

LLM単体では疾患同定率94.9%、緊急度判定率56.3%と高精度だったが、参加者がLLMを使った際の正解率は疾患同定率34.5%以下、緊急度判定率44.2%以下にとどまり、対照群と差がない結果となった。

研究者は「専門家レベルの知識保持だけでは、一般ユーザーとの対話を介した医療相談には不十分」と警鐘を鳴らした。

記事原文はこちら(『The Medical AI Times』2025年6月23日掲載)
※記事公開から日数が経過した原文へのリンクは、通常に進行しない場合があります。ご了承ください。

あわせて読みたい

お問い合わせ

記事に関するご質問やご相談などがございましたら、こちらからお気軽にお問い合わせください。

メールマガジン

注目ニュースをチェック!最新情報をいち早くお届けします。メールマガジンの購読はこちらからどうぞ。

TOP