GPT-4 在检测放射学报告中的错误方面与放射科医生相匹配

据《放射学》发表的研究，大型语言模型 GPT-4 在检测放射学报告中的错误方面与放射科医生的表现相匹配。

由于住院医师与就诊者之间的差异、语音识别不准确和工作量大，放射学报告可能会出现错误。大型语言模型(例如 GPT-4)有潜力增强报告生成过程。

“我们的研究为 OpenAI 的 GPT-4 的潜力提供了一种新颖的检验，”该研究的主要作者、德国科隆大学医院放射科住院医师、医学博士 Roman J. Gertz 说道。

“之前的研究已经证明了 GPT-4 在放射学患者旅程各个阶段的潜在应用：例如，根据患者的病史选择正确的影像检查和方案、将自由文本放射学报告转换为结构化报告或自动生成报告的印象部分。”

然而，Gertz 博士指出，这是第一项将 GPT-4 与人类在放射学报告中的错误检测方面的表现进行独特比较的研究，从准确性、速度和成本效益方面评估了其针对不同经验水平的放射科医生的能力。

Gertz 博士及其同事着手评估 GPT-4 在识别放射学报告中常见错误方面的有效性，重点关注性能、时间和成本效率。