美国医学会儿科杂志:ChatGPT在诊断儿科病例时准确率较低

近期,一项研究报告在《美国医学会儿科杂志》上发表,该报告指出,以ChatGPT为代表的大语言模型在诊断儿科病例时的准确率较低。研究报告的作者之一,美国纽约科恩儿童医学中心的Joseph Barile博士表示,尽管大语言模型在某些情况下展现出了较高的诊断能力,但目前它们还无法替代医生的专业判断。
在这项研究中,研究者们使用ChatGPT对100个随机儿科病例进行了诊断。然而,结果显示,ChatGPT的诊断正确率仅为17%。这一结果引发了人们对大语言模型在临床诊断中准确性和可靠性的质疑。
相比之下,人类的医生在面对相同的病例时,往往能够给出更为准确的诊断。这不仅是因为医生具备丰富的医学知识和经验,还因为他们能够根据患者的具体情况进行全面的分析和判断。
尽管大语言模型在某些情况下能够提供有价值的医学建议和信息,但它们并不能替代医生的专业判断和临床经验。在诊断儿科病例时,需要考虑的因素非常多,包括患者的年龄、症状、病史、家族史等等。这些因素都需要医生进行全面的分析和评估,才能给出准确的诊断。
此外,大语言模型的训练数据有限,无法涵盖所有的病例和情况。这意味着大语言模型在面对某些特殊病例时可能会束手无策,甚至给出错误的诊断。因此,在临床实践中,医生仍需要依靠自己的专业知识和经验来进行诊断。
然而,这并不意味着大语言模型在医学领域没有价值。事实上,它们在医学领域的应用前景非常广阔。例如,大语言模型可以帮助医生快速查找医学文献和资料,提供有价值的参考信息和分析。此外,大语言模型还可以帮助医生进行病历分析和数据挖掘,提高医疗服务的效率和质量。
总之,虽然大语言模型在某些情况下能够提供有价值的医学建议和信息,但它们目前还无法替代医生的专业判断和临床经验。在诊断儿科病例时,医生仍需要依靠自己的专业知识和经验来进行全面分析和判断。未来随着技术的不断进步和应用领域的拓展,大语言模型在医学领域的应用前景将更加广阔。
本文参考来源:澎湃新闻


