研究:AI医学诊断的平均准确性为52.1%,可与非
- 编辑:澳门新葡澳京官方APP -研究:AI医学诊断的平均准确性为52.1%,可与非
4月21日,由Hirotaka Takita博士主持的研究小组和大阪大都会大学医学研究生院副教授Daiju Ueda最近发布了系统的审查和荟萃分析,并深入评估了在诊断医疗状况和将其与医生进行比较的人工智能表现的评估。本文指出:研究团队总共筛选了18,371项研究,最后确定了83个以进行详细分析。这些研究涵盖了各种生成AI模型,包括GPT-4,Llama3 70B,Gemini 1.5 Pro和Claude 3十四行诗,涵盖了许多医疗领域。其中,GPT-4是研究最多的模型。结果表明,这些AI模型的平均诊断准确性为52.1%(间隔95%:47.0%-57.1%)。某些模型的诊断准确性与非专业医生相媲美,并且两者之间没有显着统计差异。但是,熟练的医生的表现是比AI更好,精度为15.8%(95%置信区间:4.4%-27.1%,p = 0.007)。但是,随着技术的继续前进,该空间可能会逐渐缩小。研究还发现,在大多数医学专家中,AI在两个例外:皮肤病学和泌尿科中都在不断地表现。在皮肤病学中,AI的性能更好,也许是因为该领域涉及识别模式,AI的强度。但是皮肤病学还需要对患者进行复杂的推理和决策,因此AI的好处无法完全证明该领域应用程序的实际价值。对于SA泌尿科,结果是基于一项重大研究,因此其结论是有限的。 “这项研究表明,AI开发对未经劳累的医生具有可比的诊断能力。它可以用于医学教育,支持不可理解的医生,并有助于医疗资源有限的地区的诊断。” “未来的研究需要在更复杂的临床情况下进行评估,使用实际的医疗记录进行绩效评估,提高了AI的决策 - 制定的透明度,并向各种患者人群进行了证明,以进一步证明AI的能力。“除了诊断领域,研究还提供了在医学教育中发展的AI的潜力,可以将AI的潜力提供给医学上的机器人。研究人员说。EIR工作?此时很难结束,但是在诊断领域,这种情况是可能的。