本文围绕GenMI在医疗报告生成领域的应用展开,介绍了其在临床中的优势、发挥优势的范例,同时指出了应用过程中需要克服的四大挑战,最后强调了GenMI在医疗领域的前景以及制定相关基准和验证的重要性。
在当今医疗领域,科技的发展正不断推动着医疗服务的进步。除了深入分析医疗报告生成的新模型所具备的优势以及应用场景之外,相关研究团队积极倡导一种全新的范式,旨在以充分赋予临床医生及其患者权力的方式来部署GenMI。
目前,在临床实践中,现有的绝大多数AI解决方案都存在一定的局限性。它们往往只侧重于自动完成医学影像中的单一任务,却没有充分考虑到放射学和临床成像中所涉及的更为全面的综合分析。然而,AI实际上在医学成像和报告方面蕴含着巨大的潜力,它能够实现更为广泛的用途。例如,AI可以快速撰写出涉及多科室的权威报告,能够摄取多种模式和临床数据,进而生成更加准确、流畅且具有可解释性的报告。
图|GenMI的能力
若要利用GenMI来协助临床医生和患者,从而在临床环境中充分发挥其优势,我们可以通过两个范例来深入理解。
第一个范例是部署AI住院实习医师。AI住院实习医师会首先专门起草临床上准确的报告,这些报告可以作为住院实习医师或医生撰写报告的起点。在开发过程中,研究人员会在临床环境中对模型进行前瞻性测试。之后,AI住院实习医师可以在主治医师的监督下进行微调或校准,并且从所需的修正和补充中不断学习。
图|部署AI住院实习医师
第二个范例是符合人类偏好。基于人类反馈的强化学习(RLHF)和直接偏好优化(DPO)是应用于此类任务的两种重要技术。对话式医疗报告生成模型具有诸多优势,它使临床医生能够根据实际需要提供反馈和提出后续问题。同时,它还可以与临床医生展开合作,通过生成式AI改变输入图像的属性,观察模型预测中的相关差异,并将这些差异与临床医生识别出的突出特征进行对比,从而对AI成像工具进行审核。此外,该模型还可以对为患者生成的报告进行调整,使其表述更加直白,减少医学术语的使用,更多地围绕患者的病情展开。
总的来说,临床医生可以通过3种途径与AI系统协作。然而,研究团队也明确指出,要想充分发挥GenMI等AI系统的优势,还需要克服一系列挑战,主要包括以下4大方面。
首先是基准和评估指标问题。在安全实施医学报告生成模型,并且让AI住院实习医师在住院治疗中发挥更为重要的作用之前,必须开展评估下游临床效果的研究,明确衡量标准。因为流行的大语言模型(LLM)的性能会随着时间的推移而发生显著变化,这种差异可能会引发严重的后果。例如,疾病预测模型可能会被不法分子操纵以输出特定的诊断和结果测量,从而导致处方过量、保险欺诈和伪造临床试验等问题。所以,在将LLM作为人工智能住院实习医师的一部分进行部署时,必须确保采取一致的安全措施和监管。
其次是临床医生和患者的过度依赖问题。临床医生可能由于对错误问责的模糊性、确认偏差和自动化偏差等各种原因,过于依赖机器自动化指导,不愿意更改AI生成报告中的文字,从而忽略模型无法识别的罕见发现。虽然AI住院实习医师可以让患者直接与真正的临床专家进行交流,但这些交流应该在可控的情况下进行,以免患者过度依赖AI住院实习医师来指导他们的医疗护理。同时,临床医生应向患者传授正确的查询方法,并让他们了解AI工具,以便患者能够自己进行探索。在部署AI住院实习医师的整个过程中,必须充分认识到AI系统的局限性,尤其是在直接护理等只有人类才能处理和提供的更广泛的语境、同理心和认知的领域。
然后是有偏差的数据集和模型问题。深度学习模型,尤其是LLM,很容易受到训练数据固有偏差的影响。在AI住院实习医师的范例中,这种缺陷尤其容易引发问题,因为模型不仅会在生成的报告中延续这种偏差,还会在医学教育和临床医生理解等方面产生不良影响。此外,人类的主观反馈是改进AI住院医师的关键因素,而这本身就可能造成有偏见的反馈循环。训练数据的质量、规模和平衡也是决定模型偏差的重要因素,因此亟需更广泛、更具代表性的数据集。目前,大多数进展都是由MIMIC - CXR等数据集推动的,这些数据集仅限于单模态胸部X光扫描,其他数据集也不平衡,除了配对图像和相关报告普遍不足外,与正常扫描相比,异常扫描要少得多,并且往往会捕捉到更常见的疾病,而罕见的疾病则很少出现。异常也通常只局限于图像的一小部分,因此模型很难对其进行筛选。
最后是新的模式和新的科室问题。目前,将GenMI应用于三维成像(包括MRI和CT扫描)的工作十分有限。部分原因是这一领域缺乏大型标注数据集,只有少数未发布、稀少或难以获取的数据集。除了三维放射图像,GenMI还以有限的方式应用于其他科室。眼科和皮肤科的报告生成在一定程度上取得了成功,在其考虑中纳入了外部知识和疾病分类等标准技术。尽管纳入新科室和图像类型将扩展AI工具的能力,但获取大规模多模态数据集的成本非常高昂,只有资源充足的公司才有能力收集或授权使用这些专有数据集。
自动生成医疗报告在减轻临床负担、扩大专家级临床医疗服务覆盖面方面展现出了广阔的前景。GenMI可以生成更高质量的报告,通过提供交互式临床专业知识赋予临床医生和患者权力,并通过扩展教育功能改善未来的临床护理。研究团队表示,在不同模式和科室的临床环境中,制定衡量其效果的公开基准、进行持续的临床合作和谨慎的模型验证至关重要,这有助于学术界更透明地衡量报告生成的进展,并为临床监管机构未来的工作提供指导,确保GenMI等技术安全有效地应用于医疗领域。
本文详细介绍了GenMI在医疗报告生成方面的优势及应用范例,包括部署AI住院实习医师和符合人类偏好两种方式。同时也指出了其应用面临的四大挑战,如基准和评估指标、过度依赖、数据集和模型偏差以及新的模式和科室等问题。尽管存在挑战,但GenMI在减轻临床负担、提升医疗服务质量方面具有广阔前景,制定相关基准和验证工作对其安全有效应用至关重要。
原创文章,作者:Sorrowful,如若转载,请注明出处:https://www.gouwuzhinan.com/archives/44770.html