十大问题帮助医生决定是否使用人工智能临床辅助决策支持系统(CDSS)

临床辅助决策支持(clinical decision support,CDS)系统是AI临床应用的重要方面,其可辅助医生在疾病诊断、治疗、预防等方面进行决策。由于CDS的诸多不确定性,临床医生和卫生系统决策者对其安全性和价值可能存在疑问。例如,如果CDS的建议诊疗方案与医生最初思路不一致,医生是否该信赖CDS?
NEJM姊妹杂志NEJM Catalyst Innovations in Care Delivery在2020年底曾发表一份由10个问题组成的清单,帮助临床医生和决策者深入了解CDS,理性做出购买和使用决策[1]。该文作者来自美国布列根和妇女医院(Brigham and Women’s Hospital)、杜克大学(Duke University)。《NEJM医学前沿》在此节选翻译该文。
在8月29日即将召开的“AI+医疗:守正创新,智造未来”(点击查看详情)峰会,NEJM主编及AI医疗专家也将共同探讨医学AI软件的临床应用问题。

1. 与现状相比,使用人工智能CDS软件或系统是否会产生重要的临床改善?
这个问题是所有医疗产品都面临的首要问题。对于AI软件,“改善”可在任一方向发力:改善个体或群体健康、改善就医体验、降低医疗成本和改善医务人员的工作环境。有些软件虽然仅能将某些任务自动化,但它们可以让临床医生将更多时间花在患者身上,并专注于医疗其他方面。
2. 使用人工智能CDS软件是否适合我或团队的临床工作流程?
工具只有使用才有价值,如果使用不方便、过于费时费力,则不会有价值。电子病历的推广应用提示,临床医生憎恨所有不适应他们现有工作流程的技术,并且只在临床收益较大时才愿意改变自己的工作模式来适应新的工具或技术。因此,CDS软件的门槛包括下列问题:
  • 这个工具在我当前的工作流程中有意义吗?

  • 它能否及时提出建议?

  • 是否需要我手动输入信息、转到另一个屏幕或多次“点击”?

  • 如果是,其所带来的临床收益是否值得我付出更多劳动和忍受可能的烦恼?

3. 人工智能CDS软件会提供哪些关于治疗决策或建议背后的逻辑信息?这些建议正确的可能性有多大?
临床医生应当信任他们正在使用的软件,还要理解有些治疗建议对某些患者或许不太可靠。除了输出结果之外,软件系统还能提供哪些信息也极为重要,这样使用者才知道如何解读结果。例如,软件可以指出某项具体建议的确定性有多高,还可以指出哪些关键的输入信息影响了治疗建议。
依赖CDS系统所带来的风险不同,临床医生需要了解的关于诊疗建议的相关信息也会不同。例如,临床医生很容易接纳手术室自动排班软件;而影响治疗决策的软件——如推荐具体的肿瘤治疗方案或卒中溶栓治疗方案——则需要提供大量信息和解释才能获得临床医生的认同。
4. 开发和训练人工智能CDS软件的数据来源是什么?
临床医生必须了解机器学习系统训练时所使用的数据类型,还要了解这些数据与自身所在医疗机构的相似程度。当前众多人工智能CDS系统都使用影像数据,但机器并不是简单地只学习图像。各种其他因素——例如,哪些类型的患者愿意接受影像学检查、所用检查设备、患者体位以及检查时间——都可能产生依赖于某个医疗机构的模式,该模式被学习算法检测并且应用于诊疗建议。因此,来自一家医疗机构的训练数据可能会出现偏差,导致系统对来自其他医疗机构数据做出不恰当的建议。
5. 训练数据是如何标注的?
在有“监督”的机器学习系统中,学习算法暴露于大量输入数据中。数据标注方式对算法性能和对防止训练数据的非故意偏差也至关重要。
6. 人工智能CDS软件是否足够尊重患者隐私?
患者隐私可能受到侵害的主要方式有两种:首先,患者的数据可能被用于系统训练和测试;其次,临床医生可能将患者的数据输入软件以获得治疗建议。
7. 人工智能CDS软件是否受FDA监管?如果是,它是否获得监管机构的认可或批准?
8. 如果一套软件系统不受FDA监管,它是如何测试的,依据什么标准,由谁测试(软件开发商之外)?
对于不受FDA或其他监管机构审查的软件系统,必须了解人工智能CDS软件测试方法、所依据标准以及软件开发商之外的测试机构。
9. 该人工智能CDS软件是否经过我们医院或医疗系统数据的测试?
对于负责软件购买的决策者,这是必须询问的问题;但该医疗系统内的临床医生同样应该咨询这个问题。基于前文关于软件性能的讨论,一款软件产品必须进行测试,无论是购买前还是软件部署期间,都要用软件使用机构的数据进行测试。
在软件即将被使用的场景下进行测试(例如,辅助临床决策)有望获得最准确的测试结果。临床医生和医疗机构应该使用他们自己患者的实时数据,并将其输入到软件中;其流程与实际工作相同。只有这样,他们才能观察到并理解软件及其算法将如何影响他们的临床工作,还可了解这些软件有无临床价值。
10. 软件开发者在人工智能CDS软件升级更新方面做了哪些承诺,以应对潜在的性能下降?

智能手机和计算机用户习惯了定期和频繁的软件更新,但医疗设备的维护并不是为典型的数周到数月的软件产品更新周期而设计的。美国FDA正在探索管理这些产品的新方法,但与此同时,临床医生和医疗系统应该询问开发者软件的更新方式和频率——以及用于更新的新训练数据与原始训练数据的采集和标注方式可能有哪些不同。医疗系统可能还应该用其自己的患者群体的较新数据,定期对软件性能进行测试,以了解他们的数据是否正在发生导致软件性能下降的变化。

参考文献

1. Silcox C, Dentzer S, Bates DW. NEJM Catalyst Innovations in Care Delivery 2020;06. DOI:https://doi.org/10.1056/CAT.20.0212
(0)

相关推荐