人工智能技术与眼科的结合,是搅局还是趋势?
眼健康管家作品
眼健康科普是眼科疾病的首选良药
科普知识源自专业的积累!
微信ID:yanguanjia001
Hey!
人工智能技术与医学的结合
搅局还是趋势
新挑战?
人工智能(artificial intelligence,AI)技术与医学的结合是当前趋势,眼科学因丰富的影像资料成为研究热点。目前,关于糖尿病视网膜病变、年龄相关性黄斑变性及青光眼等常见致盲眼病已有较多AI研究,相关成果已逐步应用于临床实践,但同时面临许多挑战。
“
人工智能 眼科=?
医学影像数据识别是AI尤其是深度学习技术在医疗领域最为常见和普遍的应用,眼科因影像资料丰富、获取便捷而成为研究重点。2017-2019年发表的AI与医学影像相关的同行评议研究中,眼科领域研究约占1/4。迄今,美国食品药品监督局( FDA)已批准30多项AI医学产品,而眼科疾病筛查应用属于首批获准的产品[2]。本文重点就糖尿病视网膜病变(DR)、年龄相关性黄斑变性(AMD)以及青光眼等主要致盲性眼病相关的AI研究展开,概述眼科领域AI研究现状及主要问题和应对。
“
AI用于DR筛查的问题
糖尿病视网膜病变(DR):基于眼底照相的DR筛查是AI在眼科应用最早、相关研究最多且最为接近应用层面的领域。美国FDA 于2018年4月首次批准了AI产品IDx-DR用于DR筛查诊断,并于2020年8月再次批准类似产品EyeArt的临床应用。EyeArt及Retmarker两款AI产品已在欧洲应用于DR筛查。我国国家药品监督管理局(National Medical Products Administration,NMPA)在2020年也认证了两项DR筛查软件。此外,基于AI的DR识别与严重程度分级已应用于以人群为基础的研究中,基于AI 的DR筛查已列入印度DR筛查规范[3-5]。
AI的DR筛查在应用中可分为AI独立筛查以及AI与人工筛查结合两种模式。AI独立筛查的阈值设置需兼顾敏感性和特异性,以保证筛查结果的准确性。在AI与人工结合的筛查模式中,需设置高敏感性的AI筛查阈值以检出可疑DR,避免漏诊,然后进一步人工确认。AI与人工结合的筛查模式更符合当前医疗现状,因此在实际应用中更加推崇[5]。
在AI对DR筛查逐级走向应用的过程中,尚有如下问题需要思考。首先,目前AI对DR筛查的主要目标是识别普通眼底照相可见的DR或较为严重需转诊的DR,未来应综合多维度临床资料以及多模态影像检查,训练出AI算法用于识别先于眼底检查可见的DR(临床前DR)以及高危人群,并予以及早干预,防患于未然,减少或避免相关视觉损伤。其次,目前多数AI软件仅识别单一疾病,筛查DR的同时识别及转诊其他眼科疾病是值得关注和探索的问题。此外,便捷高效的DR筛查必定增加眼科门诊就诊量,还需考虑整体医疗资源配置。
“
AI在AMD进展及疗效预测研究中的问题
年龄相关性黄斑变性(AMD):现阶段AI与AMD相关的研究主要包括基于彩色眼底像及OCT图像的疾病识别与病灶分割。在疾病识别层面,AI识别晚期AMD的敏感性与特异性较佳,而识别早、中期AMD相关病变如玻璃膜疣、视网膜色素上皮改变等的准确性尚待进一步提高[6];在病灶分割层面,基于OCT图像研发的AI算法可识别、自动分割以及量化AMD相关特征,如视网膜下/内液区、色素上皮脱离区域等,与眼科医生相比均有较高一致性[5]。
AMD相关AI研究的主要问题在于,使用的数据库特征单一,迁移性差;绝大多数为横断面研究,仅少数研究关注了AI算法对于AMD进展或转化的预测能力,以及根据AMD病灶特征预测治疗反应及临床预后的能力[5, 7]。鉴于AMD视力损伤的不可逆性及治疗手段的局限性,早期发现高危人群、加强随访和危险因素干预尤为重要。而AMD病变的连续性及病程的相对长期性,则为预测性研究以及早期干预提供了理论上的可能性和现实中的可行性。因此,AI与AMD相关的研究应纳入更多纵向数据,研发AI算法用于预测和早期识别易于进展为晚期AMD的高危人群及危险因素;寻找可辅助AMD临床治疗决策、判断预后转归的相关特征。
“
AI在青光眼筛查应用研究中的问题
青光眼:青光眼筛查也是眼科较早开展AI研究的领域,主要是依据眼底照片以及视野、OCT等数据识别青光眼或可疑青光眼,总体显示出较高的敏感性和特异性[5, 8]。青光眼AI筛查诊断研究的主要障碍源于青光眼诊断本身。首先,青光眼及可疑青光眼的诊断均不同程度地依赖眼底照片,但眼底照片显示的青光眼相关特征(如杯盘比)等,缺乏解剖学依据、主观性较强、易受个体因素影响[9]。因此,以眼底照片作为青光眼AI模型训练的主要数据源,易导致学习误差。其次,当前青光眼诊断之于其病变本身具有相对滞后性,当结构及相应的功能学改变或进展出现时,病情实则已进展至较严重阶段,因此,基于当前青光眼诊断标准训练的AI模型仍难实现青光眼的早期诊断[5-6]。此外,青光眼领域AI研究与其他疾病领域存在同样的问题,即目前AI算法主要以识别青光眼与正常人群为目标,少有研究关注合并的其他疾病如高度近视等[8]。高度近视作为青光眼的重要危险因素常与青光眼性视神经病变同时存在,二者共存也是AI模型诊断青光眼假阴性最为常见的原因[10-11]。
青光眼作为不可逆性致盲性眼病,预测其发生以及早期诊断至关重要。AI强大的学习能力和数据处理能力为青光眼的诊断性研究提供新契机,这一点主要体现在两方面。其一,基于以现有诊断标准作为标签的数据训练AI模型,提高当前青光眼筛查与诊断效率;其二,借助深度学习技术的数据挖掘与信息提取能力,发现新线索、建立新假说,推动相关临床与基础研究,从而进一步加深对青光眼病理生理机制的理解,促进新的诊断思路形成。
从眼科研究者层面,当前最重要的是构建涵盖多维度信息与多样化特征的训练数据集,包括:利用早期青光眼数据;综合OCT构型参数、功能学、遗传学信息以及临床资料;纳入高度近视等与青光眼具有相似特征的病变等。考虑到目前并无非常理想的青光眼早期诊断标准,以单一的结构性或功能性改变以及青光眼相关临床特征,如高眼压、神经纤维层缺损、盘沿出血、可关闭房角等作为识别目标也有一定意义。另外,还应利用前瞻性纵向数据进行更多的预测性及验证性研究,以促进构建更加客观、准确的AI算法,推动实现青光眼的早发现、早诊断、早治疗。
“
目前AI应用于眼科领域研究的普遍问题
(一)数据库特征的单一性难以全面反映真实世界特征
目前用于AI研究的数据多为公开数据集或曾作为其他研究使用的数据,而非有针对性的前瞻性设计,存在明显的单一性和同质性。首先表现为疾病种类的单一性,大多数用于模型训练及验证的数据仅包含目标疾病和正常人群;其次是目标疾病或研究人群特征的单一性。考虑到真实世界中许多人可能合并多种眼科疾病,许多眼科疾病的发病及病变特征存在明显的种族差异,上述因素均不利于AI算法在真实世界中的有效迁移和应用。
(二)不同平台的影像数据融合能力差
用于AI算法训练的影像数据可能来自不同的检查设备,当AI模型应用于不同于其训练数据源设备获取的图像时,其准确性往往会降低,这一点在OCT图像方面体现的最为明显[12]。
(三)基于电子病历系统的临床信息利用度低
除客观影像学检查外,常规临床诊疗信息对于疾病诊断,特别是危险因素识别、疾病严重程度分级、病变进展、治疗反应及预后评估也具有重要价值,但由于电子病历系统的数据质量普遍不高,相关AI研究较少[13]。
(四)不同研究中AI模型效力缺乏可比性
眼科领域AI研究中,模型的准确性评价多以专科医师、读片中心人员或临床诊断为参考。由于不同研究数据集差异、医师专业水平差异,尤其是研究采用的疾病诊断与分级标准的差异,使得不同研究间AI模型的效力缺乏可比性[5]。
未来AI与眼科相关研究应纳入多模态数据,尤其是包含功能学、治疗、预后等信息的临床资料,同时增加训练数据特征的多样性,并使用来自不同设备、人群、研究中心的独立外部数据进行验证测试,以研发客观、可靠的AI模型进行眼病诊断及分级,预测疾病发生发展和治疗获益。
(五)AI研究流程不规范及结果汇报不标准
尽管近年来医学领域AI应用研究发展迅速,但不规范的研究流程以及结果展示仍是普遍存在的问题。2019年伯明翰大学医院等机构的学者评估了122篇符合相关方向的AI医疗领域研究,合格率仅为20%。该研究将目前AI医学领域研究共同问题归纳为以下方面:大多数研究中的诊断是孤立的,不能反映临床实践;AI研究的样本量计算缺乏共识;多基于既往曾用于其他疾病研究的数据,前瞻性设计的AI研究较少;不同研究间AI模型效能评估参数不统一,绝大多数研究报告敏感性和特异性时未报告参考阈值,或阈值设置不符合临床实际;数据集命名规则不统一,模型缺乏透明性;未使用独立数据进行外部测试等[14]。
总之,AI在医疗领域尤其是眼科领域存在巨大的应用需求和应用前景,但也存在诸多问题。今后的研究亟需针对目标疾病的研究盲区,结合应用场景进行有针对性的高质量研究,同时多项标准化规范的出台和应用势必进一步提高AI医学研究质量,促进AI产品早日在眼科实践中发挥更大优势。
参 考 文 献
[1]LeCun Y, Bengio Y, Hinton G. Deep learning. Nature, 2015, 521: 436-444.
[2]https://medicalfuturist.com/fda-approved-ai-based-algorithms.
[3]Raman R, Ramasamy K, Rajalakshmi R, et al. Diabetic retinopathy screening guidelines in India: All India Ophthalmological Society diabetic retinopathy task force and Vitreoretinal Society of India Consensus Statement. Indian J Ophthalmol, 2021, 69(3): 678-688.
[4]Li JO, Liu H, Ting DSJ, et al. Digital technology, tele-medicine and artificial intelligence in ophthalmology: A global perspective. Prog Retin Eye Res, 2020:100900. doi: 10.1016/j.preteyeres.2020.100900 [Epub ahead of print].
[5]Ting DSW, Peng L, Varadarajan AV, et al. Deep learning in ophthalmology: The technical and clinical considerations. Prog Retin Eye Res, 2019, 72:100759. doi: 10.1016/j.preteyeres.2019.04.003. Epub 2019 Apr 29.
[6]Sarhan MH, Nasseri MA, Zapp D, et al. Machine learning techniques for ophthalmic data processing: A review. IEEE J Biomed Health Inform, 2020, 24: 3338-3350.
[7]Ting DSW, Pasquale LR, Peng L, et al. Artificial intelligence and deep learning in ophthalmology. Br J Ophthalmol, 2019, 103(2): 167-175.
[8]Mirzania D, Thompson AC, Muir KW. Applications of deep learning in detection of glaucoma: A systematic review. Eur J Ophthalmol, 2020: 1120672120977346. doi: 10.1177/11206721209 77346. Online ahead of print.
[9]Chauhan BC, Burgoyne CF. From clinical examination of the optic disc to clinical assessment of the optic nerve head: a paradigm change. Am J Ophthalmol, 2013, 156(2): 218-227.
[10]Li Z, He Y, Keel S, et al. Efficacy of a deep learning system for detecting glaucomatous optic neuropathy based on color fundus photographs. Ophthalmology, 2018, 125(8): 1199-1206.
[11]Li Z, Guo C, Lin D, et al. Deep learning for automated glaucomatous optic neuropathy detection from ultra-widefield fundus images. Br J Ophthalmol, 2020: 317327. doi: 10.1136/bjophthalmol-2020-317327. Online ahead of print.
[12]Rim TH, Lee AY, Ting DS, et al. Detection of features associated with neovascular age-related macular degeneration in ethnically distinct data sets by an optical coherence tomography: trained deep learning algorithm. Br J Ophthalmol, 2020: 316984. doi: 10.1136/bjophthalmol-2020-316984. Online ahead of print.
[13]Lin WC, Chen JS, Chiang MF, et al. Applications of artificial intelligence to electronic health record data in ophthalmology. Transl Vis Sci Technol, 2020, 9(2):13.
[14]Liu X, Faes L, Kale AU, et al. A comparison of deep learning performance against health-care professionals in detecting diseases from medical imaging: a systematic review and meta-analysis. Lancet Digit Health, 2019, 1(6): e271-e297.
[15]Rivera SC, Liu X, Chan AW, et al. Guidelines for clinical trial protocols for interventions involving artificial intelligence: the SPIRIT-AI Extension. BMJ, 2020, 370: m3210.
[16]Liu X, Rivera SC, Moher D, et al. Reporting guidelines for clinical trial reports for interventions involving artificial intelligence: the CONSORT-AI Extension. BMJ, 2020, 370: m3164.
来源:《眼科》杂志