基于机器学习的肺结节良恶性分类研究进展
基于机器学习的肺结节良恶性分类研究进展
肺癌是发病率和死亡率增长最快,对生命威胁最大的恶性肿瘤之一。据世界卫生组织报告,中国在过去40年中,肺癌死亡率增加了4倍,未来可能还会进一步增加。肺癌患者的生存率一般与肺癌类型、治疗方式等因素有关系,据统计,肺癌患者在早期发现并及时治疗5年生存率可以接近90%,而晚期肺癌患者在进行治疗后的生存率仅为2%~5%,所以肺癌生存率与首次治疗时诊断的疾病阶段有重要联系。
相对于其他癌症,肺癌患者在早期多无明显临床症状,大约75%的肺癌患者被发现时已是中晚期,此阶段治疗费用高且效果不佳,因此肺癌的早期发现对于患者的生存和康复至关重要。传统的肺癌早期筛查是医生通过肉眼直接观察肺部计算机断层扫描图像(computed tomography, CT),来评估患者肺部的肺结节的良恶性程度。但一位患者的CT图像往往有上百张切片,对这些图像采用人工方式进行观察、判断,工作量巨大,且一些CT图像上较小的肺结节由于不易观察可能会造成误诊漏诊。所以在汉斯出版社《生物物理学》期刊中,有学者提出迫切需要开发出辅助工具来帮助医生诊断这些可疑性肺结节,提升医生对肺结节良恶性的诊断效率。
一般肺部的影像学检查包括X线检查、计算机断层扫描、磁共振成像(magnetic resonance imaging, MRI)、正电子发射断层显像(positron emission tomography CT, PET-CT)。X线操作简单且价格便宜,缺点是发现隐蔽部位难。CT是横断扫描,避免了器官的重叠,能够发现细小病灶,组织分辨率高,密度分辨率相较于X线检查高,其中的高分辨率CT(high resolution CT, HRCT)相对于普通CT,可精准定位,观察到肺结节的具体位置,且具有更高的分辨率。
MRI拥有更好的软组织密度分辨率以及各方位成像,对显示肿瘤较好,更适合于中晚期、术后和放疗后患者的检查,较CT图像采集时间长,更易导致伪影,且膨胀的肺内质子密度较低,导致信噪比低,图像质量差。PET是一种进行功能代谢显像的分子影像学设备,PET检查采用正电子核素作为示踪剂,通过病灶部位对示踪剂的摄入了解病灶功能代谢状态,从而对疾病正确诊断,但需要注射对比剂,对病灶的空间定位及定性准确率不高,价格昂贵。PET-CT是将PET获取的信息与CT图像相结合对病灶进行综合分析,尤其在对诊断孤立肺结节时,其灵敏度要比单独的PET或CT更高,然而PET-CT费用较高昂,辐射剂量大,操作较复杂,对肺结节评估受限,也存在一定的假阳性及假阴性,并不普及。
基于深度学习的图像分类能通过深层架构自动学习更多抽象层次的数据特征,无需对特定的图像数据或分类方式设计具体的人工特征,能够以图像特征的识别和分类来训练模型,并利用模型的准确率、特异性等多重评价标准来反向指导特征的提取,最重要的深度学习方法有:自动编码器(auto-encoder ,AE)、深度信念网络(deep belief network, DBN)、深度玻尔兹曼机(deep Boltzmannmachines, DBM)以及卷积神经网络(convolutional neutral network,CNN),但是目前用于肺结节分类任务中的较多为AE、DBN和CNN。
在上述研究中,肺结节分类任务取得了不错的结果,相对于深度学习方法提取特征更有针对性,但是目前利用人工提取的特征还存在一些局限性:1)在放射组学中,非标准化获取的数据集会增加特征描述噪声,影响预测的准确性;2)提取放射组学特征时,需要对图像进行分割,分割算法的不同,会造成后续提取特征的差异性;3)利用CT图像的底层特征,如灰度特征等,这些特征一般是人工设计的,存在着主观差异性;4)需要考虑到临床中系统水平的变化,扫描仪的参数设置和操作员的精确度都需要考虑到。
文章链接:https://doi.org/10.12677/BIPHY.2021.92006