人工智能有助于识别早发性结直肠癌的新危险因素

Parker等人在AACR虚拟特别会议上提出的研究结果:人工智能、诊断和影像学(摘要PR-10),基于电子健康记录的人工智能可能有助于发现早发性结直肠癌的新风险因素。人类免疫缺陷病毒(HIV)、炎症、肥胖、哮喘、鼻窦炎和皮炎等引起慢性免疫抑制的疾病被机器学习模型确定为年轻人患结直肠癌的新危险因素。

尽管65岁以上人群的结直肠癌发病率和死亡率分别以每年3.3%和3%的速度下降,但50岁以下人群的结直肠癌发病率和死亡率分别以每年2%和1.3%的速度上升。2020年,美国约有147950人被诊断为结直肠癌,53200人死于结直肠癌。
虽然肥胖、饮食、缺乏运动、炎症性肠病和家族史常被认为是这种癌症早期发病的因素,但它们不能解释年轻人结直肠癌发病为何呈上升趋势。
研究方法:
研究人员从OneFlorida临床数据研究网络中检索了1227例结直肠癌患者的电子健康记录,并匹配了34157例年龄在50岁以下的人群做对照。然后他们对数据应用了四种机器学习算法;结肠癌和直肠癌分别建立模型。
对于每个患者,研究人员创建了一个预测窗口,从患者电子健康记录中的第一次记录开始,直到结肠癌或直肠癌病例索引日期之前的0、1、3和5年结束日期。对于每一位对照患者,研究人员根据年龄将其与病例配对,以接近病例索引日期。数据被分成训练集(80%)用于训练模型,和测试集(20%)用于测量模型。采用SHapley Additive exPlanations (SHAP)用于分析重要特征。
研究结果:
研究人员发现,在直肠癌和结肠癌队列中,模型预测结果的显著趋势是随着每个患者的数据减少,整个预测窗口的敏感性降低。在直肠癌和结肠癌的所有算法中,0年和1年预测曲线下面积(AUC)在0.64到0.75之间具有显著性。随着预测窗口的扩大,预测性能下降到0.35(即5年预测)。在所有实验中,表现最好的算法是支持向量机。
研究人员在结肠癌队列中确定的最高预测因素包括高血压、咳嗽/哮喘、慢性鼻窦炎、焦虑症和特应性皮炎。直肠癌队列中最高预测因素包括肥胖、女性性别、艾滋病毒、焦虑症和哮喘。
研究人员总结道:慢性免疫抑制疾病(如HIV)或炎症(如肥胖、哮喘、鼻窦炎、皮炎)可能代表免疫轴紊乱,促使结肠直肠癌发展。这项初步研究为人工智能在年轻的结直肠癌患者中发现新的危险因素的能力提供了早期的认识,更多的算法优化和危险因素的探索正在进行中。
参考资料:
ASCO官网
(0)

相关推荐