回顾性临床研究太单一?加上“机器学习”秒变身!
本篇文章是一项临床大样本的回顾性研究,这篇文章是2021年发表在Frontiers in medicine(IF=5.091)上的文章《Application of Machine Learning Algorithms to Predict Central Lymph Node Metastasis in T1-T2, Non-invasive, and Clinically Node Negative Papillary Thyroid Carcinoma》,研究了利用机器学习模型来预测乳头状甲状腺癌(PTC)患者中心淋巴结转移(CLNM)的风险,下面就来看看这篇文章到底是怎么分析的。
(大家可以在公众号号中的“论文助手”->“IF查与投”中查询期刊的详细信息)
摘要
目的:本研究旨在开发和验证基于机器学习算法预测这些患者中央淋巴结转移(CLNM)风险的模型。
方法:应用了六种机器学习算法,包括LR、GBM、XGBoost、RF、DT和NNET,结合术前临床特征和术中信息开发了CLNM的预测模型。在所有样本中,随机选择70%来训练模型,而剩余的30%用于验证。计算了AUC、灵敏度、特异性和准确性等指标,以测试模型的性能。
结果:在多因素Logistic回归分析中,性别、肿瘤大小和位置、多灶性、年龄和DLN都是CLNM的独立预测因素。在预测CLNM方面,6个ML算法的AUR在0.70-0.75之间,其中XGBoost模型表现突出,达到0.75。
结论:综合考虑术前和术中的危险因素,ML算法的比较表明,XGBoost模型具有最佳性能。作者还进一步建立了一个在线计算器,可以帮助确定PTC患者的最佳手术治疗范围。
材料和方法
01 数据来源
文章回顾性检索了2016年12月至2018年12月在重庆医科大学第一附属医院内分泌与乳腺外科接受甲状腺手术的住院患者的资料。纳入的临床样本是接受手术的1,271例T1-T2期,无创性和临床淋巴结阴性(cN0)PTC患者。
02 基线资料分析
首先,总结这些患者的临床病理特征,分析基线资料。作者将数据集随机分为两组,即用于ML模型开发的训练集(70%)和用于性能评估的验证集(30%),然后重复此随机分裂,直到患者数据分为两组,可以得到基线表如下表。
02 单因素多因素逻辑回归模型构建
作者根据CLNM分组,进行单因素和多因素逻辑回归分析。在单因素分析中,肿瘤大小、性别、年龄、多灶性、双侧病变和DLN定位均与整个人群中CLNM的发生显著相关(P < 0.001),而CLNM阳性患者和CLNM阴性患者在肿瘤位置或CLT状态方面没有显著差异。
在多因素分析中,所有参数(年龄、性别、CLT、DLN、多灶性、双侧病变和肿瘤大小和位置)都包括在内。结果显示,男性(OR,1.534[95%CI,1.158–2.030])、较大肿瘤大小(OR,1.080[95%CI,1.053–1.107])、多样性(OR,1.583[95%CI,1.172–2.139])、DLN定位(OR,6.454[95%CI,4.246–9.651])。通过多因素分析排除双侧病变和CLT的差异,结果如下图所示。
03 分类多模型综合分析
作者用了六种ML算法来对数据建模:逻辑回归(LR),梯度提升机(GBM),极限梯度提升(XGBoost),随机森林(RF),决策树(DT)和神经网络(NNET) 。
作者在验证集中评估了具有相同超参数的每个ML分类器的预测能力,结果表明,XGBoost模型在预测CLNM方面表现出最高的性能,在验证集中,其AUC为0.750,灵敏度为0.667,特异性为0.674,准确性为0.670。因此,我们选择了XGBoost模型作为最终的预测模型,结果如下图所示。
04 影响因子重要度分析
作者比较了变量在机器学习算法中的相对重要性。我们可以看到一个明显的总体趋势:虽然这些ML算法中变量的重要性略有差异,但包括Delphian淋巴结转移,肿瘤大小,年龄,性别,多灶性在在内的因素无疑排名前五。
相反,像双侧病变、肿瘤在中央或峡部中部的位置和CLT等变量对CLNM的预测贡献很小。XGBoost模型中高级变量的重要性按降序排列如下:Delphian德尔淋巴结转移,肿瘤大小,年龄,性别,多灶性和肿瘤位置。
总结
在这项研究中,文章开发并验证了多种流行的机器学习算法来预测T1-T2期、无创性、临床淋巴结阴性(cN0)PTC患者的CLNM风险。ML算法的比较表明,XGBoost模型提供了最好的性能。
为了使这一模型的应用变得可行,还进一步建立了一个在线计算器,用于估计这些PTC患者发生CLNM的个体概率。这种基于最大似然法的模型有可能指导术中决策。