5+肿瘤坏死因子家族预后模型构建
导语
今天跟大家分享的是2020年5月发表在Ebiomedicine(IF=5.736)杂志上的一篇文章:“Comprehensive molecular analyses of a TNF family-based signature with regard to prognosis, immune features, and biomarkers for immunotherapy in lung adenocarcinoma”。在文章中作者基于TNF家族成员在LUAD患者中构建了一个预后风险模型,并通过多个GEO数据集来验证模型的有效性,最后联合免疫浸润、免疫反应、炎症水平、通路评分等将TNF相关预后模型与免疫机制联系起来,将更好地让人们理解肿瘤坏死因子家族在LUAD中的特征,有助于进一步优化LUAD相关肿瘤免疫治疗。
Comprehensive molecular analyses of a TNF family-based signature with regard to prognosis, immune features, and biomarkers for immunotherapy in lung adenocarcinoma
肺腺癌肿瘤坏死因子家族标志物与预后、免疫特征和免疫治疗反应的综合分析
一、研究背景
根据全球癌症统计的最新数据,肺癌仍然是癌症相关发病率和死亡率的主要原因,几乎占2018年预测癌症死亡人数的20%。尽管治疗策略和个体化治疗的组合疗法的已得到广泛的临床应用,LUAD的5年总生存率仍然只有16%左右。因此,我们仍需继续努力寻找特定患者生存率的预测方法,以便为LUAD患者的不同亚群设计最合适的治疗和管理方案。研究表明,除了阻断B7-CD28家族相关免疫检查点外,通过与肿瘤坏死因子(TNF)家族的共刺激受体结合来促进T细胞反应性是另一种潜在的治疗方法。TNF家族由19个TNF配体超家族(TNFSF)和29个TNF受体超家族(TNFRSF)组成,介导免疫细胞和非免疫细胞存活、增殖、分化和效应器功能的信号。事实上,许多针对肿瘤坏死因子家族成员的治疗方法,包括CD40、OX40、GITR和CD27,目前正在积极研究各种癌症的临床试验,包括肺癌。然而,TNF在LUAD中的表达模式及其临床意义尚不清楚。因此,本研究将研究肿瘤坏死因子家族的特征以及LUAD中基于肿瘤坏死因子家族特征的临床和免疫学特征将有助于优化肿瘤免疫治疗。
二、结果解读
1. LUAD患者TNF家族基因的表达趋势及预后意义
共纳入47个定义明确的肿瘤坏死因子家族基因,包括18个TNFSF成员和29个TNFRSF成员。首先,使用了502例具有预后信息的TCGA-LUAD患者来研究肿瘤坏死因子家族基因表达谱。这一群体的人口统计数据列于表1。大多数成员都表现出很强的正相关。
表1. 多数据集LUAD患者的临床资料
采用单因素Cox比例风险回归分析,探讨LUAD患者TNF家族成员基因表达水平与OS的关系。我们发现17个基因与OS显著相关(P<0.05),包括6个TNFSF成员和11个TNFRSF成员。在17个基因中,有3个基因(TNFRSF1A、LTBR和TNFRSF6B)被鉴定为危险因子。共有14个基因(CD27、TNFRSF10C、TNFRSF17、TNFRSF13B、TNFRSF13C、TNFRSF14、EDA2R、TNFRSF19、TNFSF12、LTB、LTA、CD40LG、TNFSF8和TNFSF13)被鉴定为保护因子。
表2. 肿瘤坏死因子家族基因在TCGA队列中的单变量Cox分析
2. 以肿瘤坏死因子家族为基础的模型构建
筛选出具有预后意义的共17个基因用于进一步分析。采用逐步Cox比例风险回归模型,筛选出TNFRSF6B、TNFRSF13C、TNFRSF14、TNFRSF1A和EDA2R五个基因进行进一步优化,基于5个基因的表达水平和相应的回归系数构建了一个风险公式:风险评分=0.1633*TNFRSF6B+0.1153*TNFRSF13C+0.2234*TNFRSF14+0.1992*TNFRSF1A+0.1042*EDA2R。5个基因的表达和相应的风险评分如图所示。并进一步根据最佳截点值将患者被分为高危组(n=237)和低风险组(n=265)组。与低危组相比,高危组患者的OS明显恶化(HR=2.4163,P<0.0001)。由于早期(临床I期和II期)和晚期疾病(临床III期和IV期)患者需要不同的治疗策略,我们进一步将基于TNF家族的特征应用于TCGA训练集中的临床阶段患者。结果显示,风险评分同样适用于早期和晚期患者。
图1.在TCGA数据集中构建基于TNF家族的预后模型
3.基于TNF家族特征的外部数据集验证
为了验证基于TNF家族预后模型在LUAD患者中的可重复性,我们继续基于模型计算了五个独立数据集中每个患者的风险值。根据最佳风险值临界点,将不同队列的患者分为高风险组和低风险组。正如预期的那样,无论是在GSE11969,GSE12313,GSE30219,GSE31210,GSE41271,Kaplan-Meier分析显示高风险组的患者比低风险组的患者表现出更高的死亡率风险。此外,我们根据TCGA数据集以及基于这六个组(n=1198)的预后荟萃分析,确定了基于TNF家族的特征在这些公共人群中的预后意义,并证实TNF家族特征是LUAD患者的一个危险因素(HR=2.22,95%CI=1.81-2.72, P<0.001)。
图2. 不同LUAD数据集中TNF相关预后模型的外部验证
为了评估这5个基因模型在临床上预测LUAD患者OS的稳健性,作者在一个独立队列中进一步验证了基于TNF家族的预后模型,包括102个LUAD冷冻组织样本。使用相同的公式,患者根据最佳临界点分为两组,结果显示,高风险组和低风险组之间的死亡率存在显著差异。作者进一步对早期和晚期LUAD患者进行分层分析,以评估其的预后意义。结果证实,该预后特征可以将患者分为高风险组和低风险组,OS结果有显著差异。
图3.以102例冰冻组织为基础的肿瘤坏死因子家族标志物在独立队列中的预后验证
4. 不同临床亚组肿瘤坏死因子家族特征验证
为了进一步验证预后模型在不同临床亚组中的稳定性,我们首先评估了不同性别、年龄和吸烟史的患者对该特征的预测能力。所有患者均按预后评分进行排序,并分为高风险组和低风险组,然后用Km-plot生存分析来估计高风险组和低风险组之间OS的差异。我们的结果表明,在所有亚组中,高风险组OS明显短于低风险组(P<0.05)。接下来,我们进一步探讨了在不同突变的患者亚群中的表现。我们发现,无论在EGFR野生型(WT)、EGFR突变(MUT)、KRAS-WT、KRAS-MUT或EGFR/KRAS-WT组,基于肿瘤坏死因子家族的特征性风险组提供了具有统计学意义的OS分层(P<0.05)。同时,我们测试了LUAD中三种表达亚型的特征:magnoid、squamiod和broxioid。基于TNF家族的预后模型并通过最佳临界点(P<0.05)能对不同亚型的患者进行显著分层。
表3. TCGA数据集中基于TNF家族的特征的单变量和多变量Cox回归分析
5. 基于肿瘤坏死因子家族的相关生物学通路的富集
基于TNF家族的特征在预测LUAD患者OS方面具有很强的分层能力,研究进一步探索信号相关的生物学途径。我们首先确定与风险评分(Pearson | R |>0.4)密切相关的基因。如图所示,共筛选出38个正相关基因,392个负相关基因。然后选择这些显著相关的基因进行GO和KEGG分析. 我们发现这些基因更多地参与了免疫反应的生物学过程:T细胞增殖和共刺激以及其他免疫特异性过程。同时,KEGG分析显示这些基因与原发性免疫缺陷和其他免疫相关途径相关。
图4.基于肿瘤坏死因子家族的富集通路分析
6. 基于TNF家族特征的免疫细胞浸润和炎症特征
由于TNF家族的特征与免疫相关生物途径之间的密切关系,研究首先在TCGA队列中的每个样本中使用CIBERSORT算法评估免疫细胞浸润。结果显示,高风险组的活化NK细胞、中性粒细胞、活化树突状细胞(DC)和巨噬细胞M0的数量更高;相比之下,低风险组的记忆B细胞、静止DC、静止CD4记忆T细胞、γδT细胞和巨噬细胞M1的数量更高。接下来,为了更好地理解与风险评分相关的炎症活动,我们研究了预后模型与七组炎症基因之间的关系。我们使用了基因集变异分析(GSVA)来模拟七个炎症基因簇。我们的结果显示,风险评分与HCK、LCK、MHC_I和MHC_II呈负相关。
图5. 基于TNF家族特征的LUAD免疫全景图
7. 肿瘤坏死因子家族特征与免疫治疗反应的关系
肿瘤坏死因子家族成员是免疫治疗方案的潜在候选分子。我们通过分析风险评分与一系列广泛使用的生物标志物的相关性,探讨了基于TNF家族的特征与免疫治疗反应之间的关系。首先计算高、低危组肿瘤突变负荷(TMB)、新生抗原肽、克隆新抗原数量和亚克隆新抗原数量。我们的结果显示,高危患者表现出显著的突变负荷和新抗原,这对免疫治疗有更高的反应率。我们进一步分析了晚期(III期和IV期)肺癌患者TMB临界点的特征,我们的结果证实了高风险评分与高TMB显著相关。接下来,我们还研究了风险评分与PD-L1的蛋白水平。我们发现高风险组患者的PD-L1蛋白水平更高。最后,本研究进一步研究了TIDE评分与风险评分的关系,结果显示,高风险组患者TIDE评分较低,免疫排斥评分更高。
图6. 免疫治疗反应标志物在高低风险组人群中的分布
三、小结:
作者基于TNF家族成员构建了一个预后风险模型,并在5个GEO外部数据集验证模型的稳定性,后续通过多维度分析如免疫浸润、免疫反应、炎症水平、通路评分等将TNF相关预后模型与免疫机制联系起来。后续对于其他家族成员(不同基因集)的研究也有了更多的借鉴之处,并可以补充如SNP突变、甲基化等多组学的分析,使整体的结果更饱满。
对该思路感兴趣的小伙伴
欢迎扫码联系
END