自噬基因与胶质母细胞瘤预后的3+分思路
各位小伙伴好呀,这次给大家分享的文献是2020年1月发表在OncoTargets and Therapy (IF:3.046)杂志上的一篇文章,"Prognostic Correlation of Autophagy-Related Gene Expression-Based Risk Signature in Patients with Glioblastoma",胶质母细胞瘤病人自噬相关特征基因表达与预后相关。
这篇推文2019.11.12投稿,2019.12.17就接受了,用时一个月,然后2020.1.7就online了!前后只用了2个不到的时间,当然DovePress的杂志大部分都很快,过段时间我们再慢慢介绍这些杂志。
Prognostic Correlation of Autophagy-Related Gene Expression-Based Risk Signature in Patients with Glioblastoma
自噬相关特征基因表达与胶质母细胞瘤病人预后相关
一. 研究背景
自噬在癌症发生、恶性进展和抗治疗过程中起到重要作用,然而,在胶质母细胞瘤中,自噬相关基因集很少被分析。本研究旨在探讨自噬相关基因在多形性胶质母细胞瘤(Glioblastoma multiforme,GBM)患者中的预后价值并通过功能分析研究其发生机制。
二. 分析流程
三. 结果解析
1.从自噬相关基因中选出与GBM患者预后显著相关的基因
从HADb数据库(Human Autophagy Database)和MSigDB数据库中的GO_AUTOPHAGY 基因集中取到的不重复的与自噬相关的基因531个。分别根据CGGA(Chinese Glioma Genome Atlas)的GBM队列(n=138)和TCGA的GBM队列(n=152)中共290例GBM样本的RNA-seq数据和预后资料,对这531个自噬相关基因进行单因素Cox回归分析。筛选到14个自噬相关基因对OS(总生存时间)有显著影响(p<0.05)。根据这14个基因在CGGA的GBM队列中的表达差异进行聚类分析(图1.A),很明显样本被分为了G1和G2两组。对这两组进行生存分析并比较差异(图1.B),G2组的病人的预后情况比G1组好(p<0.05)。对TCGA的GBM队列进行上述分析结果类似。说明这14个自噬相关基因确实有较高的预后价值。根据每个基因由CGGA队列算得的Cox回归系数(图1.D),对14个基因mRNA表达量进行线性加权组合,得到特征基因危险分数的线性公式:
signature risk score =(MTMR14×1.61)+(LENG9×0.63)+(P4HB×0.44)+(TCIRG1×0.39)+(HSPA5×0.37)+(DRAM1×0.30)+(CTSD×0.24)+(S100A8×0.17) +(CCL2×0.17)+(MSTN×–0.19)+(UBQLN4×–0.52)+(PHYHIP×–0.72)+(RRAGB×–0.85)+(ZKSCAN3×–6.64)
计算每个样本的Risk score后用热图展示了CGGA中样本14个基因表达情况和Risk score分布(图1.C),可以看到前9个基因的mRNA表达量的增加伴随着Risk score的上升,而后5个基因mRNA表达量的增加伴随着Risk score的下降。
图1.14个自噬相关基因被识别
2. 根据Risk score将样本分类并观察病人临床病理情况
作者将CGGA队列根据Risk score的中位数分为high-risk组和low-risk组,再比较两组样本间的临床病理参数差异(图2.A)。可以看到性别和是否进行放疗的人数在两组中的差异不显著;IDH1 wild样本多在high-risk组;肿瘤亚型为classical和mesenchymal的样本多在high-risk组;low-risk组中样本癌组织MGMT基因启动子甲基化占比大。分别根据样本癌组织的分子特征(IDH1是否突变,MGMT启动子是否甲基化)和TCGA中GBM的亚型将样本分组,看组间的Risk score是否有显著差异(图2B),可以看出IDH1野生型,MGMT基因启动子未甲基化,肿瘤亚型多为基质型的样本Risk score显著升高,而这些都是恶性GBM的特征。之后根据ROC曲线(图2.C)观察Risk score是否可以很好的预测这三个特征(IDH1突变,MGMT基因启动子甲基化,病人癌组织为基质型),有AUC面积大小可以看出Risk score对IDH1突变和肿瘤为基质型的预测能力较好(AUC>0.7)。随后用此公式对TCGA的GBM队列进行上述工作的验证,结果一致。因此作者得出有较高的Risk score的GBM样本癌组织有更多恶性肿瘤的特征。
图2.CGGA中病人临床数据和Risk score相关
3. GBM病人自噬相关特征基因构建的预后模型有预后价值
以CGGA队列为训练集,分别以TCGA中RNA-seq数据,microarray数据和GSE16011数据中的GBM队列为验证集,去评估Risk score的预后价值。用之前所述的方法,将每个数据集的样本分为high-risk组和low-risk组,再进行Kaplan–Meier生存分析。又单独对每个数据集里的IDH wt和IDHmut组样本根据Risk score高低进行生存分析(图3)。基本上Risk score低的样本比Risk score高的样本有着更好的预后,尤其是在IDH wt的样本中。从这也说明了根据CGGA队列构建的自噬相关特征基因Risk score在GBM队列中有很好的预后价值。
图3.GBM的自噬相关特征基因有显著预后价值
在整合了临床病理资料和病人Risk score数据后,分别对CGGA和TCGA中GBM队列进行多因素Cox回归分析,Risk score可以作为一个独立的预后因子(表1)。在CGGA队列中,Risk score的HR为1.921,有统计学意义(p<0.05);在TCGA队列中,Risk score的HR为1.718,有统计学意义(p<0.05)。
表1.单因素/多因素Cox回归分析结果
4.对GBM样本中与自噬相关特征基因相关的基因进行功能分析
在进行功能分析前,利用CGGA队列的RNA-seq数据筛选与样本Risk score相关的3504个基因(|r|>0.4,p<0.05),其中有1669个基因为正相关,1835个基因为负相关。在DAVID数据库上分别对正相关的基因集和负相关的基因集进行GO Biological Process(生物学过程)分析。正相关的基因主要涉及炎症反应和免疫反应等和肿瘤免疫微环境相关的生物过程(图4.A),负相关基因主要涉及转录,神经系统发育等正常生理过程(图4.B)。同时也对high risk组和low risk组病人做了GSEA基因富集分析,high-risk组在GO中富集了与免疫相关的通路,如leukocyte chemotaxis,inflammatory response(图4.C);low-risk组在GO中富集了与普通神经细胞生长相关的通路,如regulation of synapse assembly,regulation of synapse organization(图5.D)。
图4.GBM的自噬相关特征基因功能分析
为了检测high risk病人肿瘤组织的纯度,使用ESTIMATE包分别分析了CGGA和TCGA的GBM队列,得到了各样本的免疫得分,基质得分以及肿瘤纯度等数据。high risk组的免疫和基质得分与low risk组相比显著升高,而肿瘤纯度却降低(图5A-B)。选取了六个免疫检查点基因(PD1,PD-L1,TIM-3,B7H3,B7H4,LAG3)以及八个炎症相关的基因(INF-α, INF-β, TNF-α, IL-6, IL-17,CCL2,CXCL2, HLA-A)分别与两个队列的risk score进行相关性分析(图5.C-D),可以看到基本都成正相关(红色)。说明high- risk组样本的肿瘤组织中可能存在免疫抑制以及T细胞,巨噬细胞浸润。
图5.比较高风险组和第风险组在免疫状态上的差异
本篇文章以自噬相关基因为主变量,利用CGGA数据库中的GBM队列,结合Cox回归,得到了胶质母细胞瘤病人自噬相关预后特征基因,建立GBM病人Risk score的计算公式,再利用TCGA等数据库验证Risk score的预后价值,预测效果良好可以作为独立的预后因子。同时又对与特征基因相关的基因进行GO,GSEA等功能分析,进一步探索了GBM的发生机制。文章思路清晰,值得我们借鉴学习!
编辑:炒年糕
校审:糯米饭