经典免疫浸润分析也能变个花样发5+分
Profiles of immune‐related genes and immune cell infiltration in the tumor microenvironment of diffuse lower‐grade gliomas
弥漫性低级别胶质瘤的肿瘤微环境中的免疫相关基因和免疫细胞浸润
一、研究背景
胶质瘤是临床较为常见的中枢神经系统恶性肿瘤之一,统计数据显示其总体年发病率为5~6人/10万。根据世界卫生组织(WHO)制定的标准,WHO II级和 III级为弥漫性低级别胶质瘤(lower‐grade gliomas, LGG)。近十几年来,越来越多的研究表明,肿瘤细胞与微环境之间的相互作用对肿瘤的发生、进展、侵袭有密切联系。免疫细胞和基质细胞是肿瘤微环境的两个重要组成部分。通过结合这两种主要成分对肿瘤微环境进行分析,寻找新的靶基因位点,有助于为探索疾病发生发展预后提供新的研究思路。
二、分析流程
三、结果解读
1. 免疫/基质评分与LGG预后的关系
作者从TCGA数据库(The Cancer Genome Atlas)中下载了508位患者的RNA-seq数据,进而利用ESTIMATE算法计算其免疫评分和基质评分。根据免疫评分和基质评分,分别将样本分为高/低免疫评分组和高/低基质评分组。基于此分组,作者进行了Kaplan-Meier生存分析(p<0.05),并计算了分组与肿瘤分级、IDH1基因的关系。
Kaplan-Meier生存分析结果显示,免疫评分和基质评分与LLG患者的生存密切相关(图1a, 图1b)。此外,作者发现胶质瘤III级和IDH1野生型患者均具有较高的免疫评分和基质评分(图1c-f)。
图1.免疫/基质评分与LGG患者的病理特征和预后密切相关
2. 免疫相关基因(IRGs)的鉴定
作者使用DEseq2包进行差异表达分析,筛选条件为|log2 fold change (FC)|>1.5和adjusted P<0.05。在高免疫评分组中,587个基因上调,402个基因下调;在高基质评分组中,654个基因上调,44个基因下调(图2a, 图2b)。热图显示了在高/低免疫评分组和高/低基质评分组中的差异基因表达模式(图2c, 图2d)。通过Venn图,作者选择了在高/低免疫评分组和高/低基质评分组中上调基因和下调基因的交集,将其定义为免疫相关基因(IRGs),包括438个上调基因和37个下调基因(图2e, 图2f)。
图2.根据免疫评分和基质评分对差异表达分析
作者使用clusterProfiler包对IRGs进行GO功能富集(细胞组成、生物过程、分子功能)和KEGG通路富集分析,并以错误发现率<0.05为筛选标准。GO分析显示IRGs主要富集在细胞膜外侧,主要参与受体配体活动、细胞因子活动,具有T细胞活化、白细胞游走等分子功能(图3a-c);KEGG通路富集分析显示IRGs主要在细胞因子-细胞因子受体相互作用等通路富集(图3d)。
图3.IRGs的GO和KEGG分析图
3. IRGs的生存分析
作者对475个IRGs逐一进行了生存分析,以p值小于0.05为筛选标准,结果显示其中397个IRGs与LGG生存密切相关(图4)。作者将这些IRGs定义为具有预后价值的IRGs。
图4.部分IRGs的生存分析图
4. 具有预后价值的IRGs的PPI网络构建和模块分析
作者使用STRING线上数据库进行蛋白互作分析,并利用Cytoscape软件对PPI进行可视化。应用Cytoscape软件中的MCODE插件对PPI进行模块分析,根据节点数≥20这一标准共筛选出3个模块(图5a-c)。其中,模块A得分最高,CCL5、CD44、IDO1、TLR7、CD2为其中的关键基因。
图5.具有预后价值的IRGs的模块分析图
5. 使用CGGA数据库验证具有预后价值的IRGs
作者从CGGA数据库(Chinese Glioma Genome Atlas)中下载了三个数据集(mRNAseq_325, mRNAseq_693, mRNA‐array),结果显示具有预后价值的397个IRGs中,其中122个被证实与LGG生存显著相关。通过clusterProfiler包对其进行GO功能富集(细胞组成、生物过程、分子功能)和KEGG通路富集分析,并以错误发现率<0.05为筛选标准。GO分析显示其主要富集在细胞膜外侧,主要参与酶抑制剂活动,具有T细胞活化、中性粒细胞激活等分子功能(图6d-f);KEGG通路富集分析显示其主要在补体途径等通路富集(图6g)。作者对其中48个未报道过的基因逐一进行生存分析(图7)。
图6.对CGGA验证数据的GO和KEGG分析图
图7.CGGA部分验证数据的生存分析图
6. LGG微环境的免疫图谱
作者使用TIMER算法(the Tumor IMmune Estimation Resource)分析了六种肿瘤浸润免疫细胞群的丰度。结果显示,树突状细胞在免疫微环境中丰度最高(图8a)。作者通过相关性矩阵显示不同肿瘤浸润免疫细胞丰度之间的联系(图8b)。根据免疫细胞比例对所有患者使用k-means算法进行无监督聚类分析,最佳聚类数目定为3(图8c, 图9)。CD8+T细胞水平较高和巨噬细胞水平较低的cluster2预后良好,而与之相反具有较低水平CD8+T细胞和较高水平巨噬细胞的cluster3预后不良(图8d),这提示了肿瘤浸润免疫细胞的不同比例是潜在的LGG预后指标。
图8.LGG肿瘤微环境的免疫图谱
图9.无监督聚类分析的最佳聚类数目确定
小结
作者利用TCGA数据库中的高通量数据,结合ESTIMATE算法和DEseq2包识别了IRGs,并通过GO和KEGG富集分析阐述了这些IRGs的功能。通过生存分析,作者进一步对IRGs进行筛选,将其中与LGG患者生存密切相关者定义为具有预后价值的IRGs,并借助STRING平台及Cytoscape软件构建PPI网络,MCODE插件对PPI进行模块分析。最后,作者使用CGGA数据库中的三个数据集对具有预后价值的IRGs进行验证,并使用TIMER算法分析了六种肿瘤浸润免疫细胞群的丰度及其与预后的关系。作者的研究筛选出了具有预后价值的IRGs,这些基因可作为LGG的潜在预后生物标志物,基于此的进一步研究对改善LGG患者预后具有重要意义。