如果RNA的预后分数被做过了!你可以试试这样

DNA methylation-based prognostic biomarkers of acute myeloid leukemia patients基于DNA甲基化的急性髓细胞白血病患者的预后生物标志物

一、 研究背景

急性髓细胞性白血病(AML)是一种异质性克隆性疾病,可阻止正常的髓样细胞分化。其发病率随年龄增长而增加,预后不良。在健康的造血干细胞中,表观遗传过程在细胞分化和造血过程中起着关键作用。研究表明,DNA甲基化和异常基因表达与AML密切相关,但是在AML中关键的差异甲基化基因(DMG)和差异表达基因(DEG)的作用仍不清楚。

二、 分析流程

三、 结果解读

1.识别AML中的DEG和DMG

作者从GEO数据库中获取了基因表达(GSE114868)和甲基化(GSE63409)的分析数据,用GEO2R分析发现了差异表达基因和差异甲基化基因后,用维恩图展示了重叠基因的情况,发现有273个低甲基化/上高表达基因和381个高甲基化/低表达的基因。

图1.在基因表达数据GSE114868和甲基化数据GSE63409中识别异常甲基化的差异表达基因

2.KEGG通路分析与GO分析

验证完差异表达后,进行了KEGG分析,并选择前十个富集通路。高甲基化低表达基因在Th1和Th2细胞分化,胞吞作用,Th17细胞分化等途径显著富集。而低甲基化高表达基因在产热,卵母细胞减数分裂,癌症中的转录失调等途径显著富集。

接着进行了GO分析,同样选择了前十个途径。低甲基化/高表达的基因在生物学过程(BP)主要在甲基化依赖性染色质沉默的调控,组蛋白甲基化的正调控等显著富集。分子功能(MF)主要在解旋酶活性,质子转运ATP合酶活性等富集。细胞成分(CC)主要在质膜胞质侧的固有成分等富集(图2. A-C) 。对于高甲基化/低表达基因,BP显著富集在细胞因子介导的信号传导途径,蛋白磷酸化,髓样白细胞介导的免疫的正调控等途径。MF主要在蛋白激酶活性,肌动蛋白丝结合等显著富集。CC主要在吞噬囊泡,吞噬囊泡膜等显著富集(图2. D-E) 。

KEGG和GO 分析中许多富集结果对分析有提示的作用,如Th1和Th2细胞分化,染色质沉默,髓样白细胞介导的免疫的正调控等等均与AML的发生发展有密切的关系。

图2.AML中异常甲基化差异表达基因参与的KEGG十大通路

图3.AML中异常甲基化差异表达基因参与的GO十大途径

3.PPI网络与模块选择

接着,作者通过STRING数据库和Cytoscape软件进行了PPI网络分析。低甲基化/上调基因的PPI网络图具有256个nodes和176个edges(图4),而高甲基化/下调基因的PPI网络图具有373个nodes和309个edges(图5)。通过MCODE插件将上述两个PPI网络图分别导入Cytoscape软件中以构建模块,设置了Degree Cutoff=10,Haircut on, K-Core=2, Node Score Cutoff=0.2, Max Depth=100。最后将低甲基化/高表达基因构建为9个模块,将高甲基化/低表达基因构建为12个模块。作者选择了得分最高的模块,如图6所示。

http://www.baderlab.org/Software/MCODE/UsersManual是MCODE的官方说明。这里的Degree Cutoff规定了一个节点得分所需的最小连接数量,得到的模块需要过滤掉节点Degree小于Cutoff的子网;Haircut 移除了一些仅有一条边连接的点;K-Core控制了cluster的大小,值越大,cluster越小,K-Core的K指每个节点连接的数量,举个例子:三角形(3 nodes, 3 edges)就是一个2-Core(每个节点有2个连接);Node Score Cutoff决定是否将新节点添加到模块中,默认值是0.2,这意味着新节点的得分必须至少是seed节点得分的80%,值越小,cluster越小;Max Depth是节点到cluster中其他节点的距离,值越小,cluster越小。具体使用还是需要不断调整参数来选择适合的值。

图4.低甲基化/高表达基因的PPI网络

图5.高甲基化/低表达基因的PPI网络

图6.MCODE中得分最高的模块

4.关键基因的生存分析

为了评估确定的预后标志物是否对预测患者的存活率有价值,作者将重点放在得分最高的模块中的基因上。首先,作者对得分最高的模块基因先后进行了单变量,多变量Cox回归分析,筛选了其中P值<0.05的3个基因 (ATP11A, ITGAM, ZNRF2),其中ITGAM是不良预后因素(表1),AML样本被分为高风险组和低风险组。然后,作者使用了SurvExpress网站(http://bioinformatica.mty.itesm.mx:8080/Biomatec/SurvivaX.jsp)进行生存分析,用3个关键基因建立预后模型(图7A, B) 。图7C的ROC曲线评估了10、30、50和70个月的预后模型的准确性,这里的图例有误,灰色曲线和橙色图例应该都是70个月的ROC曲线。此外,作者还用3个基因评估了不同AML细胞遗传风险分型和细胞形态分型的预后,发现这三个基因在中等细胞遗传风险和M2形态分型的预后分析中有显著差异(表2)。最后,图7.D了展示了三个关键基因在不同风险水平的表达差异。

表1.基于多元Cox回归分析的三个与生存相关的基因

图7.基于3个关键基因的预后模型的建立与评估

表2.三个关键基因评估AML风险类型预后和形态分型预后的多元回归分析

5.MethSurv中的DNA甲基化数据

构建完关键基因的预后模型后,作者还尝试找到它们的关键甲基化位点,使用MethSurv(https://biit.cs.ut.ee/methsurv)分析了TCGA中3个基因的DNA甲基化数据。作者发现高甲基化/低表达的ATP11A中有73个对AML预后有统计学意义的CpG位点(表3展示了前10个),高甲基化/低表达基因的TGAM具有两个(p<0.05),低甲基化/高表达基因的ZNRF2有三个(p<0.05)。最后作者发现,ATP11A的cg00990020, ITGAM的cg05625471和ZNRF2的cg07510230之间的DNA甲基化差异最为显著(图9A, B, C)。

表3.CpG在三个关键基因中的显著预后价值

图8.MethSurv中三个关键基因的DNA甲基化差异

小结

本篇文章中使用公共数据库的scRNA-seq和bulk RNA-sec数据,分别分析了三阴乳腺癌肿瘤细胞和肿瘤免疫浸润细胞的肿瘤间和肿瘤内异质性。在肿瘤细胞中,在单细胞水平上发现了血管生成、stemness和EMT之前的高度相关性,并发现了三者同时高表达的细胞子集。在肿瘤免疫浸润细胞中,比较了T细胞、B细胞、巨噬细胞在单细胞水平上的肿瘤异质性,还发现了巨噬细胞中M2样TAMs与预后不良有关,并基于已识别的M2样TAMs相关特征建立神经网络,以预测TNBC对免疫治疗的反应。

值得注意的是,神经网络在测试集中达到了100%的准确率,这一结果强调了M2样TAMs在TNBC治疗中对预测免疫治疗的重要性,并提示M2样TAMs的消融可能对治疗肿瘤有效。然而,巨噬细胞靶向方法具有全身性毒性,因为靶体作用于所有类型的巨噬细胞,因此还需要大量的临床研究与实验。

(0)

相关推荐