这类数据的预后模型你也可以试一试

A DNA methylation signature to improve survival prediction of gastric cancer改善胃癌生存预测的DNA甲基化标志

一. 研究背景

目前虽然TNM分期对胃癌预后的预测有一定的价值,但不够充分,因此需要一个生物标志物来改善对患者的生存预测,而异常的DNA甲基化是胃癌中被广泛研究的表观遗传机制,作者基于此进行综合分析。

二. 分析流程

三. 结果解读

1. 测定胃癌中与甲基化相关的差异表达基因(mrDEG)

图1. 胃癌mrDEG的检测

  • A图:(数据来源:TCGA) 正常样本和胃癌样本间Top 30 mrDEG表达谱

  • B图:(Pearson系数) 胃癌样本中Top 5 mrDEG的表达与DNA甲基化的关系

作者根据RNA-seq数据,对375例肿瘤样本以及32例正常样本进行差异表达基因的鉴定,发现有2210个基因上调,1296个基因上调。随后探讨mRNA与DNA甲基化的关系,筛选出基因表达以及DNA甲基化数据均可用的肿瘤样本和DEG,并计算DEG与平均甲基化水平(β value,TCGA预处理数据)间的Pearson系数,其中有340个DEG被鉴定为mrDEG。作者列出了最显著的30个mrDEG的表达谱(图1A),以及前5个mrDEG的基因表达与DNA甲基化之间的关系(图1B)。

2. 评估mrDEG的相关生物过程和通路

图2. 胃癌中上调/下调mrDEG的通路富集分析

  • A图:上调mrDEG的通路富集结果

  • B图:下调mrDEG的通路富集结果

作者将mrDEG按表达情况分为上调/下调组,以探讨其在胃癌中的潜在作用。Metascape分析结果显示,上调组在多种肿瘤相关通路中富集,如MET激活PTK2信号、PI3K信号,并参与Wnt信号的正调控(图2A)。而下调组主要富集在与消化系统、肌肉系统和代谢过程相关的通路(图2B),而代谢重编程被认为是癌症的一个标志,表观遗传与代谢间的相互作用在肿瘤形成中起着关键作用。因此本文所筛选出的mrDEG参与了胃癌发生发展的生物学过程。

3. 鉴别与预后相关的mrDEG

作者通过单因素Cox回归分析,筛选出与预后相关的mrDEG。随后进一步进行多变量Cox回归分析,并以AIC(赤池信息量准则)为指标,建立了由10个mrDEG组成的DNA甲基化标记作为最佳预后模型(表1)。

表1. 作为DNA甲基化标志的10个独立基因

4. 预测胃癌患者总体生存期的DNA甲基化标志

基于以上10个mrDEG的甲基化β值(TCGA预处理数据,甲基化探针强度与总探针强度的比值),作者建立了总体生存期预测的风险评分公式,并按风险得分将患者分为高/低风险组。

图3. 预测胃癌患者总体生存期的DNA甲基化标志

  • A图:高/低风险组总体生存期的K-M图

    高风险组患者中位生存期明显短于低风险组。

  • B图:DNA甲基化标记的风险评分分布

  • C图:(卡方检验) 癌症患者的生存状态分布

    高/低风险组之间差异非常显著。

  • D图:高/低风险组DNA甲基化标志的甲基化β值分布

    高风险组患者倾向于高风险的mrDEG(系数Coefficient>0,见表1),低风险组的患者倾向于保护性的mrDEG(系数Coefficient<0)。

风险评分公式:

其中,i代表10个基因,C为各基因系数(Coefficient,见表1),β为各基因β vaule。

5. DNA甲基化标志与肿瘤复发有关

图4. DNA甲基化特征与肿瘤复发有关

  • A图:(卡方检验) 高/低风险组肿瘤复发情况的分布

  • B图:(T检验) 比较是否复发与风险评分的显著性

  • C图:多变量Cox回归分析

  • D图:按高/低风险分层,用DNA甲基化标志评估患者总体生存期

  • E图:无复发患者的K-M曲线

  • F图:复发患者的K-M曲线

作者分析了临床病理特征与根据DNA甲基化标志得到的风险评分之间的相关性,结果显示高风险组患者更容易复发(图4A),而复发患者的风险评分也显著高于未复发患者(图4B)。

由于复发会影响患者的总体生存期,因此作者通过多变量Cox回归分析检查DNA甲基化标志与复发的相关性。结果显示二者均为独立的预后因素(图4C)。将数据分层分析的结果显示,无论是否复发,DNA甲基化标志均可以预测患者的预后(图4D-F)。

作者还发现风险评分与患者性别相关(表2),这是因为有文献报道X染色体上异常的甲基化与癌症的发生有关,因此与癌症风险的性别差异相关。而DNA甲基化标志其中两个独立基因(CLDN2、COL4A5)位于X染色体上,因此具有性别差异。

表2. 临床特征与风险评分的相关性

6. DNA甲基化标志的预后价值与TNM分期无关

多变量Cox回归分析显示风险评分与TNM分期是独立的预后因素,作者也进行了进一步的分析证明此结论。

图5. DNA甲基化标志的预后价值与TNM分期无关

  • A-D图:TNMⅠ期到Ⅳ期患者的K-M曲线

  • E图:按TNM分期分层(I+II/III+IV),用DNA甲基化标志评估患者总体生存期

  • F图:低TNM期(I+II)患者的K-M曲线

  • G图:高TNM期(III+IV)患者的K-M曲线

  • H图:预测患者生存期的ROC曲线

分层分析的结果显示,尽管在Ⅰ期并不显著,但DNA甲基化标志仍可预测不同分期患者的预后(图5A-D)。因为担心样本量较小,随后作者将患者分为高/低TNM期,发现DNA甲基化标志仍可预测患者的预后(图5E-G)。

作者还进行了ROC分析,以比较DNA甲基化风险评分模型与TNM分期对预测总体生存期的敏感性和特异性(图5H)。结果显示风险评分模型的AUC显著大于TNM分期的AUC,即具有更好的敏感性及特异性,并且二者联合起来更有助于改善预测癌症患者总体生存期。

7. PPP1R14A和SCNN1B的表达由启动子区甲基化调节

由于PPP1R14A和SCNN1B在胃癌中的表达及调控机制尚未完全揭示,作者对其进行进一步的研究。

图6. PPP1R14A和SCNN1B的表达由启动子区甲基化调节

  • A图:qPCR检测8种胃细胞系中PPP1R14A和SCNN1B的表达水平

    5-aza:去甲基化处理

    Untreated:未处理

  • B图:PPP1R14A和SCNN1B启动子区CpG岛示意图

  • C图:甲基化特异性PCR(MSP)检测胃细胞株中PPP1R14A和SCNN1B的甲基化状态

    M:methylated alleles,甲基化等位基因

    U:unmethylated alleles,非甲基化等位基因

  • D图:在GES1和AGS细胞系中进行了PPP1R14A的二硫化氢测序(BSSQ)

    红:甲基化CpG

    绿:非甲基化CpG

在未经处理的细胞系中,仅GES1和NUGC3表达PPP1R14A。而经过5-aza处理后,所有细胞系均高表达(图6A,左)。随后作者通过MSP进一步研究,发现仅GES1和NUGC3存在非甲基化等位基因(图6C,上)。BSSQ的结果也显示GES1启动子区延长基因组序列的甲基化程度较低,AGS的甲基化程度较高(图6D,左)。由此可以推断出PPP1R14A受到启动子区甲基化的调控,且呈现负相关。同理,SCNN1B也受到启动子区甲基化的调控,且同样呈现负相关。

小结

作者通过整合TCGA中转录组、甲基组和临床实验等多源数据,提出了一个重要的DNA甲基化标志,该标志与TNM分期对胃癌患者的生存预测相互独立,且二者结合可以显著改善预测能力。作者还证实两个独立的基因PPP1R14A和SCNN1B表达由启动子区甲基化调控,有助于揭示DNA甲基化所有单个基因的调控机制和功能作用。

(0)

相关推荐