5分+甲基化泛癌纯生信,值得学习
大家好,今天要和大家分享的是2021年6月发表的一篇文章:“Pan-cancer methylation analysis reveals aninverse correlation of tumor immunogenicity with methylation aberrancy”。
肿瘤的免疫原性是由各种基因组和转录因子驱动的,但与甲基化异常的总体状态的相关性还没有得到很好的证实。在本研究中,作者分析了TCGA数据库以调查泛癌整体甲基化异常是否与肿瘤的免疫逃逸有关。首先,作者以从人类甲基化450K阵列数据中建立代表甲基化异常程度的值创建了高甲基化、低甲基化和甲基化组。然后,作者评估了甲基化是否与肿瘤免疫原性相关,结果发现在30种癌症中,甲基化与代表细胞毒性T细胞活性的细胞溶解活性得分呈显著负相关。此外,在多元回归分析中,这种相关性与突变负荷和染色体不稳定性无关。最后,作者验证了接受免疫检查点抑制剂治疗的患者的外部队列,结果显示高甲基化组的无进展生存率明显较低。总体而言,甲基化异常程度与肿瘤免疫原性呈负相关。这些发现强调了甲基化异常对于肿瘤逃避免疫监视的重要性,并保证了甲基化生物标记物的进一步发展。
发表杂志:CancerImmunol Immunother.
影响因子:5.442
请扫描下方二维码
一、研究背景
免疫检查点抑制剂[程序性细胞死亡-1(PD-1)和程序性细胞死亡配体-1(PD-L1)抗体]的免疫治疗引入了癌症治疗的新纪元,这导致了许多关于肿瘤免疫原性的潜在机制和这些机制的生物标记物的研究。其中,关于基因组与肿瘤免疫原性的相关性的研究已经很大程度上被探索了。例如,肿瘤突变负荷可能与免疫治疗反应有关,这导致产生肿瘤新抗原以刺激肿瘤免疫反应的可能性更高。DNA甲基化调节染色质重塑和RNA转录,最终在细胞水平上影响癌症的特征和行为。异常甲基化,包括启动子高甲基化和低甲基化,参与了多种癌症的发生,有趣的是,启动子区域的高甲基化已被描述为与新抗原和免疫相关基因的基因表达呈负相关。同时,复制后期异常的整体甲基化缺失也与免疫逃逸特征相关。这些发现提出了临床和研究问题:异常甲基化,无论是高甲基化还是低甲基化,是否会影响与免疫原性相关的肿瘤微环境?此外,代表整体甲基化异常的指数是否能被用作免疫治疗的生物标记物?
二、流程图
三、分析解读
1、数据收集和处理
①使用由9664个样本和396,065个CpG位点组成的人类甲基化450K阵列数据和来自TCGA泛癌图谱的RNA测序数据,其中包括来自11,069个样本的20,531个基因表达。
②为了定义和计算MetB (methylation burden),作者只使用了肿瘤样本数据。如果一个参与者有多个样本数据,则根据字母顺序只使用第一个TCGA条形码的数据。
③作者使用整体甲基化水平定义为长散布的核元素-1的平均β得分。(global methylation level as in the previous study, defined as an average β-score of long interspersed nuclear element-1)
④使用R语言鉴定396,065个CpG位点的相关基因和功能特征。
⑤根据TCGA泛癌图谱数据计算的MetB截止值应用于GEO系列进行外部验证。
⑥评估从原发肿瘤到复发肿瘤的MetB变化。
2、β评分临界值的确定和甲基化负荷的定义
①作者使用TCGA泛癌图谱甲基化数据中的8,843个样本和396,065个CpG位点的β值来计算Metb。
②TCGA的甲基化数据由396,065个CpG位点组成,以β分数表示,这是甲基化探针强度与CpG位点总强度的比值,显示在0到1之间的数值。
③为了定义MetB的甲基化变异程度,作者将MetB定位为代表高甲基化和低甲基化的CpG位点的数量。
④作者分别设置了每个CpG位点的截止点。
⑤作者假设在每个CpG位点,在所有癌症样本中,β得分最高的5%的样本在相应的CpG位点有高甲基化,而β得分最低的5%的样本在相应的CpG位点有低甲基化。因此,高甲基化和低甲基化的定义如下:
低甲基化:如果每个CpG位点的样品的β值小于或等于所有样品的最低5%(8843),则该样品被定义为该CpG位点的低甲基化。
高甲基化:如果每个CpG位点的样本的β值大于或等于所有样本的前5%(8843),则该样本被定义为该CpG位点的高甲基化。
⑥将β值低于低甲基化临界值的样本中CpG位点数的log2值定义为低甲基化负荷,将β值高于高甲基化临界值的样本中CpG位点数的log2值定义为高甲基化负荷。最后,将低甲基化和高甲基化CpG位点数之和的log2值定义为MetB。
结果:甲基化负荷的定义以及与先前已知的甲基化亚型的相关性:
下图a:高甲基化和低甲基化定义示意图。大多数样本,在这项研究中,90%将具有平均甲基化状态,或正常甲基化状态。然后,将有10%的样本的β得分最高的5%和最低的5%分别被定义为高甲基化和低甲基化。
下图b:散点图显示了低甲基化组和高甲基化组与整体甲基化水平的相关性,在以前的文献中定义为选定CpG位点的平均β得分。在每个图上绘制一条局部加权散点图平滑回归线。低甲基化负荷呈显著负相关,而高甲基化负荷呈显著正相关(Spearman Rho=-0.44 p<0.001和SpearmanRho=0.20 p<0.001)。
下图c:顶部的方框图显示了每种甲基化亚型癌症的高甲基化负荷和低甲基化负荷。
在图中,右侧显示高甲基化负荷,右侧较高,左侧显示低甲基化负荷,左侧较高。框图中的垂直线表示上限25%、中位数和下限25%的MetB值。
在底部,五个方框图显示了每种癌症类型的甲基化亚型之间的MetB差异。框图中的水平线表示上限25%、中位数和下限25%的MetB值。
3、启动子甲基化状态及其表达测定
作者分析了PLAU、CD274、HLA-A、HLA-B和HLA-C启动子的CpG位点。用(高甲基化CpG位点数)-(低甲基化CpG位点数)计算样本的启动子甲基化计数。对各基因的表达值进行log2归一化处理。
结果:
CD274、HLA-A、HLA-B、HLA-C启动子甲基化及其表达相关性
下图a:为CD274中启动子甲基化与表达的相关性。
左图显示启动子甲基化计数与CD274表达的相关性。每组启动子甲基化计数组的CD274表达值由框图表示,其中水平线代表上25%、中值和下25%的CD274表达值。将启动子甲基化计数大于5(5)的样本与启动子甲基化计数为5(−5)的样本组合,阳性样本为高甲基化,阴性样本为低甲基化。每个点通过梯度中的高甲基化负荷着色,蓝色为最低值,黄色为最高值。启动子甲基化计数与CD274表达呈显著负相关(Spearman Rho=−0.12,p<0.001)。
右图显示了每种癌症类型的相关性。仅有17种肿瘤类型的启动子甲基化计数与CD274表达呈显著负相关,并按中位数表达值从高到低排列。下图显示了每种癌症类型的相关性。低启动子甲基化计数代表小于0,中代表0,高代表大于0。33种癌症中共有25种呈负相关,其中17种具有统计学意义。
下图b:这三个曲线图分别显示了启动子甲基化计数与相应基因HLA-A、HLA-B和HLA-C的相关性,其方式与图2A左边的曲线图相同。
下图c:显示人类白细胞抗原启动子甲基化计数与CytAct呈显著负相关(Spearman Rho=-0.21 p<0.001)。每个点通过梯度中的超甲基化负荷来着色,蓝色是最低值,黄色是最高值,与图2A中的图例相同。
4、潜在生物标志物预测
①在TCGA泛癌图谱RNA序列数据中,将以下公式应用于GZMA和PRF1的归一化表达值以测量CytAct。
②免疫标志物得分从先前文献提供的补充数据中导入,干扰素-γ基因标志物得分根据6个基因(IDO1、CXCL9、CXCL10、STAT1、IFNG)的几何平均值计算。
③利用cBioPortal和TCGA全外显子测序数据计算肿瘤突变负荷值和TCGA样本的染色体不稳定性(CIN)评分。所有样本的突变负荷值和CIN评分均采用log2归一化。
结果:甲基化负荷作为与肿瘤免疫原性相关的潜在生物标志物。
下图a:A在散点图中,每个点代表来自TCGA的单个样本。左侧显示基于泛癌的分析,右侧显示选定癌症类型的分析以及局部加权散点图平滑回归线。
下图b:方框图显示了每个免疫景观亚型的MetB。
下图c:每种癌症类型的中位数MetB和中位数CytAct散点图。当包括所有癌症类型进行分析时,蓝色虚线显示线性回归线。排除DLBC和LAML后的MetB和CytAct中位数分析显示,与其他癌症类型相比,两者的CytAct一直较高,显示出显著的负相关(Spearman Rho=−0.52,p=0.003)。
下图d:SMC肺癌队列中独立免疫检查点抑制剂治疗的PFS的Kaplan-Meier曲线。红线代表MetB-High组,蓝线代表MetB-low组,除以队列中MetB的中位数。被审查的数据用短的垂直段进行标记。
下图e:使用Ipilimumab治疗TCGA SKCM患者PFS的Kaplan-Meier曲线。红线代表MetB-High组,定义为在SKCM样品中,MetB高于整个MetB值的20%的样品。蓝线代表MetB-Low组,定义为MetB最低20%或更低的样本。
下图f:该图显示了原发肿瘤和复发肿瘤之间MetB的变化。
5、确定重要的CpG位点
①为了确定干扰肿瘤免疫反应的重要CpG位点,根据每个CpG位点的甲基化水平进行分析以检查免疫原性的变化。
②在每个CpG位点内,根据β值将样本分为3类:低甲基化(A)、高甲基化(C)和非极端正常甲基化(B)。
③计算各组细胞的平均CytAct。组间差异采用Wilcoxon秩和检验确定p值。
④选择logFC大于1.25或小于0.8的CpG位点,Benjamini-Hochberg调整后的p值<0.05。
⑤在选定的CpG位点中,作者进一步选择了与11种主要癌症类型对CytAct有相同作用方向的CpG位点。
⑥利用所选择的CpG位点和相应的基因列表,使用Inenuity Pathway Analysis进行基因本体论分析。
结果:细胞溶解活性评分与甲基化负荷、突变负荷和染色体不稳定性评分之间的关系。
下图a:二维图显示细胞溶解活性和表观基因组/基因组变量之间的关联。左边和右边的曲线图分别显示MetB和突变负荷或染色体不稳定(CIN)得分之间的关联。
下图b:3D曲线图显示细胞溶解活性与3个表观基因组/基因组变量之间的关联。数字中不包括DLBC和LAML,因为它们始终显示高CytAct。此外,TGCT也没有包括在该图中,因为样本中的甲基苯含量变化很大。
最终结果表明,较低的突变负荷、较高的MetB、较高的CIN评分与较低的CytAct有关,这意味着更多的肿瘤免疫逃逸。
四、小结
在本研究中,作者使用癌症基因组图谱(TCGA)的数据来定义甲基化负荷(MetB),将其作为总体甲基化异常程度的代表,并检验MetB与肿瘤免疫原性的相关性。结果发现MetB与CytAct呈负相关。而且这一发现在TCGA SKCM患者和SMC肺癌患者的免疫治疗结果数据以及LUAD和LGG的外部队列中得到了验证。此外,MetB预测CytAct与突变负荷和CIN评分无关。这些发现证明了甲基化异常驱动了肿瘤的免疫逃逸,MetB对整体甲基化异常的评估可以预测肿瘤的免疫原性程度。基于此研究结果暗示表观遗传修饰参与了不同免疫相关肿瘤微环境的产生,进一步的研究和生物标记物的开发将需要更多地关注甲基化异常,以涉及肿瘤免疫原性和免疫逃避的整个机制。