11分+SCI 基因集泛癌纯生信分析,两个多月接受,可重复!
大家好,今天要和大家分享的是2021年1月发表的一篇文章:“Pan-canceranalyses reveal regulation and clinical outcome association of the shelterin complex in cancer”。
该思路可重复。联系小编,提供你的基因集,小编可以帮你在此基础上做更多的分析内容!
另外小编也有做一些基因集/表型的预分析,需要合作的可联系小编。详见:
保护素(Shelterin)是一种位于端粒的保护性复合体,除了维持端粒的完整性外,还在多种生存途径中发挥作用。然而,Shelterin对癌症作用的详细机制尚未可知。
本项研究中,作者利用癌症基因组图谱(TCGA)的多组学数据,对33种癌症类型的9125份肿瘤样本中的保护蛋白进行了全面分析。首先,作者将TRF1和POT1的扩增、TRF2-RAP1-TPP1的共扩增/缺失确定为主要的改变事件,并基于shelterin表达进行聚类分析,揭示了具有不同程度基因组不稳定性的三个癌症模块。为了测量癌症中的整体保护蛋白活性,作者根据保护蛋白表达得出了一个保护蛋白评分。富集分析表明,shelterin与E2F靶点呈正相关,而与p53通路呈负相关。重要的是,shelterin与肿瘤免疫有关,并且可以预测对PD-1阻断免疫疗法的反应。随后,作者通过miRNA分析构建了一个miRNA-shelterin相互作用网络。此外,生存分析表明shelterin表达还可用于预测24种癌症类型的患者存活率。最后,作者通过Connectivity map数据库发现了针对shelterin的潜在药物。
发表杂志:Brief Bioinform.
影响因子:11.623
研究背景
端粒是染色体末端的高阶结构,对癌症的发生发展至关重要。端粒被称为保护蛋白或端粒的特殊保护蛋白质复合物。保护蛋白复合体由六种蛋白质组成,分别是TRF1、TRF2、RAP1、TPP1、POT1和TIN2,可防止端粒降解或融合。其中TRF1和TRF2是双链端粒DNA结合因子,而POT1直接与单链DNA结合。TIN2和TPP1桥接TRF1、TRF2和POT1以稳定复合物。RAP1通过与TRF2相互作用而被招募到端粒。Shelterin的功能是帮助T环结构形成,促进端粒擦除,进而保护端粒。端粒保护的丧失导致染色体端对端融合,导致染色体碎裂、kataegis和四倍体化。端粒危机是一种广泛的基因组不稳定性状态,可促进癌症进展。研究已发现shelterin在多种癌症中存在异常表达,一些shelterin基因的突变是癌症驱动因素。
流程图:
分析解读:
shelterin复合体在泛癌中细胞突变和拷贝数改变分析
计算TCGA数据库中33种癌症类型的9125名患者的泛癌队列中的SCNA(扩增和深度缺失)和突变频率。
结果:shelterin复合体在泛癌中的改变
下图A:显示了保护蛋白复合物及其端粒DNA结合的图表。
下图B:癌症保护基因中基因组畸变(非沉默突变和SCNA)的特征,图中显示了Shelterin的六个基因的改变频率
下图C-D:突变(C)和SCNA(D)频率在癌症类型中的分布,颜色的深浅与频率成正比。
下图E:TRF1和TRF2、RAP1、TPP1的互斥模式,以及OV(左)和PRAD(右)中TRF2、RAP1、TPP1的共缺失。每个条形代表一个基因,每一列是患者的拷贝数状态。红色表示扩增,蓝色表示深度缺失。
mRNA表达分析和shelterin评分
通过比较癌症与正常组织中shelterin的表达模式进行评分并分析其与基因组不稳定性的相关性。
结果:
下图A:热图显示了肿瘤和邻近正常组织之间的保护蛋白差异表达。红色表示在肿瘤中高表达,蓝色表示低表达。
下图B:shelterin基因表达聚类分析揭示了三个不同的模块,在顶部框中用不同的颜色标记。每行代表一个基因,每列代表一个患者。红色表示高表达,蓝色表示低表达。表达数据通过每行的z-score进行归一化。
下图C:箱线图显示了三个模块中六个保护蛋白基因的表达。三个聚类模块之间的差异进行Kruskal-Wallis检验。
下图D:三个模块中的样本分布。每一行是一种癌症类型,每一列代表一个模块。
下图E-I:三个模块中基因组不稳定性评分列表的水平。该列表包括突变负荷(E)、SCNA负荷(F)、非整倍性(G)、LOH、杂合性缺失(H)和HRD、同源重组缺陷(I)。三个聚类之间的差异进行Kruskal-Wallis检验。
Shelterin相关通路和癌症免疫相关性分析
①对Shelterin表达和每种癌症类型中所有蛋白质编码基因的表达进行了spearman相关分析。
②根据每种癌症类型中六个shelterin基因的mRNA表达计算了一个“shelterin评分”。
③将shelterin评分和基因表达之间的spearman相关系数进行GSEA分析。
结果:
下图A:热图显示了重要标志集的归一化富集分数。每一列都是一种癌症类型,每一行都是标志集。显着的标志集是在至少17种癌症类型(占癌症类型总数的一半以上)中FDR<0.05的集。红色代表正标准化富集分数,蓝色代表负富集分数。
下图B:柱状图显示了在保护蛋白和显着标志集之间具有负(蓝色)和正(红色)相关性的癌症类型的数量。
下图C:热图显示了每种癌症类型中保护蛋白评分和免疫调节剂表达之间的spearman相关系数。
下图D:显示了在接受免疫检查点阻断疗法治疗的两种癌症患者中,shelterin的表达与PD-1(也称为PDCD1)的表达之间的相关性。
下图E:在Kaplan-Meier生存曲线分析中,将具有高保护蛋白评分的患者的总生存率与具有低保护蛋白评分的患者进行了比较。
DNA甲基化、miRNAs和lncRNAs调节shelterin表达
①为了评估DNA甲基化水平与shelterin mRNA表达之间的关系,作者对每种癌症类型的六个成分进行了spearman相关分析
②为了全面了解shelterin的miRNA调控网络,筛选了所有具有shelterin 3'UTR结合潜力的miRNA,并得出了161个针对miRNA的保护蛋白。
③lncRNAs是否可以调节shelterin的表达仍有待探索,作者接下来从最近对lncRNA调控的泛癌研究中检索了一系列调控保护蛋白表达的lncRNA。为了获得高可信度的lncRNA-shelterin调节相互作用,作者保留了那些具有spearman相关系数P>0.15和P<0.05的绝对值的lncRNAs。
结果:
下图A:DNA甲基化与表达呈负相关。热图显示了在每种癌症类型的启动子中,shelterin表达和DNA甲基化水平β值之间的Spearman相关系数。红色表示正相关,蓝色表示负相关。
下图B:miRNA-shelterin相互作用网络显示miRNA靶向至少两个shelterin靶点。
下图C:显示了p53调节的miRNA及其保护蛋白靶标。红色矩形表示miRNA与其靶标相互作用。
生存分析
R “Survival”和“Survminer”包进行Kaplan-Meier分析和Cox回归分析,以测试保护蛋白表达与存活率之间的关联。
结果:shelterin是24种癌症类型的预后因素。
下图A-B:保护蛋白表达对患者存活率的影响。高保护蛋白评分与更好(A)和更差(B)的总体生存率相关。在Kaplan-Meier生存曲线分析中,将具有高保护蛋白评分的患者的总生存率更高。
下图C:RAP1具有最多的相关癌症类型,其中9种呈正相关。POT1被发现是LAML、LGG、READ和SKCM的不良预后因素。对于LGG,六个保护蛋白基因和保护蛋白评分中的五个都可以预测更好的存活率。
shelterin与药物的相关性
①对于每种癌症类型,在Connectivity map在线工具(http://clue.io)中,对Shelfin评分的前150个正相关或负相关基因进行连接图分析。
②使用用于GSEA分析的miRNA靶标(从miRTarBasev6.0下载)进行miRNA通路关联。LncRNA-miRNA相互作用从NPInter V4.0数据库下载,通过使用lncRNA目标(从LncTarD数据库下载)GSEA分析进行LncRNA通路关联。
结果:
下图A-B:热图显示来自每种癌症类型的连接图中每种化合物的正(A)和负(B)相关性。化合物按显着相关的癌症类型的降序排列。蛋白质合成抑制剂和PKC抑制剂与shelterin表达呈正相关。相反,PKC激活剂与shelterin反相关。
小结:
Shelterin是癌症中的重要蛋白质复合物,研究其在癌症中的功能对于了解肿瘤发生和基于端粒的设计治疗方案是必要的。本研究通过挖掘TCGA多组学分析数据对33种癌症类型的9000多个样本进行了综合分析,揭示了在肿瘤环境中保护蛋白的多种功能调节机制和常见的保护蛋白相关通路。随后,作者根据癌症类型预测了shelterin对PD-1阻断疗法的反应,并发现shelterin是患者总生存期的有利因素,这都证明shelterin表达将成为未来癌症治疗反应的预测标志物。同时,Connectivity map数据库也确定了用于调节保护蛋白表达或靶向保护蛋白相关通路的潜在药物,这将成为了解癌症中shelterin系统研究端粒功能障碍的宝贵资源,并有助于开发端粒靶向治疗药物。