2020年的3+分ceRNA分析长啥样?
Dysregulated lncRNA-miRNA-mRNA Network Reveals Patient Survival Associated Modules and RNA Binding Proteins in Invasive Breast Carcinoma
失调的lncRNA-miRNA-mRNA网络揭示了浸润性乳腺癌患者的生存相关模块和RNA结合蛋白
(今天炒年糕小编由于感冒,有点鼻音,录屏音质可能不是很好,虽然平时音质也也也一般般啦!希望大家能够谅解下~)
一. 研究背景
浸润性乳腺癌约占乳腺癌的80%,并且在形态,临床特征和预后方面均表现出高度异质性因此仍需要挖掘基因组水平的调控机制。越来越多研究显示miRNA和lncRNA对乳腺癌的发生发展都有调控作用,作者便想通过整合不同RNAs,研究ceRNA网络在浸润型乳腺癌中的作用,寻找并深入研究网络中RNA结合蛋白(RNA binding protein,RBP)。
二. 研究思路
三. 结果解析
1. 识别在侵袭性乳腺癌中差异表达的RNAs
图1. 识别侵袭性乳腺癌中差异表达的RNAs
数据获取和预处理以及分析:作者从TCGA数据库中获取了1184个样本(1079 浸润性乳腺癌患者 vs 104 正常样本)的miRNA,mRNA,lncRNA表达谱数据,去除了在10%以上正常样本中无表达量的RNAs。将RNAs分为两组:
对在<30%的肿瘤样本中没有表达量的RNA进行t检验,差异表达的RNAs的筛选标准是|logFC|>1且adjp<0.01。
对在> 30%的肿瘤样本中无表达量的RNA进行Fisher精确检验。先根据RNAs分子有无表达量分为ON和OFF两类,若在癌症中ON的RNA的频率是正常样品中的两倍且adjp<0.01则被认为是差异表达的RNAs。
经分析后识别出4296个mRNA,3057个lncRNA,367个miRNA在浸润性乳腺癌和正常样本间存在差异表达。
A-C:对lncRNA,mRNA,miRNA在所有样品中的表达量进行层次聚类分析,验证在乳腺癌患者和正常样本之间存在差异表达的RNAs。
D-F:对样本进行主成分分析,无论变量是lncRNA,mRNA或是miRNA,肿瘤样本(蓝色)和正常样本(红色)都能够区分开,再次证明肿瘤样本和正常样本间确实存在差异表达的RNAs。
2. 构建浸润性乳腺癌中的lncRNA-miRNA-mRNA调控网络
图2.构建的失调ceRNA网络以及分析
A: 利用starBase的AGO1/2 CLIP-Seq(一种检测和蛋白质相互作用的RNAs的技术)数据,筛选差异表达的miRNAs中与AGO蛋白(能与miRNA结合形成RISC复合体)结合的靶miRNAs。之后应用miRanda网站的算法,预测靶miRNAs的靶lncRNAs和靶mRNAs从而进行筛选;得到了预测的miRNA-lncRNA,miRNA-mRNA调控关系。进一步的筛选要求是:
最终筛选出75个miRNAs,63个lncRNAs,401个蛋白质编码基因的mRNAs,并用Cytoscape构建了浸润型乳腺癌中失调的ceRNA网络。
配对的两RNA在TCGA-BRCA中的表达量显著相关,即p<0.01,|r|>0.4
只有共享同一个miRNA的配对RNAs才能保留,即mRNA和lncRNA是同一个miRNA的靶标
B:对网络中的蛋白质编码基因进行GO-BP的分析,这些基因在细胞周期,有丝分裂等通路中富集。
C:这些基因在与癌症特征相关的通路中也富集。
D:在DAVID中基因富集的结果显示这些基因在乳腺癌相关基因中显著富集。
3. 分析失调的ceRNA网络中的RNA结合蛋白
图3.对网络中RNA结合蛋白的分析
A:作者根据文献中已经证实的RBP(RNA binding protein),筛选出构建的ceRNA网络中有58个RBP。利用STRING数据库构建PPI网络(protein-protein interaction)。
B:对网络中的RBP进行GO-MF分析,富集最显著的前10个分子功能通路与RNA结合有关,进一步证实了它们是RBPs。
C:对网络中的RBP进行GO-BP分析,富集最显示的前10个生物过程通路与细胞周期,细胞分裂有关。
4. ceRNA网络中的模块与浸润型乳腺癌患者的生存有关
图4. ceRNA网络中的两个模块
A-B:作者利用CytoCluster插件对ceRNA网络进行聚类分析,得到的两个模块
图5. 针对两个模块的生存分析以及表达分析
C-D:分别根据两个模块中RNAs的表达量进行K均值聚类,作者将TCGA-BRCA队列聚成了两类。之后再进行 Kaplan-Meier生存分析。这两个网络调控模块与浸润型乳腺癌病人的预后都显著相关。
E:对两个网络调控模块的表达模式的研究发现,二者都在癌组织中呈现低表达,可能与浸润型乳腺癌的发生有关。
小结
本篇文章也是ceRNA套路,先通过TCGA数据库筛选出差异表达的miRNA,lncRNA,mRNA,再结合miRanda,starBase的数据对结合关系进行预测并筛选这些差异表达的RNAs并由Cytobase可视化ceRNA网络。之后再对网络中的编码基因进行GO/KEGG通路分析并取出其中的RBP分析。对ceRNA网络中模块的分析也是必不可少。好啦,我们下期再见。