糖尿病视网膜病变患者的长非编码RNA的鉴定
咱们《生信技能树》的B站有一个lncRNA数据分析实战,缺乏配套笔记,所以我们安排了100个lncRNA组装案例文献分享,以及这个流程会用到的100个软件的实战笔记教程!
标题:Transcriptome analysis identified a novel 3-LncRNA regulatory network of transthyretin attenuating glucose induced hRECs dysfunction in diabetic retinopathy
标题:转录组分析鉴定 到新的3-lncRNA关于 糖尿病视网膜病中 转甲状腺素 减弱葡萄糖诱导人视网膜内皮细胞功能障碍 的调控网络
期刊:BMC Medical Genomics(2019 Oct )
通讯:1.Yu Xin
2.Yong Yao
机构:1.江南大学生物技术学院工业生物技术教育部重点实验室
2.南京医科大学附属无锡市人民医院眼科
文章链接:https://doi.org/10.1186/s12920-019-0596-2
摘要:
背景:糖尿病视网膜病变(DR)是劳动年龄人群致盲的主要原因。转甲状腺素(TTR)在DR患者中的浓度显着降低,转甲状腺素通过抑制新生血管发挥视觉保护作用。本研究旨在识别长非编码RNA(LncRNA),并探讨其潜在的TTR保护作用机制。
方法:人视网膜内皮细胞在低糖(LG)、高糖(HG)或高糖加4μM转录区(HG+TTR)处理后,进行转录组分析。获得差异表达的lncRNAs、mRNAs和TTR相关的lncRNAs和mRNA。功能注释和基因集富集分析用于分析TTR的影响途径和过程。采用加权基因共表达网络分析(WGCNA)获得HUB模块和基因。根据顺式、反式和竞争性内源RNA的作用方式构建了LncRNA-mRNA调控网络。采用定量逆转录聚合酶链反应(QRT-PCR)检测30例DR患者和10例正常人房水和血清中LncRNAs的表达。
结果:低糖(LG)、高糖(HG)和高糖加4μM的TTR(HG+TTR)处理的人肾小管上皮细胞(HRECs)进行了测序。共鉴定了146,783个蛋白质编码转录本,12,403个已知的lncRNA转录本和1184个新的非编码转录本。
HG组与LG组比较,共获得11407个差异表达mRNA(DE-mRNAs); HG+TTR组与HG组比较,分别获得6206个差异表达mRNA(DE-lncRNAs)和194个差异表达LncRNAs(DE-lncRNAs)。
获得了853个TTR-mRNAs和48个TTR-lncRNAs,功能涉及细胞周期、细胞凋亡、炎症信号通路、氧化应激反应、新生血管和自噬。WGCNA分析确定了一个由133个基因组成的中枢模块,其核心功能包括氧化应激反应、血管生成、MAPK途径、细胞增殖和凋亡。通过qRT-PCR验证,构建了3-lncRNA调控网络。最后,LncRNAs MSTRG.15047.3和AC008403.3在房水和血清中的表达水平均显著高于正常对照组,而FRMD6-AS2的表达水平显著低于正常对照组。
结论:TTR调控mRNAs和生物过程,包括氧化应激、炎症信号和自噬。3-lncRNA调控网络的特征是TTR抑制新生血管,在DR中显示出潜在的诊断性能。
材料方法
1.数据
human retinal pigment epithelial cells GSE117238
低糖 、高糖、高糖+TTR,这3个分组各自都是 三个重复
2.转录组测序与差异表达基因(DEGs)鉴定
组装:Trinity 和 De Bruijn Graph 注释:BLASTX 定量:FPKM 差异分析:Fold Change≥2, P ≤0.05 and FDR ≤0.05. 富集分析: DAVID GO KEGG GSEA
3.蛋白质相互作用(PPI)网络分析和子网络构建
STRING database
interaction score > 0.4 interaction score > 0.4
用CentiScaPe计算每个节点的中心性参数,找到网络中最重要的节点。
使用MCODE寻找主网络内密集连接的区域和自网络。
4.WGCNA
当软阈值定义为10时,具有133个基因ME绿色的模块与葡萄糖和TTR的相关性最高。共表达网络的构建及模块检测的方法,我在生信技能树有多个教程分享WGCNA的实战细节,见:
一文学会WGCNA分析
一文看懂WGCNA 分析(2019更新版) (点击阅读原文即可拿到测序数据)
其他:
5.ClueGo中的模块基因、生物途径和功能网络
对133个ME绿色模块基因的功能进行了注释,并在Cytoscape ClueGo和CluePedia中标记了显著丰富(P<0.05)的通路。
6.LncRNA顺式和反式调控网络的构建
对每个lncRNA上下游10kb/100kb的编码基因进行研究。分析lncRNA与靶基因表达水平相关性。相关系数>0.95或<−0.95
结果
1.转录本特征描述
经过PLEK ,CPAT,CNCI,CPC2的过滤,鉴定到1184个新的候选lncRNA。将其分成五类:
内含子lncRNA, 正义链lncRNA, 反义链lncRNA, 双向lncRNA 基因间区lncRNA。
结合已知的lncRNA和编码蛋白基因,做了一些特征分析。此外,还进行了可变剪接的分析。
2.差异基因及TTR相关差异基因的鉴定
第一组:**HG vs. LG :**11407个DE-mRNAs 和 679个 DE-lncRNAs
第二组:**TTR+HG vs. HG :**6206 DE-mRNAs 和194个 DE-lncRNAs
由于TTR对于高糖具有保护作用。所以将在第一组与第二组表达趋势相反的差异转录本定义为TTR-DEGs。包括:853 mRNAs 个 48 lncRNA
这个差异分析比较容易复现,基本上看我六年前的表达芯片的公共数据库挖掘系列推文即可;
解读GEO数据存放规律及下载,一文就够 解读SRA数据库规律一文就够 从GEO数据库下载得到表达矩阵 一文就够 GSEA分析一文就够(单机版+R语言版) 根据分组信息做差异分析- 这个一文不够的 差异分析得到的结果注释一文就够
得到如下所示的火山图和差异基因热图;
3.KEGG、GO和GSEA分析
对于853个TTR-mRNA,KEGG主要富集在细胞凋亡、胰高血糖素信号通路、cAMP信号通路、RNA降解和转运、MAPK信号通路、erbB信号通路和嘧啶代谢等途径。GO 主要富集在姐妹染色单体粘连、染色体分离、细胞周期调控、I-κB激酶/NF-κB信号的正调控以及细胞对dna损伤刺激的反应等生物学过程。
图c.对HG和LG中mRNA的GSEA分析发现,与细胞周期相关的通路如DNA复制,以及炎症通路。
图d.对TTR+HG和HG的mRNA进行GSEA分析,
4.TTR蛋白-蛋白相互作用网络和子网络的功能
TTR划分成5个子网络
1中的27个TTR-mRNAs主要参与泛素介导的蛋白水解和细胞周期。
2中的19个TTR-mRNAs影响DNA复制和细胞周期。
3中的39个TTRmRNA通过剪接体、核糖核酸转运、蛋白翻译以及由丝裂原活化蛋白激酶和NFκB途径介导的细胞凋亡来调控基因的剪接。
4中的32个TTR-mRNAs发挥氧化磷酸化调节作用。
5中19个TTR-mRNAs的功能是转录调节和DNA修复
5.WGCNA分析发现HUB模块同时受葡萄糖和TTR调节
软阈值设置为10 ,确定了一个由133个基因构成的模块,参与氧化应激、血管生成、MAPK途径、增殖和凋亡等生物学过程
6.基于顺式、反式和ceRNA相互作用关系的lncRNA-mRNA调控网络
大量lncRNA的功能是未知的,但是它们主要是cis-regulators,所以可以根据它们临近的蛋白编码基因功能来近似推断,然后表达量的相关性也可以类推到。
根据位置关系推断 使用bedtools等工具!
表达量的相关性, 比如杂志Cancer Medicine, 2020的文章《 Genome-wide DNA methylation analysis by MethylRad and the transcriptome profiles reveal the potential cancer-related lncRNAs in colon cancer》,在进行结直肠癌相关lncRNA的功能富集分析,就是采用LncRN2Target v2.0和StarBase分析与15个lncRNA共表达的蛋白编码基因,其中lncRNA HULC和ZNF667-AS1分别鉴定到28个、9个共表达的蛋白编码基因!
顺式调控网络(8A)中,选择编码mRNAs附近的lncRNAs进行网络构建。网络中的edge表示同一染色体中10kb内的相对上游或下游位置。该顺式调控网络由133个基因的33个顺式lncRNA/mRNA对和61个TTR-DEG基因(33个TTR-lncRNAs和28个TTR-mRNAs)组成。
反式调控网络(8B)中,96个TTR-deg和184个TTRlncRNA/mRNA对组成的网络。
TTR-mRNA的ceRNAs的TTR-lncRNAs(8C)。总共12个TTR-lncRNAs、12个miRNAs和12个mRNAs组成了11个TTR-lncRNA/miRNA/mRNA子网络
7. 5个功能性的lncRNA-mRNA反式网络
结合图4所示的5个mRNA亚网络和图8中的lncRNA-mRNA反式网络,构建了5个lncRNA-mRNA网络。
网络1 :12个TTR-lncRNAs与11个TTR-mRNAs相关,参与泛素介导的蛋白水解和细胞周期
网络2:9个TTRlncRNAs与7个TTR-mRNAs相关,参与DNA复制和细胞周期
网络3:12个TTR-lncRNA与23个TTR-mRNA相关,参与MAPK和NFκB途径介导的剪接体剪接、RNA转运、蛋白翻译和细胞凋亡
网络4:9个TTR-lncRNAs与12个TTR-mRNAs相关,参与氧化磷酸化调控
网络5:5个TTR-lncRNAs与8个TTR-mRNAs相关,参与转录调控和DNA修复
8.以3-lncRNA为中心具有诊断功能的的TTR调控网络
使用qTR-PCR验证了10个TTR-lncRNA的表达,其中3个在RNA-seq和qRT-PCR都显示出显著的表达趋势。
LncRNA (MSTRG.15047.3)在LG组和HG+TTR组显著上调,分别是HG组的15.39倍和8.11倍。
lncRNA FRMD6-AS2 在LG组和HG+TTR组的的表达分别为HG组的1.81倍和3.25倍。
lncRNA (AC008403.3)在LG和HG+TRR组的表达分别是HG组的2.32和1.33。
构建了一个以3-lncRNA为中心的TTR调控网络。
最后检测30例DR患者和10例正常对照(非糖尿病患者)房水和血清中LncRNA MSTRG.15047.3、AC008403.3***和***FRMD6-AS2的表达。
在DR患者中,***MSTRG.15047.3***和**AC008403.3在房水和血清样本中的表达均显著高于正常对照组,而**FRMD6-AS2的表达显著下调(图10C),显示出作为DR诊断生物标志物的潜在潜力。
总结:
通过比较HG和LG,TTR+HG和HG中表达相反的基因确定出TTR-DEGs。
通过比较LG组和HG+TTR组与HG组中lncRNA的差异表达,确定了三个可应用于诊断的lncRNA。
文末友情推荐
与十万人一起学生信,你值得拥有下面的学习班: