零代码全部利用在线数据库的4分 纯生信文章是如何炼成的?
大家好!今天跟大家分享的是2020年5月发表在Cancer Cell International(IF = 4.175)上的文章。文章利用从TCGA数据库中搜集的子宫内膜癌(EC)数据,分析了其中差异表达的lncRNA及其预后价值。并且使用多种生物信息学在线工具和数据库进一步探讨了RP11-89K21.1和RP11-357H14.17的转录因子(TFs),竞争性内源RNA(ceRNA)机制,功能调节网络和免疫浸润,说明了RP11-89K21.1和RP11-357H14.17在EC的发生发展中可能起关键作用,并且可以作为EC的潜在预后生物标志物。
题目:Identification of long noncoding RNA RP11-89K21.1 and RP11-357H14.17 as prognostic signature of endometrial carcinoma via integrated bioinformatics analysis
通过整合生物信息学分析鉴定长非编码RNA RP11-89K21.1和RP11-357H14.17作为子宫内膜癌的预后标志
摘要
子宫内膜癌(EC)是妇科中最常见的恶性肿瘤之一。长链非编码RNA(lncRNAs)在EC发生和发展中的潜在功能和机制仍不清楚。因此探索lncRNA的签名对于提供EC的预后价值具有重要意义。本文首先确定RP11-89K21.1和RP11-357H14.17的高表达与EC患者的总体生存期缩短(OS)和预后不良密切相关。还阐明了与RP11-89K21.1和RP11-357H14.17相关的转录因子和共表达基因的网络。此外,通过2个lncRNA(RP11-89K21.1和RP11-357H14.17),11个miRNA和183个mRNA构建了ceRNA调控网络。功能富集分析表明,RP11-89K21.1和RP11-357H14.17的靶标基因与癌症中的miRNA、血管发育、生长调节、生长因子和细胞分化等功能密切相关,并在包括癌症生物学通路、癌症中的miRNA和凋亡信号通路在内的生物学通路中富集。本文首次证明RP11-89K21.1和RP11-357H14.17在EC的发生发展中可能起关键作用,并且可以被视为EC的潜在预后生物标志物。
流程图
1. 数据的获取和整理
本文利用cirlncRNAnet间接获取了TCGA数据库中EC的lncRNA表达数据,并使用GEPIA中的数据进行了进一步分析。
2.用circlncRNAnet和GEPIA鉴定子宫内膜癌(UCEC)样本中差异表达的lncRNAs
为了研究lncRNA在UCEC的发生发展中的作用,本文首先在cirlncRNAnet的LncRNA-TCGA模块中鉴定了差异表达的lncRNA。在UCEC中总共检测到10978个lncRNA,其中121个lncRNA失调(77个上调和44个下调)。本文使用GEPIA进一步验证了121种差异表达的lncRNA在UCEC中的表达,发现在UCEC中只有RP11-89K21.1和RP11-357H14.17显著差异表达(图1a,b),与cirlncRNAnet的结果一致。UCEC中CTD-2314B22 0.1,CTD-2377D24.6,RP11-657O9.1和LINC00668的表达高于正常组织,但差异无统计学意义(图1c-f)。与正常组织相比,UCEC中AP000892.6,ACTA2-AS1和RP11-867G23.10的表达明显降低(图1h-i)。
3. 用GEPIA分析UCEC中差异表达RP11-89K21.1和RP11-357H14.17的预后价值
本文进一步使用GEPIA探索了UCEC中121个差异表达的lncRNA的预后价值。结果表明,UCEC中RP11-89K21.1、RP11-357H14.17、CTD-2314B22.1,CTD-2377D24.6、RP11-657O9.1和LINC00668的高表达与总生存期(OS)缩短显著相关(图2a-f)。此外,UCEC中AP000892.6、ACTA2-AS1和RP11-867G23.10的表达降低,而AP000892.6,ACTA2-AS1和RP11-867G23.10的高表达与不良预后显著相关(图2g–i)。生存曲线显示RP11-89K21.1、LINC00668和ACTA2-AS1的高表达也与OS相关,RP11-357H14.17、CTD-2377D24.6和AP000892.6则与OS无相关性。综上所述,RP11-89K21.1和RP11-357H14.17的高表达可能在UCEC的发生,发展和预后中起重要作用。
4. RP11-89K21.1和RP11-357H14.17的细胞定位和共表达基因
lncRNA的细胞定位在其功能和分子机制中起着至关重要的作用,本文使用lncLocator探索了RP11-89K21.1和RP11-357H14.17的亚细胞定位。结果表明,RP11-89K21.17主要位于胞质和胞质中,RP11-357H14.17主要位于胞质和核糖体中(图3a)。说明RP11-89K21.1和RP11-357H14.17更有可能通过ceRNA网络发挥其生物学功能和潜在机制。本文进一步探索了RP11-89K21.1和RP11-357H14.17的共表达基因,并通过Circos图和circlncRNAnet的热图可视化。图谱显示与RP11-89K21.1和RP11-357H14.17相关的前50个共表达基因的染色体分布,它们主要位于常染色体中。2号染色体(RP11-89K21.1所在的位置)和7号染色体(RP11-357H14.17所在的位置)没有显著富集。热图表明AC012354.6、SIX3、SIX3-AS1和Six3os1_1 / 2/4/5是RP11-89K21.1共表达基因,CTD-2377D24.6、HOXB- AS4、HOXB9和MIR196A1是RP11-357H14.17的共表达基因(图3b,c)。
图3
5. RP11-89K21.1和RP11-357H14.17的转录调控和蛋白质相互作用
本文通过AnnoLnc研究了RP11-89K21.1和RP11-357H14.17的转录因子(TFs)和结合蛋白。发现31个TF与RP11-89K21.1相关,42个TF和RP11-357H14.17相关,有21个TF与两个lncRNA共同相关(图4a)。本文发现UCEC中EZH2的表达显著升高,而UCEC中TCF7L2的表达显著降低。UCEC中其他TF的表达水平无显著差异(图4b)。本文进一步使用starBase研究了EZH2表达与RP11-89K21.1和RP11-357H14.17正相关(图4c)。基于相关系数太小,本文利用GEPIA进一步探讨了EZH2与RP11-89K21.1,RP11-357H14.17之间的相关性,结果表明EZH2的表达与RP11-89K21.1和RP11-357H14.17均呈正相关(图4d)。此外,RP11-89K21.1的结合蛋白包括CBWD7、GUSB、ABRA、MTUS2、VAMP4(图4e),RP11-357H14.17的结合蛋白包括CLIC1、CNN2、TCTN1、TMEM240和ZNF836(图4f)。转录因子(图4e)和结合蛋白(图4f)的网络通过GeneMANIA可视化。
6. lncRNA–miRNA–mRNA调控网络的构建
lncRNA的亚细胞位置与其在肿瘤中的潜在功能和机制密切相关。本文发现RP11-89K21.1和RP11-357H14.17都主要位于细胞质中,并且RP11-89K21.1和RP11-357H14.17可能通过ceRNA机制实现了生物学功能。因此,利用AnnoLnc预测了RP11-89K21.1和RP11-357H14.17的结合miRNA。starBase进一步验证了潜在miRNA的表达。结果显示22个miRNA家族和10个miRNA家族分别与RP11-89K21.1和RP11-357H14.17相关。有5个miRNA家族与两个lncRNA都相关(图5a),其中miR-27b,miR-4770,miR-143,miR-204在UCEC中的表达为显著下降(图5b-h)。UCEC中miR-125a-5p,miR-125b-5p,miR-139-5p,miR-670-3p,miR-24-1-5p,miR-503的表达也显著降低。将miR-27b、miR-4770、miR-143、miR-204、miR-125a-5p、miR-125b-5p、miR-139-5p和miR-670-3p视为RP11-89K21.1的候选靶标miRNA。将miR-27b、miR-4770、miR-143、miR-204、miR-24-1-5p和miR-503视为RP11-357H14.17候选靶标miRNA。、miRTarBase进一步预测了候选miRNA的靶向mRNA。Cytoscape构建了lncRNA-miRNA-mRNA调控网络,网络中包含2个lncRNA(RP11-89K21.1和RP11-357H14.17)、11个miRNA和183个靶基因(图6)。
图5
7. lncRNA靶基因的功能富集分析
为了探索RP11-89K21.1和RP11-357H14.17在UCEC的发展中的潜在功能和机制,通过Metascape分析了RP11-89K21.1和RP11-357H14.17靶向基因的GO和KEGG富集分析。GO显示,RP11-89K21.1靶向基因主要富集与参与转录因子复合物和细胞质的核周区域,还调节近端启动子序列特异性DNA结合、磷酸转移酶活性、酶和生长因子结合(图7a–d)。RP11-89K21.1靶向基因的生物学过程主要涉及血管发育、细胞死亡和分化调节、组织形态发生以及对生长因子的反应(图7e-f)。RP11-357H14.17靶向基因主要位于细胞质的核周区域,参与了细胞周期蛋白依赖性蛋白激酶全酶复合体,黏附连接和转录因子复合体,还调节了蛋白激酶活性、转录因子和激酶结合等功能(图8a-d)
图7
图8
8. RP11-89K21.1,RP11-357H14.17的表达与ImmucLnc免疫浸润的相关性
为了研究RP11-89K21.1,RP11-357H14.17与免疫浸润之间的关系,使用ImmucLnc数据库检测RP11-89K21.1(CD8_T细胞,巨噬细胞,树突状细胞),RP11-357H14.17(BMSCs和CD4_T细胞以及中性粒细胞)相关的免疫细胞类型。本文发现RP11-89K21.1的表达与CD8_T细胞和巨噬细胞呈负相关,与CD4_T细胞和中性粒细胞正相关(表1)。RP11-357H14.17的表达与CD8_T细胞呈负相关,与CD4_T细胞呈正相关(表2)。
表1
表2
结语
本文通过一系列综合数据库首次证明了RP11-89K21.1和RP11-357H14.17的高表达与EC患者的不良预后密切相关。进一步鉴定了转录调节因子,共表达的基因,RP11-89K21.1和RP11-357H14.17的相互作用蛋白。生物学功能的调控网络,信号传导途径可能有助于阐明EC中RP11-89K21.1和RP11-357H14.17的潜在功能和机制。本文推测与RP11-89K21.1和RP11-357H14.17相关的ceRNA网络为EC引发和发展的分子机制。
文章的亮点在于使用了多种生物信息学工具和数据库,使文章内容非常饱满,不足之处是分析内容较多,主线不清晰,结果讨论需要加强。RP11-89K21.1和RP11-357H14.17的功能实验也需要进一步补充。
附本文用到的生物信息学工具和数据库:
CirclncRNAnet (http://120.126.1.61/circlnc/index.php) :用于探索TCGA数据库中lncRNA和circRNA测序表达数据的分析工具;
GEPIA (http://gepia.cancer-pku.cn/) :癌症测序表达数据及分析工具;
The Kaplan–Meier (KM) Plotter (http://kmplot.com):生存曲线分析工具;
UCSC (https://genome-asia.ucsc.eduk/index.html):基因注释信息;
LNCipedia (https://lncipedia.org) :是人lncRNA转录序列和结构的注释数据库;
LncLocator (https://LncLocatorwww.csbio.sjtu.edu.cn/bioinf/lncLocator/) :预测lncRNA的亚细胞定位;
AnnoLnc (http://annolnc.cbi.pku.edu.cn) :lncRNA注释数据库;
StarBase (http://starbase.sysu.edu.cn/) :非编码RNA相互作用关系分析数据库;
GeneMANIA (http://www.genemania.org) :可视化功能及调节网络;
miRTarBase (http://mirtarbase.mbc.nctu.edu.tw/php/index.php) :miRNA靶标基因数据库;
Metascape (http://metascape.org):GO及KEGG富集分析及可视化;
ImmLnc (http://bio-bigdata.hrbmu.edu.cn/ImmLnc):研究lncRNA免疫相关功能工具。