用这种套路挖掘TCGA简单到爆
常规的TCGA数据挖掘足以满足2-3分的SCI文章需求,无论你是毕业需求,还是普升需求,基本上都能满足。这里介绍的挖掘套路就是:下载TCGA的转录组数据,整理好mRNA,lncRNA,miRNA,然后做差异分析,对差异基因做功能分析,再构建lncRNA-miRNA网络,miRNA-mRNA网络,最后在cytoscape上整理出ceRNA网络,对网络中的lncRNA进行生存分析,一篇文章就出来了。
这里有一篇比较新的文章作为参考:
Comprehensive analysis of lncRNA-associated competing endogenous RNA network in tongue squamous cell carcinoma
PMID:30755833
摘要:
背景:
越来越多的证据表明,长的非编码RNA(lncRNA)在竞争性内源RNA(ceRNA)网络中发挥重要作用,因为它们通过海藻microRNA(miRNA)调节蛋白质编码基因表达。然而,对舌鳞状细胞癌(TSCC)中的ceRNA网络的理解仍然有限。
方法:
收集关于mRNA,miRNA和lncRNA的表达谱数据以及来自癌症基因组图谱(TCGA)数据库的122个TSCC组织和15个正常对照的临床信息。我们使用edgR包来鉴定TSCC样品和正常样品之间差异表达的mRNA(DEmRNA),lncRNA(DElncRNA)和miRNA(DEmiRNA)。为了探索DEmRNA的功能,进行了京都基因和基因组百科全书(KEGG)途径分析。随后,基于鉴定的DE1ncRNAs-DEmiRNA和DEmiRNA-DEmRNAs相互作用建立ceRNA网络。分析了ceRNA网络内的RNA与总体疾病存活率的相关性。最后,特别分析了lncRNA与所包括的TSCC患者样品中的临床特征的相关性。
结果:
共鉴定出1867个mRNA,828个lncRNA和81个miRNA在TSCC组织中差异表达(-log 2倍变化≥2;调整的P值<0.01)。得到的ceRNA网络包括16个mRNA,56个lncRNA和6个miRNA。 56例lncRNA中有10例与TSCC患者的总生存率相关(P <0.05); 10个lncRNA与TSCC进展相关(P <0.05)。
结论:
我们的研究加深了对TSCC中ceRNA网络调控机制的理解。此外,我们鉴定了10种lncRNA(PART1,LINC00261,AL163952.1,C2orf48,FAM87A,LINC00052,LINC00472,STEAP3-AS1,TSPEAR-AS1和ERVH48-1)作为TSCC的新型潜在预后生物标志物和治疗靶标。
文章的主要图片: