TCGA数据分析系列(二):LinkedOmics
今天继续我们TCGA在线数据库系列。今天介绍的数据库是LinkedOmic,http://www.linkedomics.org/login.php可谓是航母级数据库,没有做不到的,只有想不到的。话不多说,我们直接开始。
数据库的主页面
数据库的数据来源
第一步:选择肿瘤
第一步我们选择肝癌
第二步:选择数据类型
第二步我们选择RNA-seq
第二部还可以进一步选择亚型
第三步:选择要分析的基因
我们选择LDHA
第四五步:选择目标数据集和统计方法
这里我们依旧选择RNA-seq,这样的话我们可以做LDHA与其他基因RNA水平上的相关性,以及GO,KEGG,GSEA等分析。如果你想做生存分析,可以选择Clinical,想做甲基化,基因突变相关的分析,都可以选择对应的目标数据集。比如突变,可以选择基因突变或者突变位点。这需要大家慢慢摸索了。选择不同的目标数据集,出来的统计方法也不一样。这里我们选择Pearson。另外,所有的数据都是可以下载的!
结果
出来的结果就是这样样子,点击圆圈就可以浏览结果
批量相关性分析的结果可以下载
相关性的火山图
相关性分析热图
左边是与LDHA正相关基因的热图,右边是与LDHA负相关基因的热图。
点击LinkInterpreter可以做富集分析或者GSEA分析。
我们来选择GSEA分析演示一下
等待一段时间后,全部结果都出来了,并且所有的结果都可以下载。
GSEA结果的表格
GSEA结果的图
所有的结果都可以下载SVG格式,下载之后就可以用AI调整清晰度。
可以看到结果还是很靠谱的,LDHA富集到最相关的通路就是HIF-1信号通路。
以上我们只是演示了LDHA的GSEA富集分析的整个流程,这个数据库还能做的分析太多了,所以我才称它为航母级数据库。好了,今天的在线数据库分享就到这里了。
另外,最近收集了一些很好的资源,想分享给大家,顺便能涨一些粉,主要有
1. 19年中标的各门类国自然题目汇总,以及17年的国自然汇总,部分含摘要!
2. R语言学习书籍
R语言实战(中文完整版)
R数据科学(中文完整版)
ggplot2:数据分析与图形艺术
30分钟学会ggplot2
3. TCGA数据整理
前期从https://xenabrowser.net/datapages/ (UCSC Xena)数据库下载的TCGA数据,传到了百度云上备份。