讨论如何使得go或者kegg数据库富集结果展现的更好

现如今,go或者kegg数据库富集已经是太平常不过的分析了。

绝大部分数据挖掘,不管是通过差异分析还是生存分析,都会拿到基因集,就可以进行这样的分析。

我们以DOSE包的内置数据集geneList为例:

library(DOSE)
data("geneList")
head(geneList)
gene_up=head(names(geneList),200)
gene_down=tail(names(geneList),200)

常规可视化

library(clusterProfiler)
library(ggplot2)
library(stringr) 
go <- enrichGO(gene_up, OrgDb = "org.Hs.eg.db", ont="all") 
barplot(go, split="ONTOLOGY")+ facet_grid(ONTOLOGY~., scale="free") 
barplot(go, split="ONTOLOGY",font.size =10)+ 
  facet_grid(ONTOLOGY~., scale="free") + 
  scale_x_discrete(labels=function(x) str_wrap(x, width=50))+
  ggsave('gene_up_GO_all_barplot.png')

go <- enrichGO(gene_down, OrgDb = "org.Hs.eg.db", ont="all") 
barplot(go, split="ONTOLOGY",font.size =10)+ 
  facet_grid(ONTOLOGY~., scale="free") + 
  scale_x_discrete(labels=function(x) str_wrap(x, width=50))+
  ggsave('gene_down_GO_all_barplot.png')

出图如下:

常规可视化

可以看到, 在CC那个部分,多次出现  chromosome regions,有点冗余,所以可以精简。

进阶可视化

主要是使用了  simplify 对GO富集分析结果进行精简。

go1 <- enrichGO(gene_up, OrgDb = "org.Hs.eg.db", ont="bp") 
go1 <- simplify(go1)
go2 <- enrichGO(gene_up, OrgDb = "org.Hs.eg.db", ont="cc") 
go2 <- simplify(go2)
go3 <- enrichGO(gene_up, OrgDb = "org.Hs.eg.db", ont="mf") 
go3 <- simplify(go3)

go4 <- enrichGO(gene_down, OrgDb = "org.Hs.eg.db", ont="bp") 
go4 <- simplify(go4)
go5 <- enrichGO(gene_down, OrgDb = "org.Hs.eg.db", ont="cc") 
go5 <- simplify(go5)
go6 <- enrichGO(gene_down, OrgDb = "org.Hs.eg.db", ont="mf") 
go6 <- simplify(go6)

library(patchwork)
dotplot(go1) / dotplot(go2)/dotplot(go3)
dotplot(go4) / dotplot(go5)/dotplot(go6)

出图如下:

进阶可视化

这个时候,图仍然是有很多可以调整的地方,不过Y叔开发的这些包出图都是基于ggplot2语法,所以很容易修改。比如如果有一些GO条目的名字巨长,也可以很方便调整,如下所示:

library(patchwork)
library(stringr)
library(ggplot2)
p  = dotplot(go1) + scale_y_discrete(labels=function(x) str_wrap(x, width=20)) 
p
p / dotplot(go2)/dotplot(go3)
p  = dotplot(go4) + scale_y_discrete(labels=function(x) str_wrap(x, width=20)) 
p
p / dotplot(go5)/dotplot(go6)

cytoscape

发起了《使得go或者kegg数据库富集结果展现的更好》的讨论后,2021第一期生信入门学习班的小伙伴马上开了一个公众号来持续更新这方面资料,虽然第一个推文写的弱爆了:Understand_EA#GO,不过也算是分享了干货。enrichplot里emapplot这个图不是很方便调整,那么clueGO值得你体验。

image-20210318202635300

网页工具

同样的,也是2018年《单细胞数据分析实战》学习班的学员,开通了自己的公众号,分享的教程:如何优雅展示GO富集结果,提到了这个网页工具:http://funset.uno/ ,如果你感兴趣它的表现,直接去看学员的公众号吧:如何优雅展示GO富集结果

最高级的应该是AI或者PS啦

比如文章《Targeted immunotherapy for HER2-low breast cancer with 17p loss》里面的通路富集结果如下所示:

 

那么问题来了,AI或者PS该去哪里学呢?

文末友情推荐

(0)

相关推荐

  • 转录组学习八(功能富集分析)

    任务 选择p<0.05而且abs(log2FC)大于1的基因为显著差异表达基因集,对这个基因集用R包做KEGG/GO超几何分布检验分析. 把表达矩阵和分组信息分别作出cls和gct文件,导入到G ...

  • GEO联合TCGA数据挖掘文献分享

    今天要介绍的这篇章是我们中国人写的,发表在Med Sci Monit上,这篇文章主要是通过下载GEO和TCGA的数据,通过差异表达分析,GO富集分析.KEGG富集分析,PPI分析,COX回归分析,筛选 ...

  • 关于功能富集分析的基础知识

    富集分析基因富集分析(gene set enrichment analysis)是在一组基因或蛋白中找到一类过表达的基因或蛋白.研究方法可分为三种:Over-Repressentation Analy ...

  • 技术贴 | KEGG功能注释和KEGG功能富集的在线预测

    本文由沐子星根据实践经验而整理,希望对大家有帮助. 原创微文,欢迎转发转载. 导读 KEGG是1995年由日本京都大学生物信息学中心的Kanehisa实验室建立的,是一个整合了基因组.化学和系统功能信 ...

  • 技术贴 | 微生太宏基因组报告解读 | 第六篇:功能分析-基于KEGG数据库

    本文由阿童木根据实践经验而整理,希望对大家有帮助. 原创微文,欢迎转发转载. 导读 KEGG 数据库由Kanehisa Laboratories于1995年推出,现在已经发展成为一个综合性数据库.KE ...

  • KEGG数据库的rest API(附带R语言小技巧)

    发现感兴趣的KEGG ID居然不在KEGG.db包里面,比如: hsa05034 Alcoholism hsa05030 Cocaine addiction 导致下面的代码失效: library(KE ...

  • 零基础-绝对完成GO/KEGG pathway富集分析-和-绘图

    约莫一个月前,不知为何,突然收到好几个朋友问了一些TBtools的使用问题.按照我个人的设想,TBtools的使用应该不会存在使用问题.从开放使用至今,几乎没有停止过接受用户的反馈和改进.感谢TBto ...

  • 不用编程,三分钟KEGG/GO富集分析火热出炉!

    据不完全统计,今年来基迪奥OmicShare云工具平台的KEGG和GO富集分析工具使用次数已经突破30,000+啦!KEGG和GO富集分析作为平台使用频率最高的工具之一,一直陪伴大家.听许多对生信还不 ...

  • KEGG功能富集可视化“玩出”新花样,文章档次提高的不是一点点!

    组学分析是目前生物学研究中最重要的研究手段之一,而数据的可视化,发表文章也是大家所追求的.好的数据通过较好的方式呈现,能够让人眼前一亮,给文章增色不少.功能富集也是组学分析中经常用到的,而一般见到的都 ...

  • 使用biopython解析kegg数据库

    KEGG数据库称之为基因组百科全书,是一个包含gene, pathway等多个子数据库的综合性数据库.为了更好的查询kegg数据,官方提供了对应的API. 在biopython中,通过Bio.KEGG ...

  • 经常提到的KEGG数据库是什么样子的

    KEGG(Kyoto encyclopedia of genes and genomes, )(https://www.kegg.jp/)是系统分析基因功能. 基因组信息的数据库,它整合了基因组学.生 ...

  • 一文读懂KEGG数据库

    KEGG数据库介绍 在进行生物学实验或者生物信息的学习中,都会听说KEGG富集分析,而且该方法在高通量测序分析中已然成为数据分析中必不可少的一环. 这种分析方法依托的是由 Kanehisa实验室 在1 ...