cox可以火山图为什么gsea结果不行

最近看到一个文献,是数据集:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE101668

GSM2711785    RKO-WT-rep1
GSM2711786    RKO-WT-rep2
GSM2711787    RKO-PRDM1-KO2-rep1
GSM2711788    RKO-PRDM1-KO2-rep2
GSM2711789    RKO-PRDM1-KO5-rep1
GSM2711790    RKO-PRDM1-KO5-rep2
GSM2711791    RKO-GFP-OE-rep1
GSM2711792    RKO-GFP-OE-rep2
GSM2711793    RKO-PRDM1α-OE-rep1
GSM2711794    RKO-PRDM1α-OE-rep2
GSM2711795    RKO-PRDM1β-OE-rep1
GSM2711796    RKO-PRDM1β-OE-rep2

可以看到样本不多,但是分组不少,所以作者分析这个转录组数据的时候,可视化很丰富:

两个差异分析取交集

这样的火山图,韦恩图,相信大家看过我的GEO数据挖掘系列教程,肯定没有问题的啦。

我已经多次讲解了,走标准分析流程,火山图,热图,GO/KEGG数据库注释等等。这些流程的视频教程都在B站和GitHub了,目录如下:

  • 第一讲:GEO,表达芯片与R

  • 第二讲:从GEO下载数据得到表达量矩阵

  • 第三讲:对表达量矩阵用GSEA软件做分析

  • 第四讲:根据分组信息做差异分析

  • 第五讲:对差异基因结果做GO/KEGG超几何分布检验富集分析

  • 第六讲:指定基因分组boxplot指定基因list画热图

仅仅是最后得到的差异分子,并不是以前的mRNA后面的基因名,而是miRNA,lncRNA,甚至circRNA的ID,看起来很陌生罢了。感兴趣可以细读表达芯片的公共数据库挖掘系列推文 ;

这样简单的分析,当然只能是结合生物学背景尽量去解释它。但是有一个图,值得我分享一下,就是

image-20200305232133605

作者把比表达矩阵的差异分析结果(PRDM1-KO and PRDM1-OE RKO cells.),进行gsea分析,针对MSigDB Hallmark 的50个基因集。

Volcano plot of GSEA of the MSigDB Hallmark database. The FDR versus the normalized enrichment score (NES) for each evaluated gene set is shown. Blue dots are significantly enriched gene sets (FDR adjusted P value <0.05).

当然了,针对MSigDB Hallmark 的50个基因集的gsea代码我其实也给了大家,跟我们一直讲解的针对kegg的gsea不一样哦,下面是针对kegg的:

geneList=gene$logfc
names(geneList)=gene$ENTREZID 
geneList=sort(geneList,decreasing = T)
head(geneList)

library(clusterProfiler)
kk_gse <- gseKEGG(geneList     = geneList,
                  organism     = 'hsa',
                  nPerm        = 1000,
                  minGSSize    = 10,
                  pvalueCutoff = 0.9,
                  verbose      = FALSE)
tmp=kk_gse@result
kk=DOSE::setReadable(kk_gse, OrgDb='org.Hs.eg.db',keyType='ENTREZID')

然后是针对MSigDB Hallmark 的50个基因集的gsea代码,需要自己下载gmt文件哦。

#选择gmt文件(MigDB中的全部基因集)
  d='~/biosoft/MSigDB/symbols/'
  gmts <- list.files(d,pattern = 'all')
  gmts
  #GSEA分析
  library(GSEABase) # BiocManager::install('GSEABase')
  ## 下面使用lapply循环读取每个gmt文件,并且进行GSEA分析
  ## 如果存在之前分析后保存的结果文件,就不需要重复进行GSEA分析。
  f='gsea_results.Rdata'
  if(!file.exists(f)){
    gsea_results <- lapply(gmts, function(gmtfile){
      # gmtfile=gmts[2]
      geneset <- read.gmt(file.path(d,gmtfile)) 
      print(paste0('Now process the ',gmtfile))
      egmt <- GSEA(geneList, TERM2GENE=geneset, verbose=FALSE)
      head(egmt)
      # gseaplot(egmt, geneSetID = rownames(egmt[1,]))

return(egmt)
    })
    # 上面的代码耗时,所以保存结果到本地文件
    save(gsea_results,file = f)
  }

同样的可以拿到能够被火山图展现的数据,如下:

火山图收入数据
(0)

相关推荐

  • 生信笔记 | 自定义GSEA分析中的gmt格式文件

    在GSEA分析中,在MSigDB(Molecular Signatures Database)数据库中定义了很多基因集,下载的基因集是gmt格式文件.下载的gmt格式文件,打开后可以看见是下面这个样子 ...

  • clusterProfiler|GSEA富集分析及可视化

    GSEA(Gene Set EnrichmentAnalysis),即基因集富集分析,无需设定阈值来区分上调下调基因,使用所有的基因进行分析. GO 和 KEGG 可参考:R|clusterProfi ...

  • 手把手教你用R做GSEA分析

    GSEA是非常常见的富集分析方式,以前我们做GSEA需要用依赖java的GSEA软件,那个时候准备分析的文件可能要花上很长时间,报错还不知道如何处理.现在我们来学习一下R语言进行GSEA分析. 加载R ...

  • 转录组学习八(功能富集分析)

    任务 选择p<0.05而且abs(log2FC)大于1的基因为显著差异表达基因集,对这个基因集用R包做KEGG/GO超几何分布检验分析. 把表达矩阵和分组信息分别作出cls和gct文件,导入到G ...

  • TCGA转录组差异分析后多种基因功能富集分析:从GO/KEGG到GSEA和GSVA/ssGSEA(含基因ID转换)

    TCGA转录组数据在完成差异分析后,我们通常希望系统地获取这些成百上千的差异基因的功能信息,帮助我们分析下游实验的思路.面对大量的差异基因,逐个查询基因功能是不切实际的.所以我们需要借助基因功能富集分 ...

  • 火山图|给你geneList,帮我标到火山图上

    火山图(Volcano Plot)常用于展示基因表达差异的分布,横坐标常为Fold change(倍数),越偏离中心差异倍数越大:纵坐标为P value(P值),值越大差异越显著.得名原因也许是因为结 ...

  • R EnhancedVolcano 绘制火山图

    火山图是用于差异表达分析结果可视化的一种有效方法.今天,我们来介绍一个用于增强火山图绘制的强大 R 包:EnhancedVolcano ,该包拥有强大的绘图功能,用户可以简单的通过设置颜色.形状.大小 ...

  • 带有基因名的火山图

    现在很多文章开始出现这样的一种情况,在绘制火山图中,显示我们所关注的基因,那么如何去显示呢?很多人可能会这么做,在绘制普通的火山图之后,使用AI对图进行修改,添加部分基因,但是现在我要介绍的是如何用R ...

  • R绘图笔记 | 火山图的绘制

    关于绘图,前面介绍了一些: R绘图笔记 | 一般的散点图绘制 R绘图笔记 | 柱状图绘制 R绘图笔记 | 直方图和核密度估计图的绘制 R绘图笔记 | 二维散点图与统计直方图组合 R绘图笔记 | 散点分 ...

  • 惊!画出来的火山图居然缺半边?

    最近刷文献,发现一个很有趣的火山图,文献是发表在 October 7, 2019的PNAS的:Immune effector monocyte–neutrophil cooperation induc ...

  • 3D的火山图我也是第一次见

    大量的NGS队列都是肿瘤研究领域,比如乳腺癌领域的复旦邵志敏团队TNBC队列,肺癌领域的吴一龙教授团队的队列,以及新加坡国家癌症中心的东亚肺腺癌(EAS LUAD)列队,动辄经费百万起步. 但是我一直 ...

  • 想让你的火山图更漂亮?

    最近有粉丝在我b站的数据挖掘视频课程发弹幕吐槽我授课时候作为例子的火山图不怎么好看,希望我提高一下自己的审美. 课程是:三年前的数据挖掘课程(TNBC表达矩阵探索) https://m.bilibil ...

  • 多次差异分析难道就需要多个火山图吗

    差异分析,大家都喜欢两个分组的比较,但实际科研项目,往往是比这复杂,多达十几个甚至几十个分组也不稀奇.昨天的教程:多分组的差异分析只需要合理设置design矩阵即可,我们展示了无论多少个分组,都可以很 ...

  • 不就画个火山图吗?有那么难吗?

    写在前面 Emmm....课题组昨天开小组会了. 基于博导的建议与提醒,我又开始跳下来看生物学问题. 在当前课题的实验设计里面,我们总共有70个样品,于是我写了一个循环 做了每个样品之间两两差异表达分 ...