不在一个维度讨论-对不起Y叔

Y叔选择在11点之前发帖,那么就是要我回咯~~~

生信编程直播第七题:写超几何分布检验!

说一点跟超几何分布检验无关的事情

我真心不想讨论未被KEGG数据库收录的基因是否应该在做超几何分布检验的时候被丢弃掉,因为在Y叔给我他的博客的时候,http://guangchuangyu.github.io/2014/08/why-clusterprofiler-fails/

看完全文其实我已经明白了Y叔说丢弃掉那些没有被注释到的基因的理由了!

我没办法判断Y叔正确有否,我只知道他说的有他的道理!

一个基因除了可以是属于一个通路,不属于一个通路,还有可能是未知的,应该抛弃,因为考虑它只会引入误差,这没毛病!

但我也有我的看法,把KEGG数据库所有通路的基因取一个并集,叫做通路注释基因集,用它来过滤背景基因和差异基因也并不可取。就像Y叔说的,未知的基因可能属于也可能不属于我们想检验的通路,因为KEGG对一个套路的注释并没有达到完整状态!

那如果这样说,其它通路的基因难道就不能属于这个通路吗?

不在这个通路的其它通路的基因就一定不属于这个通路吗?

如果我们如此的不相信KEGG数据库,干脆不要检验好了!

当然,这仍然不是我要争论的重点。

回答我想说的,我随机模拟的背景基因和差异基因被KEGG数据库过滤的程度是一样的,所以P值改变不大,我觉得没毛病。

Y叔的反驳点是我的随机模拟是不科学的,这样的反驳我当然不能说他是错的,可是跑题了。

就好像,我说将来我在金马伦高原买了别墅,如果一个背包客路过我的高尔夫球场,我一定会像当初请我吃饭的大叔一样,请他!

你却反驳我没有别墅,没有高尔夫球场,这~~~

我无言以,我的假设合理与否不重要,我为什么随机模拟的背景基因和差异基因,因为我只是给学员讲解超几何分布建议这个算法、

那么最后一点,也不用说了,既然我随机模拟用代码证实了P值改变不大,我当然不在意这件事咯,而不是我不想求出精确的P值。

这不一样。

(0)

相关推荐

  • 有趣地将差异表达基因有用地展示在KEGG通路上

    身为一个公众号,如果不更新,那么太对不起关注的朋友们啦.然而,作为一个正经的果农,我确实没太多可以分享的.按照惯例,先宣传一下地球上最好的生物信息理论和技术交流QQ群(bioinformatics*C ...

  • 【科研】转录组测序数据分析

    引言 前面两期主要为各位简单介绍了转录组测序以及转录组测序的方法,相信各位对转录组测序有了一定的了解.那么测序后进行数据分析,具体包含哪些分析内容呢?本文就详细为各位介绍一下. 分析内容 mRNA是具 ...

  • GO分析和KEGG分析都是啥?

    前几天和大家介绍了一下GEO数据库以及使用GEO2R进行差异表达分析GEO2R差异表达分析软件.几乎现在的套路性文章在做完差异表达分析后,都会去做GO和KEGG富集分析.那么GO和KEGG都是什么?富 ...

  • 人体的经络,丹田与人体是不是不在一个维度里?

    经络.丹田是古人通过内观和长期实践而具象化的概念,两者其实有着密不可分的联系.但前者被普遍应用到医学上,由于与现代科学理念大相庭径已逐渐远离普通人的视野,后者在道家修炼中占有极其重要的地位,又细分为上 ...

  • 神仙在几维空间 神仙和人类生活在一个维度空间吗

    神仙生活的空间是不同的,根据等级的不同,几维空间也是不同的.在很多的书中也记载过,世界有三十三重天,也就证明有三十三个空间,人类生活在三维空间,每一维空间中住的人是不同的,越往上住的生物能力越大. 一 ...

  • 第7篇:用Y叔的ChIPseeker对peaks进行注释和可视化

    ATAC系列连载: 第1篇:ATAC-seq的背景介绍以及与ChIP-Seq的异同 第2篇:原始数据的质控.比对和过滤 第3篇:用MACS2软件call peaks 第4篇:对ATAC-Seq/ChI ...

  • 批量GO-KEGG富集分析注释何必自己写脚本,看Y叔的神器

    之前我有多个基因集的时候,比如下面这个: > head(moduleGenes[,2:3])      module             chr 1     brown ENSG000001 ...

  • 使用Y叔神包ggtree进行基因家族基因进化树构建

    大家好,我是技能树的老朋友啦,三年前在群主的第一波RNA-seq入门8步活动中因为表现优异获得群主青睐成为技能树VIP一员,也开启了自己的学习经验分享人生! 转录组入门传送门 考虑到技能树过于偏重于肿 ...

  • 为R包写一本书(像Y叔致敬)

    最近收到粉丝求助,本来是询问富集分析的时候,我给的参考代码,为什么pvaluecutoff值和qvaluecutoff值设到0.9,其实是怕大家富集不到结果.然后Y叔在自己的微信公众号中提到" ...

  • 眼馋Y叔的可视化函数却还想使用DAVID结果肿么办

    昨天宣传了Y叔的clusterProfiler包的让人眼花缭乱的可视化炫技,见:为R包写一本书(向Y叔致敬) .有趣的是粉丝留言提到:Y叔的图必须以富集出来的对象,比如enrichKK来画,如果是自己 ...

  • Y叔的clusterProfiler承包了富集分析结果的可视化

    不管是 GO或者KEGG这样的常见数据库的注释结果,还是mesh,reactomePA, DOSE这样的略微小众的数据库资源,不管是超几何分布检验的富集还是GSEA的算法,都Y叔都有对应的可视化函数支 ...

  • 昨晚看到了Y叔发布的ggtreeExtra-今天我和phylsoeq无缝对接-绘制微生物组的大圈图

    写在前面 之前我绘制圈图已经有很长时间的历史了,用过ggtree,也用过graphlan,虽然graphlan非常强大,但是确实很难搞.Y叔的这个包还是很强大的. GraPhlAn:最美进化树或层级分 ...