组合多个GSE数据集进行meta分析不妨先去冗余

发现一个工具,发表在 BMC Bioinformatics201415:323 https://doi.org/10.1186/1471-2105-15-323,很简单的设计,就是考虑到做多个GSE数据集的meta分析的人越来越多了,但是很多人都瞎搞,整合数据集的时候没有去冗余。

所以作者开发这个R包: DupChecker: a bioconductor package for checking high-throughput genomic data redundancy in meta-analysis

既然是R包,那么学习起来就很容易了。

meta分析都想做,结果第一步就失策,哈哈,反思一下!

■   ■   ■

我的领域最出名的GSE数据集的meta分析应该就是2011年的TNBC了,如下:

(0)

相关推荐

  • “数据、信息、见解”的关系和数据治理(上)

    公众号后台回复:管理1906,免费下载本月推荐精品管理类图书 公众号后台回复:人文历史1906,免费下载本月推荐精品人文历史类图书 First 加入"ICT销售和大客户联盟"(微信 ...

  • TCGA-miRNA批次矫正后数据集介绍

    前段时间,我们对于批次效应有关的东西进行了一些介绍.其中包括 [[批次效应]] [[批次效应去除工具]] 对于经常使用的TCGA数据库而言,同样也有批次效应存在.对于这样的批次,在公布之前也经过一定的 ...

  • 做meta分析到底至少要纳入多少篇文献?

    做meta分析到底至少要纳入多少篇文献?这是很多刚开始学习meta分析的时候问到的问题.那到底有没有一个具体的数值呢? 之前在网上看到有大牛说,至少10篇才有意义:也有大牛说至少要5篇:也有些说至少要 ...

  • 什么?你还在用GEO2R进行差异表达分析

    GEO虽是一个宝库,但是使用GEO进行数据分析可不是一件简单的事! 首先,GEO的数据检索非常不方便,例如,我想获取有预后信息的乳腺癌数据,显然使用GEO官方检索起来很难. 其次,GEO大部分数据都基 ...

  • 大多数人做科研都有这样的一个缺点

    我们无论是做实验还是做meta分析.数据挖掘,都需要想到一个idea.然而想到一个理想的idea并不简单,因为需要我们付出很多,例如时间,脑力和体力等等.这个过程需要我们非常有耐心,能够耐心寻找机会, ...

  • 为什么依然这么多人搞meta分析?

    为什么现在这么流行生信数据挖掘和临床数据挖掘,身边依然还是很多人在做meta分析?此外,已经有部分单位不承认meta分析,实行三不政策(不能用来毕业.不能用来普升.不进行奖励).面对这种情况,周边依然 ...

  • 数据挖掘最怕被问到这些问题

    经过一年多的培训,我们的粉丝已经发表大量的SCI论文,包含meta分析.生信数据挖掘.临床数据挖掘.有时候,往往会遇到一些特别变态的审稿人,下面我们来看看审稿人怎么变态法? 问题1: 作者应该做一个临 ...

  • 掌握这个技能,可以让你的TCGA数据挖掘多发几篇SCI

    TCGA是一个非常了不起的数据库,让无数研究生和临床医生可以顺利毕业.升职加薪.申请基金,毫不犹豫地说每一个用TCGA数据发表了论文的人或者课题组都应该好好感谢一下这个数据库. 现在利用TCGA数据发 ...

  • 用别人的数据,发自己的SCI

    "用别人的数据,发自己的SCI",想必有很多人都听过了这句话,也有很多人实现了这句话的梦想.既然这句话这么重要,我们给大家总结一下那些方法能实现这句话. 一.在过去 我们熟悉的me ...

  • 做Meta分析之前一定要注册,要不然你会后悔的

    本来系统评价和meta分析就是两个不同的概念,但是随着meta分析的发展,很多人都将meta分析就是系统评价,系统评价就是meta分析.meta分析类的文章越来越多了,规范也就越来越多,越来越严格,其 ...

  • 当你还在为meta分析制定检索式的时候,人家已经利用生信把文章写好了

    很多人都是觉得生信数据挖掘很难,迟迟都不肯学习一下.五年前是利用meta分析发文章,现在依然还是利用meta分析发文章.五年前meta分析的文章可以顺利毕业,顺利拿到论文奖励,顺利拿到普升的机会.可是 ...

  • 太尴尬了,全科室就我一个人没有SCI

    不知道有没有粉丝经历过下面这位粉丝的这种情况:全科室的人都发了相关SCI论文,就自己一个人没有发过SCI论文,感觉没有办法在科室立足了,觉得自己是另类. 如果真的遇到上面这种情况,大家都发了SCI而就 ...