做生信数据挖掘一定要会编程吗
自从meta分析贬值了之后,生信数据挖掘成为了国内医生、研究生、博士、教师火爆的发文神器,可是令人头痛的事情来了,生信往往需要学习编程,其中R就必不可少,如果要挖TCGA、SEER,Perl或者Python就必不可少,如果只挖GEO,只要会R就可以了。那有没有数据库不需要任何编程呢?答案是有的。那是什么数据库呢?那就是大名鼎鼎的Oncomine。
正文开始
做生信数据挖掘的常见思路是这样子(以GEO为例)的:
做以上分析往往需要涉及R言语,所以对于R基础较差的人来说是非常头痛的事情,当然,有人钱的话可以请人做。
如果是做肿瘤的话,还可以探讨基因表达与预后的相关性。TCGA和Oncomine是是肿瘤数据,所以我们只能研究肿瘤,不想做肿瘤的可以选择GEO或者其他数据库。
为什么Oncomine数据库不用编程呢?
以上分析,除了基因表达与临床相关性外,其他分析Oncomine自己会计算分析,我们只要点几下鼠标就可以了,对于绘制生存曲线,我们只需用SPSS或者GraphPab Prism软件就能完成,也就是在点多几下鼠标就可以了。大家会发现,整一个分析只需要点鼠标就能完成了,不想TCGA那样,经常有代码报错。
TCGA数据挖掘或者SEER经常会出现这样的烦恼:
然而,Oncomine数据挖掘永远不会出现这种情况。也许当你在找这些代码出现错误的原因的时候,做Oncomine的人已经将文章写好了,换句话说,人家利用你在弄这些代码的时候悄悄地升为了主任,成为了你的领导,而此时的你依然不知道怎么回事。
最关键的问题:Ocomine能发在什么水平期刊呢?
基因差异表达分析 + Meta分析基因表达与临床相关性 + CCLE analysis + GOBO analysis 发3-5分的SCI妥妥的。
学习的捷径在哪里呢