生物信息于我们做生物问题的,其实不需要那么复杂
出发点
昨天的推文,其实很早就写啦,只是没推出来。也可能是在无意识的情况下看到一些公众号推文,所以就想着写写推推。当然,我自认为是,不小心和一些推文有撞车了。推出之后,有几个朋友就联系上来啦,有赞同的,也有不赞同的。当然,我大体的回应是,我也就说说,不必认真,毕竟,我就是搞生物的,不是搞生物信息的。正好还在一周之内,自然是得空可以抒发抒发。于是今天再稍微推推,侃侃侃侃。
聊聊我们谈搞生物信息,到底是怎么个搞法?。
自我定位
每一个人,或者说每一个研究生,对自我的定位其实才是过得是否充实和快乐的基础。没有定位的,其实我个人也米有啥看法,估计你的导师也没有看法。毕竟,你自己都不知道自己到底要什么,以后想成为一个大概是什么样的人,你的导师怎么给你建议?大体是这么一个场景:
学生:老师,麻烦你指导我一下?
老师:指导什么?!哪方面的?
昨天的推送提到了我认为的三种不会被取代的搞生物信息的,简单的说,真的是在搞生物信息的人:
搞算法的,-→ 数学
搞软件开发的,流程开发的,-→ 计算机
搞生物学问题的,-→ 生物,化学,物理….等
经过这三四年接触生信的经验,参考计算机相关方向的发展,我给自己的定位是:
我是搞生物学问题的,极端点则是,我是做生物的,不做生物信息。
我的数学一直在努力补习(知道我的人,我在休息是的位置上,简明微积分,统计学方面的书,一直就放在旁边),我知道或者我认定了,我几乎是不可能去搞这一块了。
我的计算机方面一直在努力补习(知道我的人,就知道我有一大堆的书都是计算机,缺什么就买什么,跟那些参与一大堆培训班,关注一大堆公众号的人,加一堆QQ群的人是一样的)
唯独剩下生物学问题这一点,我觉得我完全可以努力一下,达到一个或许还不错的效果,毕竟我从大一至今,并没有离开过这一块,甚至我自认为我还不差,至少在身边的圈子生,更何况,我从来不认为我身边任何一个人,尤其大部分比我聪明的人,会比我更加勤奋。我通过长时间的学习,尽可能弥补了我智商的短板,于是才会有相当一部分人反而觉得我聪明(这个很搞笑,小时候我们家人包括我就明白了,我是家里孩子中智商最差的,然而目前就我一个人读书到现在…似乎说明了某个观点 —- 现在读博,似乎只是勤奋问题,跟智商没啥关系)
对目前一些生物信息社群(QQ群,微信群,公众号,知乎,简书….)的看法
其实,除了少数商业化倾向极其明显,或者不尊重其他人的努力成果的社群外,我其实都觉得这些社群,每一个都非常有价值。无论是分享观点,分享操作,分享流程,分享代码,分享进展,工作招聘。运行这些的人,没有一个不优秀。只是每个社群的理念就是不同,
有些社群注重的是算法
有些社群注重的是编程
而更多社群注重的是软件和流程的使用
注重软件的使用和流程的使用,其实跟做生物学问题并没有直接关系,但这一块确实是一直以来的最大的需求,而前两者很少可以看到,因为做这些方面的人似乎往往主要在github。
做生物问题,优秀的,其实我们不能在社群中太经常看到,因为都太忙。
更或者这么说
“每个社群,其实最适合的人群还是初学者;一旦度过这个阶段,留在社群的人,往往是某种美德驱使。因为社群对他们的收益微乎及微”
这也是为什么bioinformatics中国,目前清理的人早已远超2000人,*因为,度过了那么一个阶段,其实你确实不需要这个群了,而并没有时间来帮助新入群的人,那么留着也是浪费自己的流量。
那我到底还要不要学生物信息?
当然要!,我个人完全支持掌握所有软件,完成各种项目的分析这种操作,因为这样你确实会成为一个或许是的生信工程师。这个做法很好,也没有错。重点在于,回过头看看,社群里待过的群,还有多少其实还继续在生信这一块继续发展?不多。这个我觉得不在于这个专业的发展好或者不好,而在于一个人是否有自我认知,看清楚自己在做什么,而不是停留在纯粹的软件安装,软件使用更或者流程搭建与运行。
我自认为,凡是有心真的想成为那三类不会被取代的搞生信的,应该睁大眼睛看清楚,你们社群里的哪一个大流是只知道软件安装,软件使用,流程搭建与运行的。明显,完全没有。而你却因为诸如我很着急,我要入门,我要搞生物信息,我就是生信工程师,这些个的原因,能运行各种生信相关软件,各种流程,甚至也重复了很多RNA 重测序 GWAS 项目。到底你比起那些你眼中的大流,缺少的是什么?
少的是,你或许从来没有读懂这些软件的文献,更或者没有读过文献或者manual,更甚至,你根本没想过这个软件有对应的文献,对应的manual。
意识!一个太简单的道理 — 知其道,用其妙。我推荐一门课程,即是北大的网络公开课,生物信息学导论,这门课真的是最值得看的。
每一个软件拿上来,第一步,真的不是跑demo。
而是,看他的文献,看完了看他的manual。剩下的,你觉得真的还需要看别人的软件使用流程?其实真的不是,你需要的可能是软件安装过程遇到的一些问题(这些一般是计算机基础问题)。你需要百度谷歌。
anyway,其实直接copy别人的流程,其实我个人也很支持,我自认为我几乎没这么做过。因为我第一步,一定是看文献,优先于安装软件。
差不多了。想想这个推文最适合的读者应该是课题组的师弟师妹,希望他们能明白,为什么我其实不太喜欢扔流程给他们,毕竟如果看到软件的文献,其实不需要我的流程。如果真的有必要呢?
那就给docker,nextflow,一键式pipeline
生信数据分析,尤其是二代测序数据的分析流程,其实真的似乎没有哪一类是没有公开流程的;这些公开的流程,最麻烦的常常是安装和参数的调整。
所以现在有大量的云平台,慢慢地也有一体机,剩下的,似乎不用过多的解释了。
“我们这类生信工程师”的就业前景
已用引号括起,因为不属于以上三者,其实也包括我,我也在努力地往最后一类发展。我们这类生信工程师呢,熟悉各类软件的使用,会跑各种流程,包括安装,输出不怎么美观的结题报告。可以独立完成不少项目,简称 — “生信民工”。就目前而言,“生信民工”事实上,就业前景没有三四年前好(三四年前我才知道生信,所以只能说当时的情况,似乎以前就更好了),但是还不错。其实以后也不会太差,原因完全不需要解释。
“鲁迅”:我没说过生信熟练民工找不到工作。
人,行业,总是躁动的,总有需要你的地方,只是机会更小而已。请参考为什么程序员那么满大街了,还是有很多就业缺口。展开讲就太复杂啦。
所以不用当心你找不到工作,或者找到的工作确实很差,你需要担心的是,我怎么升华自己,升一级,不再做生信民工,而是做生信工程师。
而这种担心什么时候该有,每个人的观点就不同了。
我想说,“都可以,我能要求的,只有我的师弟师妹”。
总之,又回到一个定位问题,
你说你要搞生物信息,那到底你对自己的定位是什么?
我只想做生物学问题,怎么办?
没办法,你还是要学一学的,了解一下,
简单分析,有各种软件,无论是web的 local的,界面的太多了,你看Pacbio组装也是SMRT-link Web GUI的哈,难道没听过CLC? GENIOUS?Ugene 吗?太多商业化软件啦。
更或者,跟其他课题组合作,更或者招technician!
更或者,确实如昨天所说,分析部分的项目打包—-成就了一批公司。
别当心,生物信息与你而言,太简单,只要…你愿意花时间点点鼠标,更或者你愿意花钱打包项目
不会太久,更或者只是你完全没有站到某个高度,不知道别人家的操作,真的不是每个人都要去搞命令行。
做湿实验的,你确实有足够多的精力可以兼顾两者吗?到底是搞计算机的,还是搞生物学问题的?别开玩笑了,我说我是搞生物的,其实我真的没做多少湿实验,而你的大部分生信大流,其实他们做多少实验呢?
优势!
自我定位,其实是在看清楚 自己的优势。做湿实验的优势,其实就是生物学问题的把握。为什么要去生信专业的人拼软件,拼流程呢?知道软件,知道流程就行了,关注生物学问题。没必要执着。
看清优势。