IGV-sRNA - 植物小RNA测序数据专用基因组浏览器
如本期推文,我们开始对外共享三年多以来的部分工作成果,即 sRNAanno - 一个植物小RNA注释数据库 ( www.plantsRNAs.org )。在这个数据库中,用户可以但不仅限于:
下载138种植物全基因组小RNA位点注释信息(包括miRNA, phasiRNA, hc-siRNA)
基于miRNA名字检索数据库或指定进化分支的miRNA,基于序列比对,Blast查看指定序列是否是sRNAanno收录的miRNA或phasiRNAs位点
下载 IGV-sRNA,用于用户自己的小RNA测序数据人工矫正结果
使用 sRNAanno 提供的sRNA位点注释服务,注释自己的基因组
早前,在《生信札记》公众号上,或者是 夏瑞课题组 的 暑期公益生信培训中 ,我们已经明白也建议过,所有测序数据分析结果,最好都要用IGV或其他基因组浏览器做Manual Check。
具体这个建议,无论是基于 夏瑞老师 十多年的小RNA数据分析与挖掘经验(不信你看下他GB NC PC NP MBE...的文章)还是基于 CJ 近五年的生信数据分析与挖掘经验(不信你就看看 TBtools的功能 与 这个公众号的推文),都无一步支持。
所有的数据分析都是基于人为设计的逻辑,人为构想的模型,出来的结果当然在多数时候是比较可靠,但很多时候没有人能保证一套流程在测试数据中的表现很好,而在实际数据一样能有过得去的表现。
难道?你真的不知道新的生信软件往往在文章使用的测试数据中表现得最好吗?
?
所以Manual Check,Double Check,这些在数据分析与挖掘中很重要。同时,好的可视化软件或可视化工具,更是可能让你发现新的东西。比如,参考前述我们发表在 New Phytologist 上的文章,阐述了 可变剪切与phasiRNAs产生的协同作用。
同时,一张好看的图表,尤其是基因组浏览器的截图,往往在高质量工作报道中可以看到。因为这样的图表,让人一眼就看懂。人是视觉动物,直观感受使人更容易信服,而好看的图表,则让人舒服。
那么,哪里可以找到合适的 基因组浏览器呢?重测序,转录组,简化基因组等等等等,这些或许我们不知道。不过在我们开发 sRNAanno 的过程中,我们改造了IGV,并得到 IGV-sRNA。我们可以很有自信的说:IGV-sRNA 就是目前为止,最适合植物小RNA数据探索和比对结果可视化的工具。
可以看到,其包含各种特性,但是这里不便展开,暂时先引用一些早期的推文,有时间,我们会在做补充:
最后,我还是要补充几句。事实上,我们自己从零开发了一款基因组浏览器 sRNABrowser (其实从零开发两次,所以也可以说是两款),但最后我们还是选择放弃并转而改造IGV。原因有两个:
用户习惯
站在巨人的肩膀上,你会走得更快
IGV的用户群体真的很大,很多用户也习惯了。我们的基因组浏览器如何从零开发,最后都越来越像他。所以我们写着写着开始觉得“IGV真是考虑了太多需求与实现”。而同样,如果我们要拿到一个可以同时做到 展示所有其他测序数据 与 我们自定义的小RNA测序数据 的基因组浏览器,那么最好的方式,事实上,就是改造IGV。当然,目前结果看来,这个选择是对的。
所以,我们也相信 IGV-sRNA 可以为 所有 有植物小RNA数据分析需求的 科研工作者与团队 提供一个便利且有用的工具。同时 sRNAanno 也可以整合和提供一个 长久的,全面地,对科研信息共享有益 植物小RNA注释专用平台。