Pannzer2 | 推荐一款强大的Gene Ontology注释网站

很多时候,我们一直想做到出色,做到出彩,但是比我们优秀的人,却在相同的方向上,做了十年,出彩了十年,而且他们没有停下脚步~~

写在前面

Emmm,GO注释常常是一个有点争议的分析项目。一般有两种注释方法:

  1. 基于结构域,比如interproscan

  2. 基于序列比对

当然,两者是本质。实际上,现在绝大多数注释都是基于 idmapping,比如比对到 nr 或者到 uniprot ,然后做一轮 IDMAPPING。比对到nr,能转化成GO注释的,基本就uniprot。商业化软件 BLAST2GO 就是这么个操作。TBtools也是这么个操作。这些GO注释都要自己比对,自己动手,还是耗费一些本地资源。很久很久以前,有看到这么一个在线工具Pannzer2。
最近终于还是找到时间看了下。感觉还不错

那我为啥觉得 Pannzer2 还不错?

  1. 他们专门搞了序列比对,用于注释,见文章《SANSparallel: interactive homology search against Uniprot》

  2. 他就是用的uniprot,而不用nr,跟我一直推荐的一样

  3. 他做了注释转移过程和注释转移后的语义过滤

当然,更多细节,感兴趣的朋友应该直接去看他的paper,见文章《PANNZER2: a rapid functional annotation web server》

使用简单

打开网站

http://ekhidna2.biocenter.helsinki.fi/sanspanz/

选择Annotate即可进入注释提交页面

注意到,要求是一个文件不能超过10Mb。一般大概就是2w个蛋白序列。超过这个数目,可以直接用 TBtools 进行序列文件分隔。

如此,可以得到适合与提交到网站的注释信息文件,提交即可。

如此,等到即可

大体上花了 接近 2 个小时,也就是一个小时 1w+ 序列,感觉还不错。对于香蕉大概是3w+个基因。分别提交一个任务,是不是时间也不变? 这个我没测试。
但是速度已经可以了。完成后收到邮件如下,

打开对应链接,就可以查看结果

OK,
软件就介绍到这里。希望大伙不要一下子把对方的服务器跑崩溃了。
不要跟 Batch SMART 一样。。。

写在最后

网络服务好的时候,是真好,不好的时候,是真不好。不维护了呢?宕机了呢?倒闭了呢?一切都是绑定与被绑定。
不过,能解决眼前问题,不就行了嘛?不然呢?

(0)

相关推荐