点点鼠标 - 构建进化树 - 调用IQ-TREE在超短时间ML
在这种情况下,我们需要一些界面化,或者可视化的工具来做辅助。
不时,总会有一些声音,他们非常确信,离开了命令行,离开了界面化,就不是生物信息。
事实上,我个人的观点是,他们还不知道什么是生物信息。如果说我们大多数人看到的是生物信息的一栋房子,或许他们看到的,只是这栋房子的一张照片。
我只是并没有与这些人争执或者是我并不回应他们,因为上一次回应他们,已经是三四年前,我们都还年轻的时候。何必追求太多人的认可?关键是自己看清自己。
基本完成序列到进化树构建的界面操作
不同的基因,不同的家族,不断的人工查看,我原本计划是用mega的。但是,他最大的问题是,我觉得用起来不够快,而且用起来不爽。
TBtools就不一样,他的开发目标似乎是,无论如何,我就是要用的爽。于是,在综合考量目前已有的软件后,我决定打包三个软件,来完成一件事情。
多序列比对 - 之前在做小RNA数据下游生物信息挖掘时,我已经打包了muscle
多序列比对结果修剪 - 之前在做一些课题项目是,我自己写了两个剪切办法,重新实现了Gblocks,现在继续打包我个人最喜欢的trimAl,因为他的表现,让我很满意
IQtree,我最后还是打包了IQtree,用来构建ML树。不过需要明确一个事情,我打包他,是因为他本身就自带了最优替代模型判断(这个可能对于80%以上做生物学问题,又不接触进化相关知识的朋友来说,非常重要。。。因为可能很多人根本就不知道这一步的重要性)。
鼠标点点点,快速构建进化树
在TBtools中,我们已经可以使用Muscle Wrapper进行多序列比对;多序列比对结果,可以用TBtools中已有的三个界面化工具进行剪切,建议是用trimAl Wrapper。感兴趣的可以翻公众号之前的推文。此处,我们只介绍新增加的这个功能 。
从界面来看,你可以发现,最基础的操作非常简单:
设置 输入文件(注意到,你可以直接黏贴多序列比对的文本 Text Input)
设置 输出 目录 (你当然可以给一个输出文件的前缀;注意到 ,你可以直接让Newick Text输出到Output TextArea,如果你懒得去看太多其他信息)
其他参数看心情和需要设置。
一般用户直接点Start按钮,然后等待就可以了。大概是100个蛋白序列,我等了有三五分钟...
一旦完成,那么会弹出结果(是的,直接可视化最终的Newick 树)
可以看到,左侧摁钮 Get Newick Tree
,点击 可获得Newick文本,
当然,你也可以对这个进化树做一些简单的标,然后再保存,比如
不过目前这个功能我觉得还不够优秀 ,如果你感兴趣,你应该使用TBtools的TreeTreeTree
,也就是之前推的树蜀黍。
写在后面
同样,我仍然没什么好说的。简单易用的工具,不值得用大篇幅来介绍他的使用。
最后,祝大家国庆假期愉快。