MegaX进化树构建与分析方法介绍

分子进化遗传学分析(英语:Molecular Evolutionary Genetics Analysis,缩写MEGA)是一个生物信息学软件,可通过分子演化统计学分析建立系统发生树,最初由宾夕法尼亚州立大学的根井正利团队开发。该软件免费,入手难度低,功能强大,适合生物进化研究初学者使用。目前Mega 已经更新到第十版,称为Mega X。下载地址https://www.megasoftware.net/

Mega X支持多操作平台,本文将介绍一些基本使用方法与操作。

Mega主操作界面如图所示。首先,我们来使用alignment这个功能,来将下载的批量fasta文件整理成一个alignment。

我们这里进行DNA alignment。

这里可以选择从文件中提取sequence, 文件类型可以是fasta,nexus,mas等等。

Mega X常用alignment工具包括ClustalW和MUSCLE。ClustalW实现了迭代算法,因此在较早的步骤中不太可能纠正错误,相对于MUSCLE效果好但分析时间长;而MUSCLE则采用了一种渐进式算法,可以在整个过程中对列进行重新优化,速度很快。如果希望用一种较快的程序进行alignment,笔者建议尝试一下MAFFT。另一种选择是T-Coffee,它比Mafft或MUSCLE慢,但性能好。

Gap penalty这里指的是对两个或更多个序列的比对进行评分的方法。比对序列时,在序列中引入Gap可以使比对算法比无Gap比对能够匹配更多的项。但是,减小Gap对于创建有用的alignment很重要。间隙太多会导致对齐变得毫无意义。Gap penalty用于根据Gap的数量和长度调整比对得分。五种主要类型是constant, linear, affine, convex, andProfile-based。具体分析在这里不赘述,一般软件里可以选用默认,但是如果比对序列多,物种种类多,建议仔细分析一下。

开始分析之后需要一段时间得到比对好的序列。

建树之前,我们可以先用模型分析来找到最适合模型。用法和结果与Jmodeltest相似。这里得到的分析模型,为评分最高的substitution model,在建树时直接选用对应model·。

这里选择GTR+G模型,带有最低BIC分数为最适合model,一般列于第一位。

接下来选择phylogeny里面的ML进行maximum likelihoodtree构建。

ML数一般需要进行bootstrap分析来提高精度,这里我们手动输入1000bootstrap。Bootstrap是一种重新采样分析,涉及从分析中取出字符,重建树并测试是否恢复了相同的节点。这是通过多次(非常频繁地进行100或1000次)迭代来完成的。例如,如果通过抽取一个字符并重新采样树的100次迭代中的95次来恢复同一节点,那么就很好地知道该节点得到了很好的支持(在这种情况下,BS值为0.95或95%)。如果支持率较低,则表明只有几个字符支持该节点,因为从矩阵中随机删除字符会导致该节点的重构不同。那说明该节点可信度不好。

之后选择刚分析得到的最好模型,进行树构建。

经过漫长的分析等待,我们会得到如下结果。

Original tree 显示的是从1-1000个原始树,我们需要的是bootstrap consensus tree, 如下图。


END

微科享,享科学

微科享是微生太旗下专注于学术知识免费分享平台,内容主要包括学术资讯、学术直播以及干货分享。

微科享仅用于学术成果分享与交流,不涉及商业利益。严禁他人将本公众号的内容用于商业运营。

(0)

相关推荐

  • 进化树构建的基本过程(下)

    昨天我们讲解了进化树构建的数据下载以及利用mega进行数据的比对:进化树构建的基本过程(上).今天我们就来讲解一下如何利用利用mega构建简单的进化树. PART3 最优模型选择 点击Data中的Ph ...

  • 进化树构建的基本过程(上)

    通过进化树,我们可以得到一些非常有价值的信息,比如说某几个物种在同一分支上,说明他们有着较近的亲缘关系,更有可能他们之间存在着祖先与进化的关系.比如最近来势汹汹的新冠肺炎,下图为从网上找的冠状病毒遗传 ...

  • 投资组合的构建和分析方法

    第1章 投资组合管理与分析方法之基础 1.1 资产类别和资产配置决策 1.2 投资组合管理过程 1.3 传统资产管理与量化资产管理 1.4 投资组合分析方法综述 1.5 本书的内容概要 总结 部分 风 ...

  • 技术贴 | R语言——肠型分析:介绍、方法

    导读 2011年,肠型(Enterotypes)的概念首次在<自然>杂志上由Arumugam等[1]提出,该研究发现可以将人类肠道微生物组分成稳定的3种类型,因为这3种类型不受年龄.性别. ...

  • 【研究方法】当政治遇上历史: 比较历史分析方法( CHA )介绍

    作品简介 [作者]黄杰(南京大学政府管理学院) [来源]<政治学研究>2020年第1期第112-123页 [排版]余姣 [内容摘要] 当代西方比较政治研究由于过分迷信大样本计量统计和形式模 ...

  • 卵巢性不孕的原因分析 卵巢性不孕的预防方法介绍

    卵巢性不孕,顾名思义就是和卵巢的健康有关系.因此,如果要预防卵巢性不孕就要在生活中做好卵巢的保养哦.今天,小编来教教大家如何预防卵巢性不孕的发生,以及为什么卵巢健康会影响到生育能力吧. 卵巢性不孕的原 ...

  • 【最全】水处理常见分析指标介绍,分析方法及注意事项!

    【最全】水处理常见分析指标介绍,分析方法及注意事项!

  • 介绍7种常见的思维分析方法

    SWOT分析法 它是用来确定企业自身的竞争优势.竞争劣势.机会和威胁,从而将公司的战略与公司内部资源.外部环境有机地结合起来的一种科学的分析方法.对于优势和弱势是内部环境的分析,机会和威胁是对于外部环 ...

  • 灰指甲用白醋还是陈醋泡脚 正确的泡脚方法介绍

    更新时间:2019-03-12 核心提示: 灰指甲是一种常见的疾病,会发生在任何人身上,治疗灰指甲有很多方法,民间也有很多很多偏方可以治疗这种疾病,用白醋泡脚就是常用的方法,只要坚持每天用白醋泡脚,一 ...

  • 男人滑精怎么办 滑精治疗方法介绍

    核心提示: 滑精属于遗精的一种,不过它比遗精严重,遗精不频繁的话属正常现象,但是滑精则属于一种病态症状,因此当男性出现滑精现象时,要引起重视,及时治疗,而治疗滑精的方法有很多,有滑精现象的男性朋友可以 ...

  • 八个常用的网络命令ping、Telnet等详细方法介绍

    一,ping 它是用来检查网络是否通畅或者网络连接速度的命令.它所利用的原理是这样的:网络上的机器都有唯一确定的IP地址,我们给目标IP地址发送一个数据包,对方就要返回一个同样大小的数据包,根据返回的 ...