Nature Methods:宏基因组物种组成分析工具MetaPhlAn2
宏基因组物种组成分析工具MetaPhlAn2
MetaPhlAn2 for enhanced metagenomic taxonomic profiling
Nature Methods [IF:30.822]
2015-09-26 Correspondence (通讯)
DOI: https://doi.org/10.1038/nmeth.3589
第一作者:Duy Tin Truong1
通讯作者:Nicola Segata1
作者单位:
1意大利特兰托大学,整合生物学中心(Centre for Integrative Biology, University of Trento, Trento, Italy)
导读
Nature子刊:宏基因组物种分类和定量工具MetaPhlAn2
MetaPhlAn2是分析微生物群落(细菌、古菌、真核生物和病毒)组成的工具,只需一条完命令即可获得物种丰度信息;
软件整理了超过17000个参考基因组,包括13500个细菌和古菌,3500个病毒和110种真核生物,汇编整理了100万+类群特异的标记基因;
可以实现精确的分类群分配、准确估计物种的相对丰度、种水平精度、株鉴定与追踪、超快的分析速度;
结果同时提供脚本可进一步统计和可视化。
MetaPhlAn2是基于标记基因的快速物种分类和定量工具,由哈佛大学Curtis Huttenhower团队和意大利特轮托大学Nicola Segata(出自Curtis Huttenhower组)团队共同出品,是MetaPhlAn工具的升级版,截止19年9月4日软件两版累计引用1335(853+482)次。是肠道宏基因组研究中物种组成分析的首选工具。
日报之前报导过的相关工具还有《MGX框架——宏基因组分析的新方法》(https://www.mr-gut.cn/papers/read/1075688938)、
想要专门分析病毒组,有《Nature子刊:分析病毒组的新工具》(https://www.mr-gut.cn/papers/read/1081676963)等。
主要结果
MetaPhlAn(metagenomic phylogenetic analysis,宏基因组系统发育分析)是一种表征全宏基因组鸟枪法(whole-metagenome shotgun ,WMS)样本分类谱的方法,该方法已成功用于大规模微生物群落研究。这项工作补充了原始的物种水平分析方法,其中包括真核和病毒定量系统,菌株水平鉴定和菌株追踪。这些和其他扩展使MetaPhlAn2计算包(http://segatalab.cibio.unitn.it/tools/metaphlan2/和 补充软件)成为挖掘WMS样本的有效工具。
我们的方法推断了进化枝特异性标记(lade-specific markers)的存在和读长覆盖率,以明确检测微生物组样本中存在的分类学进化枝并估计它们的相对丰度。基于过去2年中测序基因组数量增加约10倍,MetaPhlAn2包括来自 > 7,500种物种的约100万个标记物(每种细菌物种184±45)(补充表1-3)。亚种标记能够进行菌株水平分析,准标记(quasi-markers)可以提高准确度并允许检测病毒和真核微生物(补充说明1-3和补充图1中提供了完整的添加清单)。
我们使用24个合成宏基因组验证了MetaPhlAn2,其包含6.56亿个读长和1,295种物种(补充说明4和补充表4)。MetaPhlAn2比mOTU和Kraken(分别为0.80±0.21和0.75±0.22)更准确(平均相关性:0.95±0.05)(图1a,补充图2-9和补充表5-11),误报率较低 (平均10,与mOTU和Kraken分别为22和23)和假阴性(平均12,与其他两种方法的27相比),即使包括参考数据库中缺少的基因组(补充) 注4)。随着BowTie2快速映射器的采用和对并行性的支持,MetaPhlAn2的速度比MetaPhlAn快十倍,并且其速度可与其他测试方法相媲美(补充图10)。
图1:MetaPhlAn2可以准确地重建鸟枪法宏基因组的分类组成
Figure 1: MetaPhlAn2 can accurately reconstruct the taxonomic composition of shotgun metagenomes.
(a)在含有细菌,古细菌,真核和病毒生物(分别为50,25,25和25株)以及25株来自未知物种的复合物(4千万个101-nt长度的读长)的宏基因组上进行测试(即 在数据库中没有参考基因组的情况下,MetaPhlAn2比MetaPhlAn,mOTU和Kraken更准确(对于这三种方法,仅报告细菌和古菌生物的相关性,因为它们对病毒和真核生物分析的支持是有限的)。
(b)迄今为止从HMP和新测序的样品中可获得的所有皮肤鸟枪法宏基因组的MetaPhlAn2物种组成。
我们将MetaPhlAn2应用于我们从三个受试者测序的四个肘部皮肤样本(图1b,补充说明5和补充表12)。我们的数据显示痤疮丙酸杆菌和表皮葡萄球菌在这些位点占主导地位,与预期的属水平结果6一致,同时提供物种水平的分辨率。与这些核心物种一起,我们在93.65%的样本中发现了马拉色菌(Malassezia globosa),并通过覆盖分析证实了它(补充图11)。虽然马拉色菌是一种已知的皮肤定植者,但其宏基因组特征突出了MetaPhlAn2识别非原核物种的能力。还一致地检测到噬菌体(例如,用于丙酸杆菌)和多瘤病毒属的双链DNA病毒。我们随后对来自人类微生物组项目(HMP)的其他身体部位的982个样本进行了分析,包括在首次发表后测序的219个样本(补充说明6和补充图12)。
通过培养依赖性(culture-dependent)方法对样品进行了广泛的跟踪,MetaPhlAn2现在通过在菌株水平上对微生物组进行指纹识别,在不依赖培养的环境中提供这种可能性。这通过多时间点(n = 3)HMP数据集来说明,其中我们发现物种特异性菌株指纹是受试者特异性的并且是纵向保守的(补充注释7和补充图13-21)。这证实了肠道微生物组中强烈的受试者特异性菌株保守性和MetaPhlAn2进行菌株指纹和追踪的能力,因为这些保守模式不太可能偶然发生在纵向样品中。另外,当样品含有先前测序的基因组时,菌株鉴定是可能的(补充说明7,补充表13和补充图22)。MetaPhlAn2增强的分类学分析(包括相关的下游分析后,转换和可视化工具)及其对HMP数据集的表征应作为未来人体微生物组分析的便捷工具和扩展参考。
Reference
Duy Tin Truong, Eric A. Franzosa, Timothy L. Tickle, Matthias Scholz, George Weingart, Edoardo Pasolli, Adrian Tett, Curtis Huttenhower & Nicola Segata. MetaPhlAn2 for enhanced metagenomic taxonomic profiling. Nature Methods. 2015, 12: 902-903. doi:10.1038/nmeth.3589