科研 | Front. Microbiol.:基于宏基因组溯源耐药性-识别抗性基因组特征
编译:小白同学,编辑:小菌菌、江舜尧。
原创微文,欢迎转发转载。
宏基因组学可以揭示食品、肠道等不同环境中微生物组的遗传信息,可用于分析食源性有害物质的传播,如抗生素耐药性(AMR)等。本研究中认为粪便中抗生素抗性基因的相对丰度可能与特定的宿主有关,并且可用于分析耐药性来源。对收集于欧洲各地的猪、肉鸡、火鸡、牛以及长期接触牲畜的工人的粪便样本进行基因测序、用随机森林方法对抗性基因进行分类后发现,各个国家间抗生素抗性基因分布有所不同,且评估了这对人群的影响。通过对AMR进行相似性分析发现,随着宿主异质性的增大,将耐药性正确分类到特定宿主需要更多抗性基因的信息,且不同国家间抗性基因组特征对分类预测的影响也有差异。与饲养肉鸡的工人相比,饲养猪的工人更易暴露于AMR。此外,养猪场的AMR暴露量高于宰猪场。相比于肉鸡和火鸡,人类粪便中的抗性组与猪和牛更为相似,这些差异主要受少量抗性基因的影响。本文鉴定了每个动物宿主的耐药性特征,其中包括与养殖场所使用抗生素相关的抗性基因。通过将人类粪便中的耐药基因追溯回不同动物宿主,发现猪是人类AMR的潜在来源,也进一步表明宏基因组学能够应用于AMR溯源。
论文ID
期刊:Frontiers in Microbiology
通讯作者单位:丹麦科技大学
实验设计
在9个欧洲国家(A-I)的生猪和肉鸡各养殖场分别收集25份新鲜粪便样本进行混合,在其中的3个国家对火鸡和肉牛养殖场进行了采样(图1),并采集了饲养员的粪便样本:肉鸡饲养员(n = 24)、养猪场工人(n = 54)和宰猪场工人(n = 70)。提取粪便样本DNA后用鸟枪法进行双端测序,经过质控的序列与ResFinder数据库进行比对,得到样本中抗性组的信息(389个抗性基因)。用随进森林(RF)方法对抗性基因组进行分类,并用分层随机森林将每一个观测就宿主和国家进行分类,训练内部节点分类器。在R语言中进行数据分析:用HieRanFor包进行分层随机森林的分析,用caret v.6.0–84做随机森林,共构建了五个随机森林模型。其中70%的数据用作训练集,30%的数据作为测试集。通过移除单个基因看模型准确性降低了多少来评估每个抗性基因对于分类的重要性。利用相似性分析来辨别对宿主溯源具有指示作用的抗性基因,明确各基因对于宿主间差异的平均贡献度。基于欧氏距离对抗性基因进行聚类,得到了主要特征基因的相对丰度,并分析了造成人与所接触的动物宿主之间抗性组差异的主要抗性基因。
图1 分层随机森林模型(HRF1 HRF2)中的父节点(国家A-I)和子节点(国家内的动物宿主:Bro =肉鸡,Pig =猪,Vea =小牛肉犊牛,Tur =火鸡)。
结果
用分层随机森林模型(HRF)确定了能够将抗性组精准分类到宿主(而不受采样地点影响)的抗性基因子集,发现若宿主样本间异质性越大,则抗性组就国家进行分类所需的抗性基因数目就越多。来自HRF1(共用389个抗性基因)用于构建HRF2的抗性基因子集(119个抗性基因)有较多与国家无关的抗性特征。与HRF1(平均精度0.833)相比,HRF2模型的整体精度较低(平均精度0.826),但在国家内部宿主分类方面,HRF2与HRF1中的OOB误差相似,在大多数国家都是如此(图2A)。在HRF2中,G和H国家的OOB误差较高,而A、B和E国家的OOB误差较低。国家A、C、F、G、I的肉鸡样本和国家A、D、E、F、G、H、I的猪样本分类准确率有所提高(图2B)。总的来说,HRF2与HRF1性能相似,但HRF2有利于实现在国家间的分类比较。
图2 分层随机森林模型HRF1和HRF2的性能,(A)父节点(各个国家)的OOB误差,(B)子节点(动物宿主)的准确度。
用模型RF1、RF2和RF3追溯人类抗性基因的来源宿主,RF1专门针对这四种动物抗性基因数据进行训练,RF2的训练数据包括人类和动物抗性组(图3)。RF1和RF2都是根据先前在HRF2中使用的(一组独立于国家的)AMR子集进行训练的,准确度相似,包括了来自所有国家的数据。RF1表明人样本中抗性基因源自于猪的得分较高,与其它三种动物相比,人类和猪具有更为相似的抗性组。RF2进一步表明,一旦模型包含了人类样本,抗性则主要归因于人,其次是猪。RF3为F国模型,所用数据为F国人和动物的样本,比RF2准确性更高。图4比较了三组人中RF2和RF3得分分布情况:肉鸡养殖场的工人中,RF3比RF2所得人的得分比例增加而猪的比例减少。因此与接触肉鸡的人相比,接触猪的人抗性组中会有更高比例源于猪,RF2和RF3都显示了养猪场工人比宰猪场工人有更高比例的抗性组源于猪。
图3 用随机森林模型分析了人粪便样本中抗性组的来源,横轴表示149个人粪便样本,纵轴为其抗性组来源占比,“人类”分类代表除4种家畜外的其他来源。
图4 模型RF2和RF3将人粪便样本中抗性基因溯源到各个宿主的得分占比情况,“人类”分类代表除4种家畜外的其他来源。
四种食用动物中,肉鸡-牛和肉鸡-猪之间的耐药性差异最大(分别为72.4%和72.2%),猪和牛的抗性成分相近(38.9%)。肉鸡和火鸡与人类抗性组之间差异最大(分别为86.7和83.8%),牛和猪与人差异分别为61.6和61.8%。通过一对一宿主比较在主要耐药性中识别出19个独特的高丰度抗性基因(图5),其中一些基因并不仅仅属于单一宿主。aph(3’)-II、aph(3’)-IIIa和sul2为牛的特征抗性基因,tet(A)、tet(L)和tet(S/M)为火鸡的特征抗性基因,ant(6)-Ia、lnu(A)、cfxA6分别为猪、肉鸡和人的特征抗性基因。此外,erm(F)、mef(A)、tet(40)和tet(Q)主要在牛中,其次在猪中被鉴定为特征抗性基因,而blatt -126和erm(B)主要在肉鸡或火鸡中被鉴定为特征抗性基因。考虑19个主要抗性基因,图6显示了各类AMR(四环素、大环内酯、β-内酰胺、氨基糖苷类和磺胺类)对成对宿主间差异的贡献。
图5 造成成对宿主间差异的19个主要抗性基因,点的颜色代表两两比较中具有较高相对丰度的样本。
图6 各类AMR(四环素、大环内酯、β-内酰胺、氨基糖苷类和磺胺类)对成对宿主间差异的贡献率。
人与动物间差异分析显示,猪和养猪人间抗性组差异比猪和非养猪人之间差异低8%到12%。相反,肉鸡和养鸡人的抗药性差异(87%)与肉鸡和非养鸡人抗药性差异之间几乎没有差别。通过与三组工人样本间的成对比较,识别出16个特征抗性基因(图7)。ant(6)-Ia、mef(A)和tet(40)被鉴定为猪的特征抗性基因,blaTEM-126、lnu(A)和erm(B)被鉴定为肉鸡的特征抗性基因,cfxA2、cfxA6和tet(Q)被鉴定为人的特征抗性基因。动物抗性组中的lnu(C)、tet(O/W)和tet(W/32/O)总是多于人的抗性组,图8显示了基于这16个抗性基因相对丰度对样本的层次聚类。总的来说,人、猪和肉鸡的抗性组有明显的区别,三种工人聚类在一起,与猪的抗性组较为接近。有个别的人粪便样本与“猪群”重叠,这种样本多来自养猪场工人。为了评估单个抗性基因丰度对差异贡献的重要性,需要进行多元回归分析,还可以通过判别分析进一步明确宿主特征的显著性。
图7 造成工人和其饲养的猪、肉鸡的抗性组之间主要差异的抗性基因,点的颜色代表两两比较中具有较高相对丰度的样本。
图8 基于主要差异基因相对丰度的热图,聚类关系可以表示三组工人与猪和肉鸡的抗性组之间的差异。
讨论
结论
本研究利用宏基因组学数据将人类粪便中抗生素抗性溯源到不同的牲畜宿主:用随机森林算法来识别具有国家或宿主特异性的特征抗性基因,可以有针对性地来进行溯源研究。需要根据具体情况来对特定国家的模型进行评估,因为各国宿主动物的抗性组之间可能存在较大的异质性。在其中一个国家的模型中,发现养猪人粪便中的抗性基因主要与猪的抗性组具有关联性。对此发现的具体解释还需仔细斟酌,因为肠道中的抗性组也可能会受到肠道微生物组成的影响,且本研究的这几种动物宿主中,猪的肠道微生物组可能与人类最为接近。人类和动物宿主微生物组的相似性、不同宿主的微生物组和耐药性之间的关系还有待进一步研究。此外,本研究的一些局限性也有待完善:需要扩大人群的采样范围而非仅局限在一个国家,需要增加不接触牲畜的对照被试,需要收集各个国家的多种家畜粪便样本进行分析,还需要平衡各组采样量。尽管尚有不足之处,本研究为宏基因组在耐药性溯源方面的应用奠定了基础,从而为耐药性传播的评估提供了一种基于抗性组的有效方法。
你可能还喜欢