科研 | mSystems:宏基因组荟萃分析揭示人类肠道菌群与健康和疾病相关的功能特征

编译:团子菌,编辑:小菌菌、江舜尧。

原创微文,欢迎转发转载。

导读

虽然已有研究表明人体健康受到肠道菌群的影响,但宿主-微生物潜在交互作用机制仍然不清楚。而将宏基因组运用于临床研究可以通过揭示可区分健康和疾病个体的特定微生物功能来解决上述问题。为了更好地理解肠道菌群与健康之间的关系,本研究首次对8项研究中约2000例粪便标本进行宏基因组功能分析,确定了肠道菌群功能特征,包括α多样性、β多样性和β分散性。通过构建回归模型,本研究发现了特定的肠道菌群功能,这些功能可以将患病个体与健康对照区分开。而且多种功能与多种疾病重叠,表明肠道菌群功能的普遍性;少数功能是某种疾病的特异性功能,可能为该疾病的特异性病因。本研究阐明了潜在的微生物致病机制,揭示了微生物组的特征,有助于基于肠道菌群的诊断学发展。

论文ID

原名:A Metagenomic Meta-analysis Reveals Functional Signatures of Health and Disease in the Human Gut Microbiome

译名:宏基因组荟萃分析揭示人类肠道菌群与健康和疾病相关的功能特征

期刊:mSystems

IF:6.519

发表时间:2019.5

通讯作者:ThomasJ. Sharpton

作者单位:俄勒冈州立大学微生物学系和统计学系

实验内容

本研究为第一个关于肠道菌群功能的多病种、多人群荟萃分析,纳入了所有公开可用的人体鸟枪测序宏基因组数据,涉及8项研究、7种疾病以及2,000余例粪便标本的宏基因组数据。本研究选择了每种疾病的病例组和对照组,运用回归模型来评估肠道菌群功能在每种疾病内和一般疾病间的变化趋势,并运用一个研究变量对跨越多项研究的数据进行建模,以控制潜在的、混杂的研究影响。该研究
(1)揭示了肠道菌群功能多样性可指示疾病,但通常效果较弱;
(2)发现了与多种疾病相关的肠道菌群功能以及可指示特定疾病的菌群功能;
(3)证明了根据肠道菌群功能多样性得出诊断时考虑研究参数的重要性;
(4)探索了肠道菌群功能成分预测疾病状态的能力。

结果

1 肠道菌群的功能多样性

在对数据进行预处理后,本研究整合了来自7种疾病、8项研究的1473名患者的公开肠道菌群宏基因组数据,以辨别肠道菌群功能多样性如何与疾病相关。并探索了肠道菌群蛋白多样性、组成和分散性与疾病的关系。通过对蛋白丰度分析发现被诊断为克罗恩病(P<0.001)、肥胖症(P<0.05)、2型糖尿病(P<0.05)或溃疡性结肠炎(P<0.01)的患者与各自对照人群相比,KEGG通路(KOs) 的数量减少(图1)。相反,与对照组相比,结直肠癌患者体内含有更丰富的蛋白家族(P<0.0 1)。肝硬化和类风湿性关节炎患者的蛋白丰度与各自的对照组相似。除2型糖尿病外,这些结果的稀疏性均较为稳健。

图1 不同疾病的蛋白质家族丰度

为了确定肠道菌群宏基因组的功能组成与疾病的关联,本研究根据KO丰度量化了所有样本间的Bray-Curtis差异。通过分析发现,在以下六种疾病的病例和对照人群中,肠道菌群的功能组成不同:结直肠癌、肝硬化、克罗恩病、溃疡性结肠炎、肥胖症和2型糖尿病(P<005;图2)。而且不同疾病的差异程度不同,克罗恩病具有相对较强的影响(R2=10.3%)而肥胖症影响较弱(R2=1.2%)。同时,类风湿性关节炎患者和对照组在功能组成上没有明显差异。

由于疾病状态只能部分解释菌群功能组成变化,因此对可用的协变量进行建模以发现导致功能组成变化的其他因素。这些研究中大多数研究对象共有的变量包括年龄、BMI、性别、国家和研究效应。既往研究发现任一上述共有变量都与肠道菌群的组成有关。本研究发现,除关节炎和肝硬化外,年龄的变异在0.4%到9.3%之间(P<0.05),而性别只对肝硬化(1.64%,P<0.001)和肥胖(0.63%,P<0.01)有显著的贡献。在考虑疾病状态的影响后,BMI仅与结直肠癌显著相关(2.57%,P<0.0.5)。

本研究纳入的肥胖症和2型糖尿病人群来自不同研究,这为探究研究间差异(例如,技术差异)如何影响与疾病功能联系提供机会。对于肥胖症和2型糖尿病,研究效应分别解释了18.1%和14.9%的β-多样性。然而,因为本研究纳入的多项研究均包含来自不同国家的研究对象,研究效应和国家相互混杂。虽然技术差异会影响肠道菌群组成,但有研究发现,这些因素(例如,文库大小、读取长度和质量控制参数)引起的差异与样本间生物差异相比相对较小,表明技术因素对结果造成的影响较小此外,相对于研究效应和地域分布,本研究发现DNA提取方案解释肠道菌群功能组成差异的能力较小。因此,观察到的研究间差异可能反映了菌群如何与疾病相关的地理结构。

β-分散性衡量的是微生物在一组个体中的变化情况,既往研究发现疾病状态下β-分散性存在升高趋势。本研究探究了肠道菌群功能的β-分散性是否在健康人群和患病人群之间有所不同。在诊断为结直肠癌、克罗恩病和肝硬化的个体中,β-分散性增加(P<0.05;图2)。与对照组相比,患有肥胖症的个体表现出更小的β-分散性。其他疾病未观察到统计学差异。同α-多样性和β-多样性一样,不同疾病的β-分散性不同,对某些疾病的影响相对较大。

图2 不同疾病的肠道菌群功能组成

肠道菌群可用于疾病诊断

本研究探究了肠道菌群功能与疾病的关联。为了降维,将KO转换为模块。通过构建复合泊松线性回归来模型探究疾病和健康状态与各KEGG模块平均基因组拷贝数之间的关系。该方法在既往研究中曾被应用,并且可以对连续型数据稳健建模。此外,该方法还可以纳入多个协变量解释研究效应的影响。在可能的情况下,将研究效应纳入到模型中并确定了与研究效应相关的疾病指标。利用这些模型,将疾病指示性模块定义为宏基因组中的平均基因组拷贝数与宿主的健康状态显著相关的模块。虽然可以在发现指示性模块的过程中模拟研究效果,但是由于研究规模不同,研究效应在不同研究中的影响程度不清楚。但是并非所有指标性模块在各人群中都是稳健的,要确定跨人群的稳健的疾病指标,需要来自相同疾病的大样本临床数据。

在发现的521个模块中,在患病个体中,有484个表示一种或多种疾病(FDR<0.2)。指示性模块的数量在不同疾病之间有较大差别。例如,指示肝硬化和克罗恩病的模块分别有333个和349个,而只有13个模块表示溃疡性结肠炎。这些结果在较低的FDR阈值和KO水平上是一致的。

绝大多数指示性模块同时对多种疾病具有指示性作用。具体地说,78%的指示性模块与两种或两种以上疾病相关,如果指示性模块随机分布在疾病之间,这一比例将高于预期(P<0.05)。每种疾病的特有的指示性模块相对较少。例如,肝硬化和克罗恩病分别只有7.5%和11.2%的指示性模块是特有的(图3)。这表明,不同的疾病可能具有相似的肠道菌群致病机制(例如,炎症),而模块在确定微生物组如何与不同的疾病关联方面发挥着重要作用或者存在着疾病和肠道菌群变化的共同因素(例如,生活方式)。

图3 各疾病肠道菌群指示性功能模块

本研究推断,指示多种疾病的模块的高频率表达可能反映了指示任何疾病的模块的存在。虽然在针对所纳入的七种疾病的分析中未发现可区分的病例和对照的模块,但有33个模块可表示至少四种但不超过五种疾病,每种疾病至少由这33种指示性模块中的六种表示。一些疾病可以由部分指示性模块表示,例如克罗恩病(97%)、肝硬化(88%)、2型糖尿病(73%)和肥胖症(79%)。相反,可以表示类风湿性关节炎(18%)、结直肠癌(33%)和溃疡性结肠炎(18%)的模块相对较少。也就是说,这些模块在公共指示性模块种占较大部分,例如46%的溃疡性结肠炎的指示性模块属于公共指示性模块。例如,与对照组相比,受肝硬化、克罗恩病、肥胖、2型糖尿病和溃疡性结肠炎影响的个体中,与多种疾病相关的寡糖转移酶(M00072)的N-糖基化作用逐渐减弱。相反,表示钴/镍运输系统的模块(M00245和M00246)在结直肠癌和克罗恩病患者中减少,但在肝硬化和2型糖尿病患者中增多。其他常见指示性模块包括与脂多糖生物合成和输出(M00060、M00320和M00080)、铁/锌/锰/铜运输系统(M00318)和醋酸盐生产(M00422、M00377、M00618和M00579)相关的模块。这些结果表明,虽然没有微生物组模块普遍表示健康,但有一些模块可以指示疾病。

可指示某种疾病的特异性模块相对较少但为研究疾病病因提供新思路并促进了诊断学的发展。不同疾病的特异性模块占该疾病全部指示性模块的比例不同。例如,类风湿性关节炎的特异性指示性模块有20%,7%的2型糖尿病只有7%。该结果为发现基于微生物组的临床诊断提供重要线索。在类风湿性关节炎患者中,特异性模块包括与产生甲烷相关的模块(M00617表达)水平升高和与结核分枝杆菌毒力相关的DEVS-DevR调节系统(M00482)。结直肠癌患者的肠道菌群的中,萘降解模块的丰度增加(M00534)。肝硬化患者肠道菌群中增加的模块包括硝化作用(M00528)和葡萄球菌毒力调节(M00468)。相反,甲苯降解模块(M00418)减少。克罗恩病患者的肠道菌群中增加的模块包括糖胺聚糖的降解(M00076、M00077、M00078和M00079)和B-维生素生物合成(M00122、M00123和M00573);而与产甲烷(M00576)、抗菌肽反应(M00470)和磷脂酰乙醇胺生物合成(M00092)相关的模块丰度降低。肥胖症患者的肠道菌群中的特异性模块包括肠出血性大肠杆菌(EHEC)致病性特征(M00363)。2型糖尿病患者的肠道菌群中固氮(M00175)、谷氨酸运输(M00233)和辣椒素生物合成(M00350)模块丰度增加;而代表O-多糖生物合成的模块丰度降低(M00056)。溃疡性结肠炎的受试者没有任何特异性指示性模块。

本研究发现的一些功能指标可能与疾病没有直接联系,但与该疾病相关的功能有基因上的联系。为了确定哪些分类群与本研究观察到的指示性功能模块的丰度差异,通过MetaPhlAn2对每个宏基因组进行分析,并将每个功能模块(n=484)的相对丰度与观察到的分类群关联。这项分析揭示了至少一种疾病的422个指示性模块的属-模块间的显著相关性(FDR<0.05,Spearman’s|>0.4;图2),而484个指示性模块中有62个没有引起显著的属关联性。共观察到93个菌属,相对于分类单元-模块频率的四分位数范围,其中Subdoliganulum、类杆菌属(Bacteroides)、普氏杆菌属(Prevoella)、大肠杆菌属(Escherichia)、甲烷短杆菌属(Methanobrebacter)、布鲁氏菌属(Blautia)和梭状芽孢杆菌属(Clostridies)中的一个未知属表现出高关联程度。可能的解释是,上述菌属的基因组中携带大量指示性模块或者它们本身与编码指示性模块的分类群相关。密切相关的菌群可能包含不同的功能谱系,这表明了同时从分类学和功能角度考虑微生物组成的重要性。

3 肠道菌群功能组成可用于疾病状态识别

本研究纳入的每种疾病均各有一套指示性模块对病例和对照进行分层,引出肠道菌群的功能组成是否可以用来分类疾病状态这一疑问。为了回答这个问题,本研究采用随机森林的方法,根据各模块丰度来诊断每种疾病的患者的疾病状态。研究结果发现,不同疾病的识别敏感性和特异性不同(图4),其中一些疾病的病例和对照可以准确识别(例如克罗恩病,AUC=0.9539;肝硬化,AUC=0.9023),而其他疾病的识别准确度较低(例如,类风湿性关节炎,AUC=0.6641;结直肠癌,AUC=0.5955)。本研究中结直肠癌的曲线下面积较小,与既往相似研究的分类结果不一致。出现不一致结果的原因可能是病例组和对照组选择的不同,以前的研究排除了癌前病变患者,而本研究将癌前病变作为病例包含在内。类似于既往研究(AUC=0.72;图4),本研究排除晚期腺瘤患者部分提高了识别准确性。因此,肠道菌群的功能组成在疾病诊断中的应用潜力受疾病类型和严重程度而异。

图4 肠道菌群功能组成识别疾病状态

如上所述,大多数模块可以对至少一种疾病的病例和对照进行识别(484/521),且对不止一种疾病具有指示性意义。而由于指示性模块的双重作用,本研究推测可以利用模块丰度将受试者分为患病组和非患病组,且不受疾病类型的影响。其中,模块丰度对疾病或非疾病状态的预测能力中等(AUC=0.6738, OOB=39.04%)。这表明,不同疾病间可能没有足够的相似性将病例组与对照组区分开。

讨论

本研究揭示了与人类健康和疾病相关的肠道宏基因组的功能属性。与病例组肠道菌群相比,健康个体的肠道菌群倾向于编码高丰度蛋白质家族,显著不同的功能组成并增加对该组成变异的限制。然而,效应大小往往很弱且并不是所有的疾病都表现出该趋势。此外,本研究确定了与疾病广泛相关的特定功能模块,解析有助于阐明疾病病因和评估可识别疾病和健康状况的特异性标志物。在健康个体中富集而在患病个体中被破坏的菌群功能可能会部分解释肠道菌群如何影响宿主健康。

疾病往往与微生物编码的不同蛋白质家族的数量减少有关。然而,这一趋势并不普遍,一些疾病(如肝硬化和类风湿性关节炎)的丰度在病例组和对照组间没有显著性差异,而另一些疾病(如结直肠癌)在病例组中丰度增加。一些研究已经将功能丰度降低与疾病联系起来。虽然这适用于几种疾病(即克罗恩病、肥胖症、2型糖尿病和溃疡性结肠炎),但在病例组中,这并不是微生物的普遍特征。

整合宏基因组数据使得探究各疾病中肠道菌群的功能组成差异成为可能。虽然微生物功能组成与宿主健康状态有关,但这种关联在不同疾病中不同且通常相对较小。这表明,这些疾病并不是由肠道菌群功能重组导致。相反,如果肠道菌群对疾病的发生有影响,它往往会通过改变特定蛋白家族的丰度来实现,且不同患病个体中改变的蛋白家族可能不同。因此,健康不是微生物功能的简单总和。

肠道菌群复杂多样,其中即使在健康人群中也能观察到功能组成变化。这可能归因于人群特有的因素(例如,地理位置)或调查步骤(例如,样品处理方式)。因此,这些所谓的研究效应可能会潜在地混淆所发现地强有力的指示性特征,特别是来源于单一人群或调查时。到目前为止,只有结直肠癌、肥胖症和2型糖尿病运用鸟枪宏基因组数据进行研究,数据来自多个人群和研究。综合分析发现,肥胖症和2型糖尿病病例组和对照组间的功能成分差异中,研究效应分别约占18.14%和14.92%,而疾病状态分别只占1.2%和1.7%。这一发现与既往肠道菌群构成的研究一致。

“研究效应”通常用来描述任何未知的方差来源。对纳入数据的技术手段和个体重复性进行比较,发现这些重复之间的差异小于无关样本之间的差异,这表明某些研究效应(即批次效应)不太可能是样本之间的差异来源。功能组成的差异归因于与地域相关的因素更为合理,如饮食和文化习惯。然而,目前没有适当的资源回答这个问题。未来的研究应该致力于来自不同国家、多样化人群的宏基因组数据。尽管研究效应的影响较大,但疾病状况仍然是解释样本间差异的重要因素。

对肠道菌群功能进行β-分散性分析发现,相对于对照组的肠道菌群,大多数疾病都增加了病例组的肠道菌群的样本间变异。这种与疾病相关的微生物分散程度增加的模式被称为安娜·卡列尼娜原则(AKP),在既往多项研究中存在。AKP假设某些因素会对微生物组成产生随机影响,从而使应激组相对于对照组产生更大的变异。β-分散性分析表明,AKP也适用于探究肠道菌群功能的研究。在疾病患者的肠道菌群研究中观察到分散度增加,这不太可能是跨群落的冗余功能成分的结果。因为如果是这样的话,更期望分散度不增加即并不排除不同分类群编码一小部分与疾病状态相关的冗余蛋白质的可能性。例如,变形菌门中的几个菌属(如大肠杆菌、泛菌和南虫科)似乎对脂多糖(LPS)的合成和运输相关。此外,本研究发现在健康个体中,肠道菌群的功能可能更受限,因为健康个体往往具有较低分散度。

稳健和综合的建模方法通过识别影响宿主健康的常见功能揭示了肠道菌群功能和健康之间的关联。有趣的是,相较于对照组,大多数模板(即与四种或四种以上疾病相关的模板)在病例组的菌群中大量增加,这表明这些共同的疾病关联可能与某些微生物功能的提高相关。例如,结直肠癌、肝硬化、克罗恩病和肥胖症患者的脂多糖(LPS)合成模块的丰度增加(M00060)。LPS是一种促炎分子;LPS的生物合成增加可导致在这些疾病的受试者中观察到肠道炎症。此外,一些常见模板可以阐明不同疾病的肠道菌群的同一特征。例如,几个铁转运模块(M00318、M00190、M00240、M00243、M00317和M00319)在克罗恩病、肝硬化、肥胖症和2型糖尿病受试者中增加。铁对人类和微生物都是一个重要的辅助因子,并且经常是宿主和病原体之间冲突的主题。另一个常见的模板是醋酸盐合成模块(M00377和M00618),在类风湿性关节炎、克罗恩病、肥胖症和2型糖尿病的受试者的肠道菌群中增加。短链脂肪酸(SCFA),特别是醋酸和丁酸,是肠道菌群和宿主间的信号分子,并可能在宿主新陈代谢中发挥作用。与丁酸盐对肠道菌群中起保护作用不同,醋酸盐被认为与宿主副交感神经系统相互作用,调节胰岛素的分泌并可能促进肥胖。同时本研究发现醋酸合成模块在疾病中持续升高,这支持了前期相关研究结论。

整合来自不同疾病的数据可以区分疾病特异性和共性指标,这可以解释特定疾病的病因并提高诊断水平。例如,与对照组相比,类风湿性关节炎患者携带的甲烷产生模块(M00618)的含量增加。据报道,多发性硬化症(一种影响中枢神经系统的自身免疫性疾病)患者中可产生甲烷的微生物数量增加。这些发现表明,肠道菌群产生的甲烷可能与自身免疫状况有关。此外,用于降解糖胺-多糖(GAG)的模块(M00076、M00077、M00078和M00079)在克罗恩病患者中是唯一升高的。克罗恩病患者中GAG降解增加以前已有报道,且可能与肠道菌群相关。

观察到的指示性功能模块也阐明了微生物在各疾病中的潜在作用。通过关注微生物能够做什么以及这种功能如何与健康和疾病关联,而不是存在哪些微生物,可以提出关于肠道菌群可介导健康和疾病的假说。例如,本研究揭示了肠道菌群功能组成与肥胖症之间的密切联系,用于生产醋酸的模块(M00377、M00579和M00618)。有研究通过与宿主副交感神经系统的相互作用来促进胰岛素的分泌,将肠道菌群产生的醋酸与代谢综合征联系起来。最近已有研究证明了微生物在代谢性疾病中的作用,但肠道菌群的组成与肥胖之间的联系不一致或较弱。值得注意的是,肠道菌群的整体功能多样性同样显示出与肥胖的微弱关联,但上述蛋白质家族有力地指示了肥胖症。因此,指示性功能模块可能成为研究肠道菌群如何导致肥胖和代谢综合征的重要线索。

随机森林分析表明,微生物功能组成可用于识别疾病状态和疾病诊断。然而,由于对某些疾病或对健康与疾病进行分类时存在较大误差,这种诊断可能只适用于具有指示性微生物功能特征的疾病(即克罗恩病或肝硬化)。例如结直肠癌,疾病的严重程度也可能适用于诊断。

总而言之,本研究部分解释了肠道菌群功能如何影响疾病和健康。通过整合多项数据数据,本研就发现肠道菌群在疾病群体中变化的广泛模式,这些模式阐明了肠道菌群如何影响疾病和健康。例如,疾病状态下通常改变代谢模块反映了肠道菌群与生理相互作用以促进健康的机制。未来的研究应该关注于这些编码肠道菌群功能的基因是否主动表达,是否对维持健康有重要意义。此外,疾病与肠道菌群功能的个体化改变有关。这一结果表明,基于肠道菌群的治疗方式需要考虑患者个性化特征以确保疗效。本研究还发现了特异性指标,这些指标不仅可以作为诊断线索,还可以阐明潜在的菌群介导的疾病病因。未来的研究应该同样寻求探究这些菌群功能对健康的影响。收集多人群、多疾病状态的宏基因组数据对于进一步理解肠道菌群功能与疾病关系至关重要,改进现有分析方法以确保研究结果稳健,不受技术因素(例如,序列数据的组成性质)的影响。此外,扩展微生物功能特征研究,提高菌群功能识别敏感性和特异性。最终,通过纳入更全面数据、采用标准化分析方法和扩大研究对象群体来深入理解肠道菌群在维持健康状态中的作用。

评论

肠道菌群的组成与多种人类疾病有关,但致病机制还不是很清楚。为了更好地理解肠道菌群的致病机制,本研究纳入近2000份来自8个临床研究的人类粪便菌群宏基因组数据,发现α多样性、β多样性和β分散性与类风湿关节炎、结直肠癌、肝硬化、克罗恩病、溃疡性肠病、二型糖尿病、肥胖有关。利用回归模型,本研究发现:

1.特定微生物功能可准确区分疾病患者和健康人群;

2.许多微生物功能基因可同时指示多种疾病,相关微生物类群对宿主健康具有一致的作用;

3.存在疾病特异性的微生物功能基因,可以指示特定疾病;

4.共生菌群特征或有助于进行基于菌群的疾病诊断。

整体来看,该研究促进了对影响人体疾病和健康状态的肠道菌群功能的理解,并确定了基于肠道菌群进行疾病诊断的巨大前景,但仍然需要进一步研究。



你可能还喜欢

  1. 2019年度回顾 | 微生态环境微生物类微文大合辑

  2. 2019年度回顾 | 微生态人体/动物微生物类微文大合辑

  3. 2019年度回顾 | 技术贴合辑大放送



这些或许也适合你哦👇

  1. 最低250元!微生太扩增子(16S/18S/ITS)测序+分析服务!

  2. 如何让您的科研经费增值10%?特别是用不完快被政府收回的经费


(0)

相关推荐