科研 | Nature:人类血清代谢物潜在决定因素的参考图
编译:陈康,编辑:小菌菌、江舜尧。
原创微文,欢迎转发转载。
血清代谢组含有大量的生物标志物和导致各种疾病的物质,其中一部分是内生的,另外一部分从环境中吸收的。有些特定化合物的来源是已知的,包括高度可遗传的代谢物或受肠道微生物所影响的代谢物,或受生活方式的选择影响,比如吸烟或者饮食。但是,大多数代谢物水平的决定因素仍然知之甚少。在这篇文章中,我们从491个健康个体中测量了血清1251种代谢物的水平。我们基于宿主遗传学,微生物组,临床参数,饮食,生活方式和人体测量学等参数,使用机器学习算法来预测个体的代谢物水平,超过76%的代谢物可以得到具有统计意义的预测。饮食和微生物组具有最强的预测能力,饮食和微生物组各自解释了数百种代谢物水平,在某些情况下,甚至解释了超过50%的代谢物的变化。我们的结果与其他两个关于微生物组的人群队列研究具有很高的一致性,进一步说明微生物组很大程度上决定了大部分代谢物的水平。我们使用了特征归因分析揭示了特定的饮食和微生物相互作用。我们进一步证明其中一些相互作用可能是因果关系,因为在进行了面包干预临床试验之后,我们发现某些代谢物水平会与面包的摄入呈正相关,这与我们的预测一致。总体而言,我们的结果揭示了某些潜在的参数影响了超过800种代谢物的水平,使得我们对在不同条件下的代谢物变化和设计干预代谢物水平的实验有了进一步的了解和帮助。
我们使用质谱获得了491个健康个体的血清,临床参数,饮食情况,基因信息以及肠道微生物组,非靶向代谢组学检测到了1251中血清代谢物,包括脂类,氨基酸,外源性物质,碳水化合物,小肽,氨基酸,还有将近30%的未知物质,绝大多数的代谢物都是常见的,其中498个代谢物在所有的样品中都能检测到。1104个代谢物在超过50%的样品中都含有,为了确定我们质谱测定代谢物水平的准确性,我们使用其他的实验方法确定了肌酐和胆固醇的水平,他们的结果与质谱结果是一致的。针对20个个体,我们进行每隔一周采样,发现同一个样本在两个时间点上有关联的,但与不同个体没有相关性。这些结果说明了人类血清代谢组的稳定以及个人特异性。
论文ID
Search Results
Web results那不勒斯腓特烈二世大学
主要内容
我们使用了梯度增强决定树算法预测代谢物水平,76%的代谢物至少被一个参数组合预测,总的来说。335个代谢物能够被饮食相关的参数所解释,182个代谢物能够被肠道微生物组参数所解释(Fig1.a,b)。我们的模型还能够解释543个代谢物10%的方差,以及17个代谢物百分之50%的方差(Fig1.d)。下一步我们观察了每个参数组是否对某类代谢物有预测倾向(Fig1.c),我们发现了临床参数更能够准确预测血清中,脂类,氨基酸和小肽,但是不能很好的预测未知物质和外源性物质。而微生物组数据更能预测外源性物质(p<0.0001)和未知物质(p<0.001).我们还发现临床参数预测的代谢物与饮食相关参数预测的代谢物呈正相关(Spearman’sp = 0.30, P < 10−20),与微生物组参数所预测的代谢物呈负相关(R= 0.21, P < 10−11)。而微生物组参数所预测的代谢物与饮食参数所预测的代谢物呈强正相关(R = 0.44, P < 10−20).最后我们发现与基因有相关的代谢物不能够被其他的参数组所预测,全参数模型的预测结果也不能很好地预测与基因有相关的代谢物(R = 0.09, P < 0.005)。
为了检验每个参数组对所有代谢物的预测能力,我们建立了模型并发现了饮食相关的参数能够解释48%的方差,生活习惯等参数能够解释1.9%的变化(Fig.1e)。值得注意的是微生物组能够预测30.8%的方差。
2 其他两个独立人群实验的验证
为了检验我们微生物组预测代谢物水平模型的稳定性,我们用了两个队列研究的数据来验证:来自英国的1004个健康老人d的数据以及245个个体样本数据来自北欧糖尿病患者。对这两个试验中107个和50个血清代谢物,根据微生物组模型进行预测,107中的95个和50中的28个代谢物得到准确的预测(Fig.2)。我们还发现了大多数预测过程伴随着效应量的降低,这是所期望的。这些结果显示了我们模型是稳健的,尽管是在不同人群样本以及患病人群样本。在来自英国的人群研究中我们发现。体重与代谢物水平有很强的相关性(R = 0.85, P < 10−10;)
图2 基于另外两个独立人群实验对微生物组参数模型进行验证
3 饮食和微生物组模型是独立的
我们比较了两者模型对代谢物水平解释的方差。尽管一些与咖啡摄入相关的代谢物都能够被这两个模型解释,但是大部分都不能同时被这两个模型解释。将微生物组的数据加入到饮食参数模型中能够提高此模型对66%代谢物的预测能力,但是加入排列数据后(permuted data),此模型对82%的代谢物的预测能力降低了。最后我们发现34个代谢物能够被微生物组显著预测,所以可能预示肠道菌群能够独立于饮食对血清代谢物产生影响。下面我们使用参数贡献分析(SHAP值)去解释这些模型。我们发现许多与饮食和微生物相关的参数能够十分准确的预测代谢物(Fig.3a)。咖啡的摄入(不论短期和长期)能够准确的预测外源性物质和未知物质,包括黄嘌呤代谢通路上的代谢物,比如paraxanthine (Pearson R = 0.64, P < 10−20)和caffeine (R = 0.68, P < 10−20)。这些代谢物也可以被微生物组所预测,比如Clostridiaceae。长期对鱼制品的摄入能够准确预测一些血清脂类比如3-carboxy-4-methyl-5-propyl-2-furanpropionicacid (R = 0.71,P < 10−20), 这种脂是一种导致尿毒症的毒素,在尿毒症患者血清中有积累,但是也有预防和缓解肝硬化的作用。微生物组中Lachnospiraceae科也能够准确预测某些尿毒素比如phenylacetylglutamine(R= 0.63, P < 10−20)和indoxyl sulfate (R =0.37, P < 10−20),这两种物质与心血管疾病和慢性肾病有关。
为了评估某些重要的微生物类群对某些代谢物的预测作用,我们对每个代谢物设定了一个“预测微生物类群”。19个“预测微生物类群”可以很好的预测微生物参数模型所最有能力预测的前50个代谢物(prediction R > 0.4)。一个属于Clostridiceae的菌属可以很好的预测其中的22个代谢物,这些代谢物也可由咖啡摄入来预测。Clostridium sp. CAG:138可以预测5个代谢物,包括phenylacetylcarnitine (R = 0.47, P< 10−20)以及p-cresol-glucuronide (R = 0.64, P < 10−20)。对于其他微生物群类,可以预测一个或者两个代谢物,所以需要很多不同的菌,组合成预测模型来预测代谢物。微生物参数模型能够预测的前100个代谢物中的89个可以由Firmicutes门内的菌来准确预测。值得注意的是Bacteroidetes门是丰度第二的菌,但是没有来自Bacteroidetes门的菌能够预测这100个代谢物中的任意一个。
为了验证这些“预测微生物类群”是否足以准确的预测,我们比较了微生物的全参数模型和“预测微生物类群”所构建的模型(Fig.3b),来确定其预测准确性。我们发现主要“预测微生物类群”构建的模型只能解释微生物的全参数模型所解释方差的36%。比如Cinnamoylglycine,能够被微生物的全参数模型准确预测(R = 0.49, P < 10−20),但是它的“预测微生物类群”不能提供这样的一个结果。对比之下,一些代谢物能通过“预测微生物类群”来预测,例如未知物质X-16124能够被基于Eggerthellaceae species的模型来预测,能够解释微生物的全参数模型所解释方差的93%。
图3 饮食和微生物能够广泛解释血清代谢物的变化
4 基因与代谢组的关系
一些全基因组关联分析发现了人类基因与血清代谢物的关系。一般来说血清代谢物遗传可能性(ACE-heritability),基于双胞胎模型可能是25%,而基于所发现的同位基因只是2.1%。由于我们发现了一些在其他文献中没发现的代谢物,所以我们研究了这些代谢物和单核苷酸多态性之间的联系。发现了68个显著的关联(P < 5 × 10−11 forall),其中22个没有被报道过。包括支链脂肪酸ethylmalonate,此物质与神经性食欲缺乏有关,其50%的方差能够被rs2066938基因解释,这个基因是非转录区UNC119B的变异体。其他的例子比如,2′-O-methyluridine和2′-O-methylcytidine都是pyrimidine代谢有关的物质,都与PHYHD1基因的一个错义变体呈负相关。另外我们还发现未知物质X-21441(可能是雄激素类固醇)与ABCC2 基因的错义变体rs8187710有相关性,能够解释11%的方差。rs8187710还被证明与非酒精性脂肪肝有关,这种物质还与年龄呈负相关。X-21441可能是一个非酒精性脂肪肝的风险因素,以及对年龄预测的一个参数。
5 概念验证临床实验
作为验证分析,我们检验了参数与代谢物的因果关系,使用饮食参数模型选择预测最准确的,与食用白面包或者全麦面包有关的代谢物的前5%(Fig.4a,b),我们检测了起始和干预一周后的血清代谢组数据。两个随机分配的组,食用全麦面包或者白面包。我们发现与食用全麦面包正相关的代谢物显著上升了(倍数变化中位值1.62),负相关的代谢物减少了(倍数变化中位值0.66)。但在白面包的干预下,这些与食用全麦面包有关的代谢物没有发生改变(Fig.4c),一些食用全麦面包后上升的代谢物也与食用全麦面粉呈正相关,例如betaine,一种氨基酸能够缓解血管危险因素,这种物质在麦麸和酵母中大量存在。在食用全麦面包后,betaine升高了6.6倍,而食用白面包后变化了0.82倍(Fig. 4d),我们对白面包干预后的血清代谢物数据也进行了相似的研究,但是没有发现显著变化的代谢物,原因可能是,人们在正常的生活中会经常食用白面包,导致代谢物基线水平和干预后的代谢物水平一致。总的来说,一些相关性是具有因果关系的。
图4 某些代谢物的上升能够被面包干预所解释。
Search Results
Web results那不勒斯腓特烈二世大学
结论
尽管我们的血清样本数量不是最大的,但是它包括了丰度多样的参数,比如饮食,生活习惯等。这个研究还是有一些限制。比如第一,药物对血清代谢物有很大的影响,但是我们的研究对象都是健康人群,我们很想理解药物是怎么样对血清代谢物产生影响的。第二,对于结果的重复和验证,仅局限与微生物组的研究,应该需要对其他所用参数进行重复和验证。第三,由于缺少可靠的注释信息,我们没有将代谢物和与之相关的酶进行相关性分析。最后,由于这是一个观察实验,任何相互关联的解释都应很小心,这些相关性不能全部认为是因果关系。
总的来说,我们的结果解释了很广泛的,影响血清代谢物的因素。很多之前的研究也验证了我们的结果,很大一部分结果是最新报道的,提升了我们对健康和疾病的理解,对以后设计有关改变血清代谢物的实验有指导意义。
你可能还喜欢