综述| NAT REV MOL CELL BIO: 基于代谢组学鉴定生物活性代谢物

编译:小枳,编辑:谢衣、江舜尧。

原创微文,欢迎转发转载。

导读

代谢物组(metabolome)是器官或细胞内小分子代谢产物的集合,被鉴定并作为可诊断和预测疾病的生物标志物。然而,代谢组学的价值已从一个简单的生物标志物鉴定工具被重新定义为一种发现生命活动过程的活性驱动因子的技术。本文主要综述活性代谢物如何通过调节其他组学水平(包括基因组、表观基因组、转录组及蛋白组)来影响细胞的生理功能。进一步揭示生物活性代谢物鉴别在生理及病理研究中的重要作用,从而提出活性代谢组学(activity metabolomics)这一概念。

论文ID

原名:Identification of bioactive metabolites using activity metabolomics
译名:基于活性代谢组学鉴定生物活性代谢物
期刊:Nature Reviews Molecular Cell Biology
IF:43.351
发表时间:2019.6
通讯作者:Martin Giera & Gary Siuzdak
通讯作者单位:莱顿大学医学中心,蛋白质组学和代谢组学中心&美国加利福尼亚州拉荷亚,代谢组学与质谱研究中心

内容

在上个世纪中叶,Fritz Kahn,一位德国医生,曾因出版“人体工厂”系列书籍为人们熟知。对先进技术及生理学的热衷,使得他将人体比作20世纪的工业机器,并呈现在有趣生动的插图中。七十年后,科学技术的巨大进步推动我们进入了多组学时代,这些进步使细胞“工厂”的系统化定量表征成为可能(基因组,转录组,蛋白质组和代谢组)。代谢组学以代谢物为标志,是组学领域相对较新的组成部分。这些小分子化学实体(代谢物组)超越了基因组和蛋白质组,代表了新陈代谢动态系统中最下游的阶段。更直观来讲,新陈代谢动态系统可被比作一个由具有活性的基因和蛋白质交织的具有代谢齿轮的机器。这些齿轮看似简单地执行某些操作,却是整个大型系统中不可或缺的一部分。这些通过生化组织不同“组学”水平的信息流是分子生物学的核心内容。在基因-蛋白-代谢物-表型框架内,代谢组学能够在分子水平上对表型进行动态地敏感地测定,已被广泛地接受。同时代谢组学也成为生理病理过程相关生物标志物及其作用机制探索研究的最前言。
然而,人们主要将代谢物视为下游产物,作为基因及蛋白的活性标记物,代谢物其实具有更深远的调控活性。事实上,如图1所示,代谢物能够与所有其他组学水平的活性分子相互作用并能够对其进行调节。通过这种相互作用,代谢物还可作为调节剂对机体生理过程及表型进行直接调节。在过去数十年内对代谢物的调控功能进行大量研究,特别是有葡萄糖、脂肪酸及其他脂质可作为胰岛素分泌和敏感性的调节器,细菌中存在lac操纵子,及mTOR激酶可作为营养和能量传感器等开创性的发现。这些发现已经表明代谢物对生命系统的重要作用。
图1 代谢物–基因和蛋白质活性的调节因子
然而,随着代谢组学技术的发展,更多的具有生理活性的代谢物逐渐被发现,如NAD+能够增加去乙酰化酶活性,用以抑制机体年龄相关的变化;乳酸能够调节神经元的兴奋性和可塑性;α-酮戊二酸可调节巨噬细胞活化和免疫功能;丙二酰辅酶A(CoA)可控制成人神经再生;氮代谢物平衡可增强百日咳毒素的产生;牛磺酸能诱导髓鞘碱性蛋白的表达。癌细胞代谢的其他研究揭示了“肿瘤代谢物”(oncometabolites)的多种且重要的作用,其中包括富马酸酯,2-羟基戊二酸酯和琥珀酸酯等。这些研究强调代谢物内在的生物活性,同时也提出代谢组学这一概念,即鉴别具有生物过程驱动作用的代谢物并深入了解这些代谢物生理功能的有效工具。
在此,我们对本领域的研究进展进行综述,并对将代谢组学与正交试验和计算生物学方法相结合,这种代谢物的发现方法进行概述。这篇综述将阐述诸如大分子-代谢物调节及相互作用等表型调节过程及实例。我们将总结近期用以表征各生物系统中活性代谢组的新概念及工作流程。我们还将回顾结合代谢组学与认知和云计算的最新技术进展,并进一步启用活性代谢组学策略。
1. 代谢物调节表型的机制
1.1. 活性代谢物的原型:致癌代谢物
生物活性代谢物是如何驱动表型发生改变的?致癌代谢物是最好的示例之一,因为它们较早被发现并在癌细胞中建立表型调节机制。这些代谢产物在不同类型的癌细胞中的积累是癌症恶性转化的诱因。在癌症患者肿瘤中发现致癌代谢物(包括D/L-2-羟基戊二酸、琥珀酸及富马酸)相对应的代谢酶发生了突变,如异柠檬酸脱氢酶(IDH)发生功能获得性突变,而富马酸酶(FH)和琥珀酸脱氢酶(SDH)发生功能丧失性突变。由这些突变引起的肿瘤细胞中致癌代谢物的积累最终导致癌细胞可增殖表型。
这些致癌代谢物不仅是疾病的生物标志物,还能依赖于对应的酶的活性,通过修饰及与DNA和蛋白质相互作用,从而对机体蛋白质组和表观基因组进行调节。具体来说,这些致癌代谢物的生物活性源于其对α-酮戊二酸依赖的双加氧酶的抑制作用,其是一类包括脯氨酰羟化酶的酶,是缺氧诱导因子(HIF)关键的调控因子。致癌代谢物通过抑制脯氨酰羟化酶,造成正常氧含量下HIF增加,导致表型镜像缺氧,称为“假性缺氧”。另外,致癌代谢物抑制α-酮戊二酸依赖的TET酶和赖氨酸去甲基化酶。这两种酶均能从染色质中除去甲基,5-甲基胞嘧啶在CpG二核苷酸中被TET羟基化,组蛋白被赖氨酸脱甲基酶去甲基化,导致组蛋白和DNA在富含这些代谢物的癌细胞中被高度甲基化,阐释了致癌代谢物与表观基因组间的联系。
除了抑制酶活性,致癌代谢物还有其他不同的生理活性。例如富马酸能够与半胱氨酸残基的巯基发生反应,该反应通过酰化(琥珀酸化)残基改变KEAP1的活性,进而激活转录因子NRF2,导致肾癌囊肿增大。富马酸盐还能介导参与氧化还原代谢反应的其他蛋白的琥珀酸化,其是癌细胞中的关键反应。富马酸也被认为可以修饰其他代谢物,如谷胱甘肽,从而增加氧化应激并加速衰老。最近研究发现D-2-羟基戊二酸可抑制两种α-酮戊二酸依赖型酶(BCAT1和BCAT2)的活性。值得注意的是,许多其他代谢物也被归类为致癌代谢产物,包括甘氨酸、葡萄糖和乳酸。这些代谢产物大多与有氧糖酵解、谷氨酰胺分解或一碳代谢有关。尽管对致癌代谢物的生物学作用的全面性研究尚未完成,但目前已证明它们可通过调节蛋白质间相互作用,影响酶的活性,导致蛋白质翻译后修饰的改变和表观基因组的变化,从而导致癌症的恶化。
因此,致癌代谢物是活性代谢物最基本的例子,这些例子从很大程度上让我们意识到活性代谢物与其他组学的相互作用。近期机制研究表明活性代谢物从基因组、表观基因组及转录组到蛋白质组不同层面对其他组学都有较大程度的影响。代谢物组主要通过两个机制来调节DNA、RNA和蛋白质的功能:化学修饰和代谢物-大分子相互作用。我们将在以下两部分对这两个机制进行详细介绍。

1.2. 代谢物对大分子的化学修饰
代谢物可驱动DNA和RNA(如甲基化)以及蛋白质(翻译后修饰)的一些重要的共价键合的化学修饰过程。这些化学修饰的动态特征已被证实对细胞功能具有巨大的影响。蛋白质翻译后修饰过程包含至少几十种不同的小分子,这些小分子能够与不同的氨基酸共价结合,如赖氨酸乙酰化(衍生于乙酰CoA)或半胱氨酸棕榈酰化(衍生自CoA)。值得注意的是乙酰化还可在非酶催化作用下发生,此时,总化学计量较低且功能不明确。与其他酰基CoA的进一步酰化过程也会发生。其他参与蛋白质翻译后修饰的代谢物包括琥珀酰-CoA(精氨酸琥珀酰化)以及活性糖分子(如UDP-葡萄糖)和乙酰氨基葡萄糖(图2A)。另外一些活性代谢物能够调控抗炎反应(通过半胱氨酸残基的烷基化)(图2B)、蛋白质稳态(通过蛋白酶体ADP-核糖基化)(图2C)及酶活性(通过赖氨酸戊二酰化)(图2D)作用。参与这三种过程的生物活性代谢物分别是衣康酸酯、ATP-核糖及戊二酰-CoA。
值得注意的是,许多代谢物诱导的蛋白质修饰的强弱直接依赖于细胞的代谢状态,因此其代表了一种强大的表型调控方法。DNA甲基化(或从S-腺苷蛋氨酸SAM到胞嘧啶的甲基基团的转移)最初在胚胎发育过程中建立的,并在整个生命周期中持续,影响染色质状态、血统特征、基因表达、基因组稳定性及干细胞的自我更新(图2D)。各种代谢物S-腺苷蛋氨酸、甘氨酸、丙酮酸、半乳糖及苏氨酸可作为转录后RNA修饰酶的辅助因子,这种修饰可作为信息的感应器和 转导器来控制代谢速率(如耗氧量)和蛋白质合成,然而它们的作用目前尚未被阐明。此外,酶促组蛋白修饰如赖氨酸乙酰化、赖氨酸和精氨酸甲基化(再次源自SAM)以及丝氨酸磷酸化(源自ATP)是表观遗传的关键调控器,直接影响基因表达、染色体包装、DNA修复及细胞代谢状态。
图2 活性代谢物修饰大分子的实例。
A:通过三羧酸循环(TCA)中间体和相关产物进行大分子修饰的实例。乙酰辅酶A(CoA),α-酮戊二酸,琥珀酰- CoA,UDP葡萄糖和ATP是能量丰富的分子,可直接修饰蛋白质或核酸。B:通过衣康酸酯(一种支链脂肪酸)进行半胱氨酸烷基化。近期研究显示衣康酸酯是一种抗炎代谢产物,可直接烷基化KEAP1的半胱氨酸残基以控制NRF2的表达。KEAP1是NRF2的主要负调节剂。这导致抗氧化剂和抗炎基因表达的增加。C:蛋白酶体亚单位PI31的ADP-核糖基化以控制蛋白稳态。通过TNKS酶,PI31被ADP核糖基化以促进蛋白酶体26S组装(来自20S亚基)。这导致蛋白酶体活性增加。D:S-腺苷蛋氨酸是DNA、RNA及组蛋白甲基化的主要甲基供体,从而在基因组,转录组和表观基因组水平上控制基因表达。
1.3. 代谢物-大分子相互作用
代谢物-大分子的非共价相互作用是细胞活性调控的第二种模式。一个典型的例子是一个代谢物与一个酶活性位点的竞争性结合(竞争抑制作用),或代谢物与非活性中心的位点结合(异构化作用)来改变酶活性。这些认知不仅适用于酶,也适用于调控多种mRNA(代谢物控制的核糖体开关)、蛋白质(如信号受体)以及各种其他分子。G蛋白偶联受体(GPCRs)是代谢物激活信号分子的必要条件,它也是最早被鉴定为药物靶点的蛋白之一。其中,小鼠G蛋白偶联受体91(GPR91)能够被琥珀酸激活,以控制其血压;游离脂肪酸受体 (GPR40) 能够被内源性脂质棕榈酸羟硬脂酸(PAHSA)激活(图3A)。代谢产物与这些受体结合会引发高度特异性的信号反应,从而导致信号网络中特定细胞活化。转录因子调控亦是如此,例如,植物雌激素导致雌激素受体的非典型激活,它们均通过控制不同基因表达来指导系统对信号的反应(图3B)。在转录和翻译水平上,代谢物可以通过调控核糖体开关发挥作用,包括赖氨酸、谷氨酰胺、钴胺素、焦磷酸硫胺素和嘌呤(图3C)。活性代谢物还可控制其他必需营养素的吸收和利用,如植物对铁的吸收依赖于根系局部还原剂的存在。一个值得注意的例子是脑部葡萄糖感应,其中葡萄糖在控制激素分泌和神经元活动中起着至关重要的信号传导作用,作为调节食物摄入、能量消耗及自身稳态的一种手段,控制着高度复杂的行为表型。这些例子大多描述了被众所周知的活性代谢物的生物调控作用,但它们还将最常见的细胞结构单元的代谢物纳入活性代谢物范畴,如组成蛋白质的氨基酸,合成核酸的嘧啶和嘌呤碱基以及构成细胞膜的磷脂。
图3 活性代谢物对大分子进行非共价修饰的机制。
A:棕榈酸羟基硬脂酸(Pahsa)激活GPR40以诱导钙信号传导,并增加胰岛素和GLP1的释放;B:植物雌激素通过激活转录因子从而控制细胞的代谢及增殖;C:代谢物调控核糖开关;D:代谢物对高分子蛋白质组装的调控,如细菌蛋白质galF,一种葡萄糖-1-磷酸尿嘧啶转移酶。
1.4. 代谢物组介导的组学变化
从这些相当简化的方法中衍生出一个全新的层面,这个层面是由代谢物组介导的全球基因和蛋白质水平生命活动的激活。有基础研究对小鼠模型进行饮食限制来改变其新陈代谢,同时发现其基因表达的显着变化,伴随着衰老表型的改善。近十年的研究也发现代谢状态调节能够实现表观基因的控制。然而,仅有很少的研究系统地分析了代谢变化或代谢物补充对其他组学的影响。一项研究分析了代谢物的补充对组氨酸、亮氨酸、蛋氨酸及尿嘧啶生物合成不足的不同酵母菌株的影响。随后,研究人员对这些菌株进行转录组、蛋白质组及代谢组的分析。综合分析结果显示,这些菌株的基因(上位性)和蛋白质表达在很大程度上受到代谢物补充的影响,这表明代谢物对这些菌株发挥了较系统地调控作用。在这些研究中,代谢通量分析在考察专属酶时间依赖活性及生物通路方面具有更重要的作用。此外,最近大量研究表明,代谢物参与了蛋白质复合物的形成(交互作用),如大肠杆菌中UTP-葡萄糖-1-磷酸-尿苷转移酶galF在ATP存在下形成galF复合物(图3D),该复合物的生化序列尚未被测定。蛋白质-代谢物相互作用图也已通过酵母菌蛋白中心性方法研究得到,且更大程度上提供了尚未知晓的规律性关系,包括麦角固醇对哺乳动物中AKT类似物-YPK的调节。
通过这些研究发现,活性代谢组控制并介导了机体基本生命活动过程,例如信号转导、蛋白稳态及基因表达的调节,其调控机制是当前众多研究的重点。如今全球范围内代谢组学尤其是活性代谢组学研究的综合方法成为热点。将代谢组学与其他组学数据相结合为功能检测代谢物的优选及活性代谢物的预测提供了一种技术手段(详见多组学结合部分)。为揭示代谢物诱导大分子活性的复杂过程,最终达到表型控制的目的,现有研究技术需进一步提高。无论如何,现有文献提示,我们利用代谢组学研究鉴别得到的代谢物能够对生物的生理机能进行调整,这一认知使得传统的组学技术思维发生了改变,即代谢组学不仅能够为其他组学层面提供简单的读取功能,还可以作为生物系统的主要调节剂。
2. 活性代谢物的发现
2.1. 代谢物的监测、鉴别及定量测定
有史以来,代谢物的监测、鉴定及定量是通过生化方法完成的,然而代谢组学为生物活性代谢物的发现提供了独特的思路,且在多个层面得到了很好的应用(图4)。生物活性代谢物的发现是其鉴别过程最重要的部分之一。基于质谱的代谢组学数据的获得与识别主要是通过不同物质具有特定质荷比(m / z)这一特征来实现的。质谱特征识别是数据处理过程中最具有挑战性的部分,得到了广泛的关注。通过对代谢组学数据集的统计分析生成代谢物列表,建立基于代谢组学的生物活性代谢物筛选方法。一旦根据峰强度确定了代谢物丰度的定量方法,数据过滤器就可依据实验及数据进行调整。对代谢物进行进一步生物活性筛选的常用方法是特定临界值分析(如与对照组相比,p值小于0.01且差异倍数大于2)。提供多峰检测和比对的软件包括XCMS Online,MZmine2,Open-MS及MS-DIAL。随后是通过代谢物数据库及光谱库对代谢物特征进行识别及比对,常用的数据库有人代谢数据库、METLIN、伯明翰代谢物核磁共振数据库、BIGG、MassBank、LipidMaps、mzCloud、Fiehn实验室GC-MS数据库及Golm代谢组学数据库。云技术和云数据库(Box)的发展解决了数据分析和共享的问题,特别适用于非专业实验室。生物信息代谢通路和网络分析可降低数据的复杂性。最近XCMS Online也开发出该功能,可通过MetExplorer及其他平台获得。这些方法的目的是对参与代谢网络不同模块或代谢网络局部富集部分的代谢物进行优选,从而反映其真实的活性(同时错误匹配的假设将在整个网络中随机分布)。一旦建立了候选生物活性代谢物列表,可采用同位素示踪技术(代谢流分析)追踪它们的真实活动。最终,通过体内外表型、组学及化学生物学方法来建立代谢组学活性筛选。
图4 基于代谢组学的生物活性代谢物的鉴别及其活性评估
2.2. 活性代谢物的筛选方法
鉴别调节表型的活性代谢物有多种方法。已有许多研究应用代谢组学与分子生物学正交实验及计算机技术相结合的方法对活性代谢物进行鉴别。在这些实例中,检测代谢物活性的最重要的步骤是使用适当的筛选方法,包括筛选基因表达、蛋白表达和蛋白活性(如酶活性)、调节所需的细胞表型以及直接在生物体上进行体内表型研究。表1列出了这些实验方法需遵循的原则。
表1 活性筛选方法需遵循的一般原则
与体内实验相比,细胞实验能够提供高通量筛选,并可分析细胞形态、生物学物理学功能及化学生理学特征,还能够利用荧光或发光等分子生物学技术从多个层面进行研究。在代谢物-表观基因组和代谢物-基因组相互作用领域,研究方法主要包括染色质免疫共沉淀-测序(ChIP-Seq)技术和测定甲基化DNA的亚硫酸盐测序等核苷酸测序方法。近年来,化学蛋白质组学开始被用于研究代谢物-蛋白质和小分子-蛋白质的相互作用,如以代谢物与不同蛋白质相结合为原理的蛋白芯片[G],或热蛋白组分析(TPP),其主要依据与小分子结合后蛋白质热解温度(“熔点”)会发生偏移。TPP主要研究在不同代谢物存在的情况下,活细胞或细胞提取物中变性蛋白质热解温度的偏移大小。以代谢物或蛋白质为中心的其他化学蛋白质组学方法包括基于氧化速率的蛋白稳定性评估方法(SPROX)或有限蛋白水解分析法。
值得一提的是,某些筛选可能是耗时且成本较高的,所以很大程度上仅局限限于专业实验室。因此,为有效的预筛选潜在的活性代谢物,基于计算机活性预测并结合化学实验的方法被广泛的采纳(从而加快了表1所示的一般分析方法)。在表2中我们详尽地罗列了计算机方法与体外方法的优势及局限性。除了这些技术外,更多先进的预测方法也在被应用。利用ChEMBL数据库中小分子的活性、物理化学性质及结构信息的大数据集建立的神经网络进行预测。例如超过6000个小分子的环氧合酶2 IC50值及它们的理化性质能够在ChEMBL上找到。应用此信息建立的神经网络可衍生出一种算法,该算法能够从代谢组学实验得到的几百或几千代谢物中预测其可能的生物活性。反过来,通过重叠比对,代谢组学数据可能受到神经网络中不同功能基团、生物化学性质等所预测活性的限制,从而限制其实际化学空间,最终还需进行体内外生物活性实验进行验证。另外一种有趣的尝试是通过专门且高精度的计算机模拟方法来预测药物易于参与代谢反应的分子活性位点。
除了使用认知计算(神经网络)以外,闭合质量平衡的代谢模型也是一种有趣的方法。闭合质量平衡意味着系统的输入和输出符合质量作用定律。正如近期研究显示,通过对百日咳杆菌的闭合质量平衡代谢模型的建立及完善,作者对细菌生物学特征有了更深入的了解,他们发现百日咳杆菌的代谢模型出现明显的氮失衡现象,其中约有30%的未知氮。他们应用LC-MS分析鉴定出11种新型含氮代谢终产物。基于这些代谢物的性质,作者建议这些活性氮的生理作用不仅限于氮排泄。随后,作者使用所建立的代谢模型来计算支持百日咳杆菌生长的最小营养输入量,以便更合理地设计新型生长培养基。有趣地是,他们的模型还预测出硫代硫酸盐是硫的一种可能来源,包括其转化的新型代谢途径。通过上述研究发现这种方法为宿主及微生物间相互作用的阐明提供可能,同时发现了百日咳杆菌代谢的灵活性并合理地设计出适合其生长的新型培养基,增加了百日咳毒素的产量。
表2 用于代谢物活性研究的化学生物学和计算机技术
我们还可以应用全面且多样的代谢物数据库进行高通量筛选,例如METLIN目前拥有超过300,000个单个小分子,包括代谢物和小肽。这种方法应用机器人声分配设备和多种已知生物筛选方法已广泛地用于制药和生物技术行业,并可以提供一种用于代谢物活性筛选的强有力的方法。
2.3. 多组学结合测定代谢物活性
除代谢组学外,多组学数据关联和整合将从另一层面提供信息,以改善代谢物筛选过程。例如,候选的代谢物与转录组学和蛋白质组学的数据整合可通过找到预选代谢途径的重叠部分从而完善代谢通路的分析。基于蛋白质组、转录组及代谢组数据的多种综合数据集已在不同的研究领域得以应用,包括从癌症代谢研究、植物生理学研究到微生物学研究。多组学整合的目的是通过定量建模确定不同代谢产物的活性,从而针对特定途径进行靶向干预。为此,降低大量数据的复杂性非常重要。这可以通过多种数学方法来完成,例如,将代谢物和其他组学数据添加到建立的途径中,或者利用数据建立新的途径和通量模型。必须指出的是,多组学整合方法仍需不断地提高与完善。
在大多数研究中,多组学整合是基于与独特代谢物标识符相关的基因命名法,并结合前期获得的通路信息(如KEGG, Reactome, Biocyc pathways, Recon或从MetaboAnalyst平台获得的代谢组富集库以及最新的ChemRICH平台)。使用该通路信息的优势是能够降低数据的复杂性并过滤噪音。最近引入的代谢组学介导的系统生物学方法整合了多组学数据,其中所有其他组学数据层面(基因和蛋白质表达)被映射到非靶向代谢组学衍生的代谢活动中。目前基于多组学代谢路径集成的若干其他方法,以及基于网络和机器学习等方法正不断涌现。
代谢组和其他层面组学的整合可能是一项挑战。事实上,许多研究人员无需预先设置整合方法即可获取复杂的数据库。然而它们必须充分考虑数据采集的稳定性、样品采集引入的人为干扰(批处理效应)以及不同组学数据集的不同特征。多组学结合重要的是移除噪音、数据预处理、特征识别、数据的降维以及最后利用计算机筛选和数学模型来获取组学数据、校正模型及进一步对多组学网络模块的整合。目前研究人员正致力于开发简洁且有效推进这些方法的手段。由于技术限制(如分析偏差限制了代谢物的覆盖范围),代谢网络无法得到充分验证。因此,多组学数据最终无法被充分且全面地利用。代谢组学层面的一个限制是缺乏适当的存储和数据共享策略,这已经受到了越来越多的关注,如MetaboLights 和 Metabolomics Workbench数据库的不断研发。最终,在大量发表的研究报告中,研究人员进行了验证实验,以期通过实验得到的结论能够增加研究的影响程度。但是这种常用的过程仍然没有充分利用数据库的优势,所以多组学的大部分数据仍没有得到应用。然而多组学数据一旦获得并得以整合,多层面的组学方法就可以被应用,特别是在体内代谢研究上。
利用代谢过程的基因尺度模拟、大数据分析及机器学习方法相结合来进一步优选生物系统中可能的代谢活动是让人期待的。实际上,体内和体外建模研究已经表明了这种整合组学方法的强大功能,该研究在更多的观察结果中协调了多层面组学数据的采集及代谢物和其他表型,并能够精确地预测生物学行为。具有各基因缺失的酵母菌株是成功地将遗传变异与代谢表型相关联的生物模型,同时也将基因与其在代谢中的作用相联系。在机器学习方法研究中,利用蛋白质组学数据预测全基因组敲除的各酵母菌株中酵母菌的代谢情况。实际上,多层次基因组模型以及更小的模型已经能够从单个数据集中预测整个代谢组。最近一个成功的例子是通过代谢和遗传干预措施精确地预测了大肠杆菌的生长。代谢组学介导的观点是不同的:例如,将下游代谢变化映射到代谢途径和生物网络上可以提供机理上的理解,特别是在与其他“组学数据”相关联时。利用这些平台,自动化分析预测通路可实现直接高效的代谢产物映射到背景知识数据库,这些背景知识数据库可以是精选的参考途径数据库或基因组网络。然而,可用的代谢谱数据库仅覆盖了基因组水平代谢的一部分(高达60%),这表明由于“dark”代谢组,代谢组学指导策略存在普遍但可解决的局限性。通量分析利用脉冲同位素标记代谢物可补充传统的代谢组学研究,以进一步阐述酶和代谢物之间的关系。
虽然整合多组学方法的当前目标是生成精准的生物学模型,而我们最终目标是应用这些信息来鉴定活性筛选的最佳代谢物。因此,对多维的综合组学的总体分析产生了意想不到的机会和即用的解决方案,从而将其用于预测调节表型的代谢物。
2.4. 活性代谢组学的应用
生物活性代谢物具有广阔的应用前景。如图5所示,生物活性代谢物能够改变多种生物的表型,从相对简单的原核生物到复杂的人体。例如活性代谢组学能够丰富生物技术在细菌研究中的应用,如通过代谢组学的研究提高了大肠杆菌中百日咳博德杆菌疫苗和蛋白的产量。通过调节哺乳动物代谢能够影响微生物,反过来,微生物衍生的代谢产物能够被用于影响宿主的生理机能,包括免疫细胞和饱腹感。代谢物活性的其他例子来自新兴的免疫代谢领域,其中前列腺素E2促进Th2、Th17及调节性T细胞反应,而抑制巨噬细胞和嗜中性粒细胞的活性。在器官水平上,代谢物可以影响机体生理病理反应,如通过调节白三烯来治疗哮喘。在复杂的生物体中,营养干预,如ω-3脂肪酸的补充被证明副作用小且具有多种益处。同时大量的研究表明各种饮食的补充对衰老相关疾病的表型具有调节作用。除了食物补充外,生物活性代谢物还可用于药理学和毒理学领域,以减少化合物毒性(如给予乙醇来降低甲醇中毒毒害,或应用巯基乙磺酸钠清除某些化疗药物或扑热息痛中毒的毒性代谢物),或利用药物与内源性代谢物的协同作用来提高治疗效果。即使是非常简单和价格低廉的代谢物,如谷氨酰胺,也可以用来治疗复杂的疾病,如镰状细胞贫血症,该物质已进入III期临床试验。
图5  A:代谢物具有调节表型的活性;B-F:α-酮戊二酸(AKG)在原核生物到真核生物的各个系统中的代谢活性。
这些示例表明,生物活性代谢物在调节生物过程,包括诱导细胞代谢状态的改变(如促进细胞活化、分化或增殖)以及影响复杂的组织功能等方面具有广泛的适用性。值得注意的是,代谢物的作用是由环境决定的,与之相关的表型可能在很大程度上随所应用的生物系统的变化而变化。活性代谢组学的目的就是为该观点的研究提供准则。α-酮戊二酸(AKG)是一个活性代谢物根据环境变化改变表型的例子:α-酮戊二酸能够调节细菌中葡萄糖的代谢及摄取;通过抑制mTOR以延长秀丽线虫的寿命;支持免疫细胞中T细胞的分化;通过参与ERK等过程增加人体组织及肌肉的再生。AKG还能与G蛋白偶联受体Oxgr1(主要在肾脏分布)相结合,通过增加转运蛋白的合成调节盐的重吸收从而对血压进行调节。上述实例共同表明AKGs是通过影响细胞代谢过程从而对机体的代谢产生影响。因此,活性代谢组学研究目前面临的挑战是如何将代谢物与机体表型间的联系系统化并定量化。这个目标的实现需要综合代谢组学及表型数据,同时利用计算机技术将其他组学数据进行整合。

结论

随着代谢组学的主流化,代谢物因能够对表型进行调控而获得了新的关注。在此引入“活性代谢组学的概念”,其被用于描述如何使用代谢组学技术来鉴定生物活性代谢物。这一概念的核心是关键代谢物的鉴定,然而,想解决这一问题单独靠一种方法是无法实现的,需通过计算机技术将代谢组学、系统生物学和生物活性数据相结合来实现,这使得我们能够识别在调节生物过程和细胞生理状态的最具活性的代谢物。虽然研究很容易拘泥于问题的细节中,如代谢物的鉴别和特征识别,但是这些问题大多已经或正在被解决。这些技术的最终目的(如图1与5所示)是将代谢组学指导的筛选方法作为系统生物活性代谢物鉴别的主要工具。这一目的一旦实现,活性代谢组学将可能对多个生命科学产生一定的影响。
原文网址:https://www.nature.com/articles/s41580-019-0108-4
(0)

相关推荐