综述|CURR OPIN PLANT BIOL:稳定同位素标记的高维度代谢组学用于识别植物中缺失的特征代谢

编译:Ms. MS  编辑:谢衣、江舜尧。

原创微文,欢迎转发转载。

导读

特征代谢的确切机制及其在植物进化中的重要性仍然是个谜。特征代谢的产物及其相应的生物合成基因对于理解某些代谢普遍存在的原因至关重要。尽管基于质谱(MS)的代谢组学使我们能够获得未知特征代谢物、已知代谢物及其对应异构体或类似物的结构特征数据,但分析方法的拓展仍然十分必要。在此,作者回顾总结了使用稳定同位素标记识别未知特征代谢物的先进分析方法。

论文ID

原名:Higher dimensional metabolomics using stable isotope labeling for identifying the missing specialized metabolism in plants
译名:稳定同位素标记的高维度代谢组学用于识别植物中缺失的特征代谢
期刊:Current Opinion in Plant Biology
IF:8.356
发表时间:2020
通讯作者:Ryo Nakabayashi,Kazuki Saito
作者单位:千叶大学

内容

迄今,地球上大约391000种维管植物中的225种基因组已被测序。由于测序及数据分析技术方法的进步,预计这一数字在不久的将来会迅速增加。现代基因组测序能做到一个物种的全基因组分析或染色体规模的基因组分析。这些方法可用于从测得的基因组中获得相关代谢类型的详细信息。

植物有两种代谢类型,即初级代谢,次级代谢或特殊代谢。初级代谢对于维持植物的生存十分必要,其与包括氨基酸、糖、脂肪酸和脂类在内的代谢物息息相关,且在进化早期即形成,存在于所有已知的植物中。而植物进化出特殊代谢的原因尚不明确;过去十年的研究表明,特殊代谢产物能保护植物抵抗环境胁迫,包括生物和非生物胁迫。为了确定特殊代谢物的作用,对相关生物合成基因修饰或缺失导致缺乏此类特殊代谢物的植物进行比较分析是必不可少的。例如,通过对比野生型和突变体的类黄酮生物合成途径,能阐明代谢物对氧化和干旱相关胁迫的作用。各种野生型物种的比较遗传分析揭示了酰化类黄酮对紫外线-B具有缓解作用,表明当植物暴露在严重的胁迫下时,它们会过度产生特殊的代谢物,表现出一定的缓解胁迫的能力。

已有研究表明,参与代谢的剩余基因仍然存在于基因组中;然而,由于对应代谢物未被识别,对应基因的功能因此也未能被确认。因此,要确定相应基因的功能,必须揭示相应的代谢物。每一种植物有自己的“特殊代谢组”,其由特殊代谢物组成。植物界中至少有391000个这样的特殊代谢组。我们应该发展分析方法去识别尽可能多的特殊代谢组。MS是获取全面代谢组学数据的有力工具。串联质谱(MS/MS)图提供了有关代谢产物的结构信息,包括正负离子模式下m/z值和同位素分布信息。在液相色谱(LC)中,代谢产物的化学性质会影响其保留时间;例如,使用普通反相柱进行LC分析时,高极性代谢物保留时间较短,而非极性代谢物保留时间较长,其表明在对代谢物进行归属时,尽可能多地考虑到各个数据非常重要。

根据代谢组学标准倡议,代谢物的化学归属分为四个级别:1级:鉴定;2级:注释;3级:表征;4级:未知;数据分析方法依此进行。现有的方法在鉴定“未知”代谢物方面依然存在困难。基于MS的代谢组学当前的挑战之一是开发归属未知代谢物的方法。核磁共振(NMR)能够成功地进行结构鉴定,是因为NMR提供了代谢物的多面或多维谱;而在基于MS的代谢组学中,LC-MS/MS采集的质谱图也能提供有用的代谢物结构信息。

在此,作者回顾了LC-MS/MS分析中使用稳定同位素标记测定未知代谢物的最新方法。这类方法中,使用稳定同位素标记的原子会导致目标化合物离子m/z值的偏移。这种偏移有助于确定化合物包含的原子数以及其他特性。

一、将结构异构体或类似物化学归属为“表征”

在1级“鉴定”层次中,样品中检测到的化合物的LC-MS/MS特征被与真实标准化合物(包括分离代谢物或合成产物)的LC-MS/MS特征进行匹配。在基于MS的代谢组学中,将样品与标准品共洗脱是最准确的化学归属方法。由于可得的标准品有限,研究人员也会使用共享数据库中的LC-MS/MS数据或MS/MS数据进行研究。在2级“注释”层次中,样品中采集到的MS/MS谱被与数据库谱图进行比较。然而,由于特殊代谢物的化学多样性,即使使用了标准化合物和数据库比对,鉴定和注释所覆盖的代谢物也仅仅少于5%。在3级“表征”层次中,通过对化合物MS/MS特征解析,以推测代谢物或代谢物含有的官能团。比如,植物通过生物反应会产生结构异构体和类似物,同分异构体中具有相同骨架和官能团的部分会得到相似的MS/MS图,而类似物结构中修饰部分的质谱图会稍显不同。需要注意的是,这些异构体和类似物结构类似,但通常具有明显不同的生物学功能。他们的MS/MS谱的相似处可用于分析检测到的代谢物异构体和类似物之间的关联(图1)。利用这种相似性能有效发现新的结构异构体/类似物,在已有研究中能增加约40%化合物化学归属。

图1 表征-化学归属结构异构体/类似物

二、未知代谢物亟需更深入的研究方法

“表征”方法的发展使挖掘更多的结构异构体/特殊代谢物的类似物成为可能。对于鉴定目标代谢物的未知异构体/类似物的研究人员来说,比对MS/MS的相似性是一个重要的步骤。一旦核心代谢物的MS/MS被更新到共享数据库中,其未知的异构体/类似物可能通过MS/MS的相似性与其产生关联。在植物界,可能还有特殊代谢物具有未被揭示的骨架结构。为了促进这类代谢物的归属,亟待更深入的方法。首先要做的即是开发用于从代谢组数据中排除已鉴定、注释和表征的代谢物的方法。

三、稳定同位素标记谱图可作为另一维数据

准确的质量分析是确定分子式的关键。目前,质谱仪准确度有了显著提高,使得质量准确度可达0.1mDa;但是要确定未知代谢物的分子式,仅靠准确度是不够的。在m/z不超过1500的小分子中,至少会有几个候选分子式。在超高分辨率分析中,精确分子量和同位素峰簇同时被用于确定分子式。在中分辨分析(如使用四极杆飞行时间质谱)中,同位素峰簇因为没有被分离而难以被利用。这些事实表明,在中分辨分析中还需要其他的定性条件。

稳定同位素标记被用于阐明生物化学和天然产物化学中的结构。生物体可以从含有稳定同位素标记的中间体获得部分或全部标记的代谢物。NMR分析对比标记代谢物的谱图和非标记代谢物的谱图可以准确地进行结构解析。例如,在13C NMR中,非标记代谢物的化学位移和13C标记代谢物的耦合常数代表碳链的连接方式。

由于稳定同位素对生物体内特定代谢物的产生没有显著影响,同位素标记可应用于基于MS的植物代谢组学。例如,13CO2被广泛用来标记植物,然后比较未标记和标记的质谱图,以确定m/z值的变化(图2)。根据一级或MS/MS的分析结果计算确定每个原子的数量。利用得到的原子数,结合质量精度和同位素峰簇,可以从一系列可能的候选分子中归属得到代谢物的分子式。对于拟南芥样品,使用13C、15N和34S标记得到的代谢物的质谱图分析,可以明确代谢物的分子式。

图2 使用LC–MS/MS和稳定同位素标记的代谢组学示例。

代谢组学数据来源于稳定同位素标记和非标记的植物。稳定同位素标记的代谢物和未标记的代谢物在几乎相同的保留时间内被检测到;但是,由于标记的原因,它们的质量不同。质量位移差值代表了用稳定同位素标记的原子数。标记不仅揭示了前体离子的原子数,也揭示了产物离子的原子数。原子数的确定有助于探究它们的结构。在之前的报道中,用13C标记表征S-1-丙烯基巯基还原型谷胱甘肽的结构。

如上所述,MS/MS分析可以得到代谢物的结构特性。在MS/MS分析中,通常很难确定产物离子的元素组成。将MS/MS分析与稳定同位素标记相结合,就可以利用确定的分子式确定产物离子的元素组成。酰基糖、黄酮类化合物(花青素、黄酮醇,C-黄酮和异黄酮)、环烯醚萜、木质素、酚胺、皂甙和萜类的串联谱图均有被研究。这种组合分析不仅适用于含有酯键和醚键的代谢物,也适用于了解含有C–C、C=C、C–N、C=N和C–O键的生物碱的详细裂解机理。

四、使用稳定同位素标记测定已知和未知代谢物

手动识别所有检测离子的分子式需要相当长的时间。利用MS-DIAL程序和13C标记,诞生了一种化学信息学方法,可以利用测定的C数和LC-MS/MS结果明确分子式。在目前的数据库中没有找到的分子式通常不作进一步的分析。图3的研究案例表明这项研究分析了这些未匹配的代谢物的化学成分,并在12种植物中匹配上了1133种代谢物。异构体/类似物,即糖基化或羟基化的类似物,可以根据MS/MS的相似性、同源性和生物反应因子获得。这些类似物的鉴定可能有助于发现相应的生物合成基因,包括糖基转移酶、细胞色素P450单加氧酶或2-氧戊二酸依赖性双加氧酶。

图3   12个植物样品中的特殊代谢组网络图。
上图:先前研究中负离子模式的结果。下图:颜色表示植物名称(不是%)。

五、发掘“完全未知的代谢物(CUMs)”


代谢物的结构归属分为两组:1)代谢物常见于多个植物科中,2)代谢物特征存在于某一科植物中。此外,1395和773种代谢物特征被定性为未知;它们的碳数用正离子或负离子模式测定。利用MS/MS的相似性、同源性和生物反应分析未知代谢物。所有与1133种代谢物的关联代谢物都被计算了出来。大多数未知代谢物与结构确定的代谢物有关。有趣的是,190和77种代谢物特征分别在正离子和负离子模式下与其他代谢物无关联,这意味着它们来自CUMs;它们与已知的生物反应无关。

六、用于CUMs评分的计算方法的发展


鉴定特殊代谢物对于理解植物界特殊代谢物的进化至关重要。为了通过MS和NMR阐明CUMs的结构,需要使用色谱技术进行目标化合物分离。然而,由于没有已知的结构信息,因此很难决定哪些CUMs应该最初被分离。分离前必须知道哪种代谢物对植物的生物和化学特性影响最大。

一种通过基因组学、转录组学和代谢组学等组学分析的计算系统被认为对CUMs的“排名”很有用(图4)。不同的植物物种可能具有CUMs或其异构体/类似物。通过分析额外的特殊代谢组,CUMs可以通过其MS/MS相似性关联。这些联系表明了这类代谢对物种的重要性。特殊代谢物的生物合成基因可以在全基因组关联研究(GWAS)中通过结合信号强度和多个物种的测序基因组中的单核苷酸多态性数据来表征。还可以检测到未知代谢物的关联。由于环境胁迫和器官特异性的影响,与特殊代谢相关的生物合成基因会发生共表达。共表达基因可能提供靶基因的特性。最近,基因聚类分析已经被用于特殊代谢的研究,邻近基因能提供关于目标基因的参考信息。这种数据分析方法已经成为GWAS、共表达分析和基因聚类分析中的常规方法,其中基因聚类分析和微生物中的特殊代谢组结合非常常见。当CUMs满足以下条件时,便得到计算得分:1)现有代谢组数据中的CUMs与代谢组分析中特定种类的代谢产物高度相关性;2)CUMs与GWAS中的基因相关;3)转录组分析中的基因共表达;4)基因是基因组分析中基因簇的一部分。通过得分选择要分离的CUM。代谢组分析中的信号强度有助于确定产生CUMs的初始反应物。因为样品需要一定用量,样品的选择同样会使分离和结构解析更高效、便捷。

图4 使用基因组、转录组和代谢组数据对CUMs进行评分的预期工作流程。

结论

在基于MS的代谢组学中,利用有效的方法对已知和未知代谢物进行结构解析是关键,因为未知代谢物的识别有助于对缺失的特殊代谢物进行识别。目前的研究技术正处于平台发展期,因为多数可用标准品鉴定的特殊代谢物已经被鉴定出来。因此,须使用基因组、转录组和代谢组数据积极地引入新的代谢产物的计算方法。虽然这项任务具有挑战性,但理解特殊代谢的功能将有助于正确理解植物进化过程。

原文网址:http://creative-commons.org/licenses/by-nc-nd/4.0/

(0)

相关推荐