科研| GENOME RES:果蝇代谢组的系统遗传学

编译:胜寒,编辑:谢衣、江舜尧。

原创微文,欢迎转发转载。

导读

DNA序列变异是如何通过内表型来调节生物体性状的,这一直是定量遗传学研究的中心问题。这个问题可以通过一种系统方法来解决,该方法可实现基因多态性、基因表达性状、代谢物和复杂表型在同一基因型上的评估。在这里,作者重点研究了代表遗传变异和机体表型之间紧密联系的代谢物组,并量化了黑腹果蝇40个品系的代谢物水平。研究确定了基因相关代谢物的性别特异性模块,并构建了将DNA序列变异、基因表达变异与代谢物和机体特征(包括饥饿、应激抵抗和雄蝇攻击)的变异相结合的网络。最后,作者继续探究SNPs和代谢物在多大程度上可以预测性状表型以及产生性状和性别特异性预测模型,该模型为研究复杂表型的代谢组学基础提供了新的见解。

论文ID

原名:Systems genetics of the Drosophila metabolome

译名:果蝇代谢组的系统遗传学

期刊:Genome Research

IF:9.944

发表时间:2020.03

通讯作者:R.H. Anholt

通讯作者单位:北卡罗莱纳州立大学行为生物学中心和生物科学系

实验设计

作者首先使用40个DGRP品系果蝇,将其以性别区分开来,以确定与生物表型变异相关的遗传变异代谢物和代谢组学模块。其次构建了将DNA序列变异、基因表达变异与代谢物和生物体性状变异相结合的网络。最后,作者探索了基于可变代谢物的表型预测模型。

实验结果

代谢组的表型变异

  作者使用了超性能液相色谱串联质谱法来量化40个DGRP品系3-7天龄果蝇代谢组的变化。鉴定了453种代谢物,它们代表了8种超级途径,包括脂类、异种生物、核苷酸、氨基酸、能量代谢、碳水化合物、辅因子和维生素以及肽的代谢途径。其中,53种代谢物在没有正式记录标准的情况下被检测出来。作者进行主成分分析(PCA),发现与第一个主成分相关的雌蝇和雄蝇之间的代谢物丰度具有很强的性别二态性,表现出34.8%的总变异(图1A)。剩下的每一个主成分表现出总变异量的8%。此外,作者还发现,在不同的代谢物之间,雌蝇和雄蝇之间的相关性存在很大的差异(图1B)。4种代谢物:1-(1-烯基棕榈醇)-2-亚油基-GPC (P-16:0/18:2), 1-(1-烯基棕榈醇)-2-棕榈醇-GPC (P-16:0/16:1),甘油2-磷酸和甲羟戊酸盐5-磷酸仅在雄蝇中被鉴定出来。1-硬脂酰-GPI(18:0)仅在雌蝇中被鉴定出来。

图1  40个DGRP品系代谢组的主成分分析(PCA)

代谢组的遗传变异

混合效应ANOVAs对DGRP品系、性别和性别互作效应的影响进行了定量分析,鉴定出380个代谢物在各系间存在显著差异。不同性别间代谢物丰度存在差异的代谢物有381个,172种代谢物具有明显的性别相互作用。其中118个代谢物对三个术语均有显著性意义。所有代谢物的平均广义遗传力(H2)为H2=0.43,这表明对观察到的表型变异有相当大的遗传贡献。由于大多数代谢物在雄蝇和雌蝇之间存在广泛的差异,作者也分别对性别进行了简化模型ANOVAs。这些分析确定了雌蝇的371种代谢物和雄蝇的355种代谢物,它们在不同的遗传背景下是不同的。作者分别对雄蝇和雌蝇的下游代谢产物进行了分析。
此外,雌蝇的82种代谢物和雄蝇的98种代谢物在遗传上无差异,其中43种代谢物在两性中均为常见代谢物。这些代谢产物在稳定状态下可能受到严格的调控。在雌蝇中,包括脂肪酸生物合成的常见前体(丙二酸和丙二酸甲酯)、核酸(肌苷、鸟苷、胞嘧啶和尿苷)、三羧酸循环的中间体(苹果酸和草酰乙酸)、甘氨酸、辅因子烟酰胺、3 -羟基丁酸盐和一系列复杂的磷脂。除辅酶A前体磷肽、维生素B6前体吡哆醛、肉碱、谷氨酸和各种复杂磷脂以外,甘氨酸、烟酰胺、苹果酸盐、草酰乙酸、肌苷和鸟苷在雄蝇中也没有遗传变异。

遗传变异代谢组模块

为了寻找基于相关结构相互作用的代谢物集合,作者分别使用所有变异代谢物对雌蝇和雄蝇进行模块化聚类。

作者在雌蝇中鉴定出22个具有相关代谢物的模块(图2A)。大多数模块包含的代谢物主要来自一个或两个超级途径,反映功能连接,包括脂质代谢、碳水化合物、肽、氨基酸和核苷酸代谢。模块8、10、12、16和21包含与各种代谢过程相关的代谢物。

对于雄蝇,作者确定了33个紧密相关的模块(图2B)。与雌蝇不同的是,大约一半的雄蝇模块含有与多种超级途径相关的代谢物。作者没有观察到雄蝇和雌蝇之间模块的显著相关性。

因此,作者发现雌蝇和雄蝇之间的代谢组学特征和个体代谢物丰度存在很大差异,平均而言,雌蝇比雄蝇拥有更大的代谢单元。

图2  雌蝇(A)和雄蝇(B)的40个DGRP细胞系的代谢产物的模块聚类

代谢物数量性状位点(mQTL)定位

作者鉴定了与每个代谢物丰度变化(mQTLs)相关的DNA序列变异。作者测试了1,561,516个双等位基因的单核苷酸多态性和缺失和插入,其中次要等位基因至少存在于4个DGRP品系。在雌蝇中,作者鉴定了近576个基因中的754个mQTLs和126个基因间区中的167个mQTLs(同一基因间区考虑了2 kb内的多态性),它们与92个代谢物相关(图3)。在雄蝇中,作者绘制了664个基因或近664个基因中的993个mQTLs和与100个代谢物相关的158个基因间区域中的229个mQTLs(图4)。在雌蝇和雄蝇中,分别有808个mQTLs(87.7%)和1115个mQTLs(91.2%)只与一个代谢物相关。此外,多效性mQTLs主要与结构相关的代谢物相关,说明多态性对个体代谢物的变异有特定的影响。相比之下,每个代谢物平均与雌蝇或雄蝇的12和14个mQTLs相关,而两性的中位数为5个mQTLs。

与15种代谢物相关的共110个多态性在两性中普遍存在。

大多数mQTLs是内含子,其次是基因间的、上游的和下游的mQTLs。与39个代谢物相关的77个非同义编码多态性。它们位于60个基因的编码区域,其中22个基因没有带注释的功能。它们不会因特定的途径或官能团而富集。由于代谢物之间并不是相互独立的(图2),作者对相关代谢物的各个模块分别对雄蝇和雌蝇进行了PCA分析。对于每个模块,作者保留了解释了4%以上变化的PCs,作者还增加了PCs,累计解释了90%以上的变化。然后,作者从每个模块在每个PC上执行mQTL映射。在雌蝇中,作者近23个基因中的35个mQTL和与7个模块的PCs相关的5个基因间区域中的5个mQTL。在雄蝇中,作者发现在近23个基因中有27个mQTL,在与7个模块的PCs相关的3个基因间区域中有3个mQTL。
为了识别与单个代谢物和模块PCs相关的mQTL,作者首先考虑了2033个多态性,这些多态性与个体代谢物丰度的变化相关。然后,作者将多态性与pc模块的P值放宽到P < 2.17 × 10−6,捕获相同数量的mQTLs:雌蝇模块PCs为1021,雄蝇模块PCs为1018,其中6个mQTLs与雌蝇模块PCs和雄蝇模块PCs都关联。
在雌蝇中,作者发现分别与个体代谢物和模块PCs相关的有9个mQTLs(0.5%)和85个基因(7.7%),而在雄蝇中,与个体代谢物和代谢物PCs共有的有32个mQTLs(1.4%)和172个基因(10.7%)。与单个代谢物和模块PCs的变异相关的多态性和基因之间几乎没有重叠。然而,在每一种情况下,它们的生物学功能都在神经元分化和组织形态发生的基因本体论(GO)范畴中得到了丰富,包括与信号转导、膜转运体、受体和代谢酶相关的基因(图5)。

图3  雌蝇多态性标记与代谢物的变化

图4  雄蝇多态性标记与代谢物的变化

图5  雌蝇(A)和雄蝇(B)与代谢物和模块PCs变异相关的候选基因的相对表达

全代谢关联研究(MWAS)

作者用斯皮尔曼检测来进行全代谢组关联研究,确定代谢产物和代谢组模块与形态变化,生理,和与健身相关的表型,包括体重、胸长度,胸腔宽度,饥饿的阻力,惊吓反应,意识活动,性别和寿命以及雄蝇侵略的相关性。作者还使用比色法和荧光法评估游离葡萄糖和游离甘油水平,以及糖原、甘油三酯和总蛋白水平。作者观察到用质谱法测量的葡萄糖和甘油浓度的变化与生物化学测量的游离葡萄糖和游离甘油在雌蝇和雄蝇中高度相关。
在雌蝇中,作者发现有157种代谢物与这12个特征有显著的相关性,从12种与寿命相关的代谢物到36种与胸廓宽度相关的代谢物。共有94个代谢物与一个性状有独特的联系,63个代谢物与2-4个性状有联系。大多数性状的相关性涉及至少五个超级途径的代谢物(图6A)。然而,寿命的变化只与脂类、碳水化合物和氨基酸的代谢途径有关。体重和胸廓宽度的变化也主要与脂质代谢物水平的变化相关(图6A)。在雄蝇中,作者发现了与13种机体特征相关的190种代谢物,包括攻击性。相关代谢物包括7个与体重相关的代谢物和39个与饥饿抵抗相关的代谢物。作者观察到122个代谢物只与一个性状相关,而65个代谢物与两三个性状相关。与雌蝇一样,大多数性状的相关性涉及至少五个超级途径的代谢物(图6B)。
游离甘油和糖原的变化主要与脂质代谢相关,而体重的变化与脂质、氨基酸和核苷酸代谢途径的变化相关(图6B)。
除了个体代谢物外,作者还从21个模块中鉴定出77个PCs,从29个模块中鉴定出92个PCs,它们分别与同一组雌蝇和雄蝇的机体特征相关。其中,49和59个PCs与1个性状呈独特相关,其余与2个或3个性状呈独特相关。绝对相关系数范围从|r| = 0.31到|r| = 0.60。在雌蝇和雄蝇中,与寿命变化相关的PCs的平均绝对相关系数最高。
作者检测了13个性状之间的表型相关性,发现无论雄蝇还是雌蝇,游离甘油与甘油三酯相关,总蛋白与体重相关,胸宽与胸长相关,这与作者的预期一致。雄蝇的体重和胸围长度与游离葡萄糖和总蛋白相关,而雌蝇的体重与甘油和甘油三酯水平相关。雄蝇的饥饿抵抗与糖原和清醒活动相关,与胸廓长度呈负相关,而雌蝇的饥饿抵抗与游离葡萄糖和寿命呈正相关。
接下来,作者根据这些性状在代谢物和模块PCs之间的相关模式,对这些性状进行聚类分析,以评估不同生物体性状的差异在多大程度上受到代谢物组织的共同方面的影响(图7)。聚类分析概括了相关性状之间的关系。这些分析还揭示了隐藏的多效关系。例如,攻击性和惊吓反应是相关的,对应的寿命长短也相关。

雌蝇的觉醒行为与甘油三酯和游离甘油相关。这种聚类不是由于同一代谢物具有一致的正相关或负相关;相反,它揭示了竞争和拮抗的多效关系,如果只考虑表型相关性而不考虑它们的代谢组学关联,这些关系是无法检测到的。

图6  代谢物代谢超级途径的分布与雌蝇(A)和雄蝇(B)的机体表型变异相关

图7  基于雌性(A)和雄性(B)常见相关代谢物和PCs模块,对不同性状进行层次聚类分析。

遗传变异与代谢物和生物体性状的变异相结合的网络

通过定向RNA-seq从40品系中的39品系获得了转录谱。总共捕获了17295个注释基因和22726个新的转录本。在雌蝇中,9640基因和1644个新的转录本在39行中有显著差异,雄蝇中有9532个基因和3204个新的转录本有差异。为了排除极端品系所造成的相关性,作者在遗传变异的转录本和代谢物之间进行了Spearman秩相关检验。作者开始分析与每个不同性状相关的代谢物,分别针对雄蝇和雌蝇。然后,作者重点研究了与Spearman相关系数大于0.45的转录和代谢物对,并确定了与基因表达(eQTLs)和代谢物丰度(mQTLs)变异相关的遗传变异:meQTLs。然后作者确定了meQTLs,它也与每个生物体的数量性状有关。这使作者能够建立综合网络。作者提供了一些关于雌蝇(图8A)、雄蝇(图8B)和雄蝇(图9)的饥饿抵抗综合网络的例子。这些网络揭示了受多种基因产物调控的代谢物,并且为了抵抗饥饿,突出了性别二型性(图8)。雌蝇的综合网络表明,由常见的遗传变异连接的代谢物往往是同一代谢超级途径的成员(图8A)。而在雄蝇中,由常见遗传变异连接的代谢物往往属于不同的代谢超途径(图8B)。这些观察结果概括了模块化聚类所揭示的模块化组织。以肽和氨基酸代谢为特征的通路在雌蝇网络中显著,而脂质代谢在雄蝇网络中尤为明显。因此,雄蝇和雌蝇饥饿抗性的变化受明显不同的遗传和代谢基础支配(图8)。

雄蝇攻击行为的整合网络显示了与表型变异显著正相关和负相关的代谢物集合体。代谢物与能量释放直接相关,包括克雷布斯循环中间体和肉碱酯β-氧化运输脂肪酸进入线粒体(图9)。

图8 整合了多态标记、候选基因表达和代谢物丰度变化的网络,这些变化与雌性(A)和雄性(B)的饥饿抗性变化相关

图9 整合了多态标记、候选基因表达的变异和与雄性攻击变异相关的代谢物丰度的变异的综合网络。

基于代谢的生物表型预测

作者的问题是代谢物和模块PCs的遗传变异在多大程度上可以预测生物体的表型。作者首先进行了全基因组预测(使用所有常见的SNPs)、基于与代谢物变异相关的多态性的预测(mQTL)和代谢物预测之间的比较,使用最佳线性无偏预测(BLUP)和遗漏交叉验证

作者将全基因组SNPs预测精度与MAF>进行了比较。所有的可变代谢物,常见的SNPs和可变代谢物,与可变代谢物相关的SNPs (mQTLs),以及代谢物。

对于大多数性状,除了雄蝇和雌都性的饥饿抵抗和雄蝇的游离葡萄糖水平外,常见的SNPs和代谢物不能准确预测表型(图10),其中代谢物变异分析具有良好的预测价值。接下来,作者想知道,在模型中丰富那些与特定表型变异相关的代谢物是否会提高该表型的预测准确性。作者比较了在p值为0.05、0.1、0.2、0.3、0.4和0.5的所有的变量代谢物以及那些与特定性状相关的代谢物。所有性状都显示出使用之前与这些性状相关的一组富集代谢物提高了预测准确性(图11)。然而,根据不同的性状和性别,产生最佳预测准确性的富集水平是不同的。

作者使用弹性网络正规化来建立特征特异性模型,分别针对雄蝇和雌蝇。此外,作者还使用了代谢物模块PCs来预测表型,并将单个代谢物和模块PCs结合起来,观察预测精度是否会有所提高(图12)。作者发现,个人代谢物和模块PC的组合并没有提高预测精度的代谢物。
综上所述,对于大多数已知与特定表型变异相关的代谢物而言,代谢物的富集增加了该表型的预测准确性。最后,预测模型是特征特异性和性别特异性的,这表明导致表型变异的代谢组学基础在不同性状和性别之间是不同的。

图10 全基因组单核苷酸多态性预测准确性的比较

图11 比较使用所有变量代谢物或与特定性状相关的丰富代谢物的预测准确性

图12 基于代谢物的雌蝇(A)和雄蝇(B)的机体特征预测

结论

之前的很多研究已经将遗传变异与人类群体的代谢表型联系起来。以疾病为中心的高维多体分析为深入了解遗传变异与疾病易感性之间的关系提供了依据。然而,到目前为止,全基因组的变异与基因表达、代谢组和机体表型的变异以及基于代谢组学的表型预测尚未见报道。此外,以代谢物为中心的遗传学研究很少比较雌蝇和雄蝇之间的差异。人类的研究一直受到样本量的限制,植物和酵母模型不适合性别差异的研究,而对果蝇的大多数综合性研究都是在幼虫期进行的。作者的研究代表了第一个全面的系统遗传学分析,跟踪性别二态性在每个层次的分析,从遗传关联到代谢组和生物表型。作者在代谢组的模块组织中观察到广泛的性别二型性,这与之前的研究一致,也与整合基因组和代谢组学变异与生物表型变异的网络构成一致。例如,作者观察到,雄蝇的体重与葡萄糖和蛋白质水平相关,而雌蝇的体重与甘油和甘油三酯水平相关,这一证据表明,不同性别之间对能量代谢的管理不同。
一项关于拟南芥代谢组的自然变异的全基因组关联研究发现,与代谢物水平变异相关的遗传变异作为非随机分布的热点出现在可能经历了选择性扫描的基因组区域。作者没有在MWAS中观察到此类热点的证据。此外,尽管黄花菜中eQTL与代谢物水平的相关性较差,但作者观察到eQTL与代谢物丰度变化之间存在大量的一致性,这与人类研究结果一致。 虽然遗传变异代谢物具有丰富的遗传力,但环境因素对总方差的影响不容忽视。本研究并没有捕捉到代谢组对环境或生理变化的动态响应,而是提供了在单一控制的年龄和饲养环境下基因组、代谢组和生物体表型之间的关系。
作者推导出的整合网络(图8,9)可视化了meQTL、eQTL、代谢物和生物体性状之间复杂的相互联系,并能够识别共调控的代谢物和多效关系。这些网络在生物学上是合理的。值得注意的是,神经和组织发育是与代谢组变异相关的丰富的基因本体论范畴,这表明发育诱导的变异在决定成人代谢组变异中起着重要作用。已有研究表明,细胞代谢在神经干细胞的分化中起着关键作用。静止的干细胞主要依靠糖酵解,而增殖的干细胞则转向脂肪生成。
虽然作者在作者的网络分析中使用了单变量相关,但作者意识到基因-基因相互作用和代谢途径的相互依赖会产生非线性关系;例如,编码激酶的多态基因使酶磷酸化可能对代谢物丰度产生间接的广泛影响。事实上,作者发现在作者的网络中发现的所有meQTL都是与代谢物相关的基因。这也反映了在基因组、转录组和蛋白质组水平上的复杂相互作用,它们最终被引导到最接近于生物体表型的代谢组。因此,代谢组可以被看作是一种将遗传变异转化为生物体表型变异的机制途径。
最后,作者的代谢物预测研究是基于40个品系的小样本量,目前认为需要更大的样本量可以提高代谢物预测的准确性。然而,作者的研究构成了一个概念,即代谢物可以很好地预测表型,即使使用一个小的集合,基于代谢物变异的表型预测也可以比仅基于遗传变异的预测产生更高的准确性。

原文网址:http://www.genome.org/cgi/doi/10.1101/gr.243030.118

(0)

相关推荐