科研│BMC Biology:整合组学揭示了基生鞭毛藻的次级代谢图谱
编译:微科盟 秦时明月,编辑:微科盟景行、江舜尧。
微科盟原创微文,欢迎转发转载。
一些鞭毛藻会引起有害藻华,释放有毒的次生代谢产物,危害海洋生态系统和人类健康。鞭毛藻的基因组异常巨大,为了克服这一挑战,研究人员首次对基生鞭毛藻的基因组、microRNAs和mRNA进行了测序,并采用整合组学方法来理解其次生代谢物的生物合成。研究人员组装了约6.4-Gb的鞭毛藻基因组,通过解码的鞭毛藻基因组和转录组,研究人员确定了非核糖体肽合成酶腺苷酸化结构域是产生特定代谢物所必需的。在细胞缺乏磷酸盐和氮的情况下,研究人员观察到代谢物生物合成的显著变化,这表明了microRNAs的转录后调节。通过Iso-Seq和RNA-seq数据,研究人员发现可变剪接和多顺反子表达为次级代谢产生不同的转录本。对基因组的研究表明各种代谢酶的复杂整合,这些酶反复作用以合成代谢物,为鞭毛藻如何根据营养物质的可获得性合成次生代谢物提供了见解。本研究为与鞭毛藻水华相关的毒素生产提供了重要参考。
论文ID
原名:Integrated omics unveil the secondary metabolic landscape of a basal dinoflagellate
译名:整合组学揭示了基础鞭毛藻的次级代谢图谱
期刊:BMC Biology
IF:6.765
发表时间:2020年10月
通讯作者:Girish Beedessee
通讯作者单位:冲绳科学技术研究所&剑桥大学
DOI号:10.1186/s12915-020-00873-6
实验设计
结果
1 基生鞭毛藻过大的基因组和基因组特征是由什么造成的?
研究人员估计,6.4-Gb的鞭毛藻基因组编码85139个基因,其中约48%在数据库中匹配(图1a,b)。估计基因组和组装基因组之间的大小差异可能是由于鞭毛藻染色体的结构造成的。基因组数据显示,除了GT和单向基因聚类之外,还包括了GC和GA(5′供体剪接位点),与其他鞭毛藻基因组一致(图1c,d)。该基因组包括约30%的重复元件,由简单重复(1.97%)、低复杂性重复(0.39%)、卫星重复(0.02%)、线性重复(0.02%)、LTR元件(0.03%)、DNA元件(0.1%)和未分类重复(27.4%)组成。丰富的重复元件可能驱动了鞭毛藻的基因组进化。对鞭毛藻内含子和外显子特征的比较分析为鞭毛藻基因组的扩展提供了额外的见解(表1)。鞭毛藻组的内含子长度约为1.7 Gb,因此内含子区域约占基因组的27%。尽管平均外显子长度在99至185个碱基之间,但鞭毛藻外显子密度最低,每个基因有8.1个外显子,而其他物种的每个基因有11.3-19.6个外显子(表1)。
为了了解鞭毛藻基因途径是否保守,利用KEGG进行途径富集分析,并与其他藻类和真核生物的基因进行比较。共有388个KEGG途径被富集,表明鞭毛藻基因组具有其他真核生物中存在的大多数途径(图1e)。Pfam分析显示富含重复亮氨酸的 (LRR)、锚蛋白、四肽重复(TPR)和五肽重复(PPR)结构域是鞭毛藻中最丰富的结构域。与真核生物相比,这些重复结构域家族在鞭毛藻中更为丰富,它们通常有助于复制事件和蛋白质相互作用。
图1.基生鞭毛藻的基因组特征。a 鞭毛藻的系统发育分析。b 鞭毛藻的透射电子显微镜分析显示了浓缩染色体的详细区域。c 非典型剪接位点显示了鞭毛藻的5′供体剪接位点。d基因定向变化证实了鞭毛藻中基因的单向排列。e鞭毛藻KEGG分析。
表1. 基生鞭毛藻基因组的统计和一些可用的鞭毛藻基因组集合。
2 NRPS腺苷酸化结构域在鞭毛藻中的多种作用
为了了解鞭毛藻次级代谢产物基因的进化和功能,研究人员对PKS和NRPS基因家族进行了系统发育分析,证实了这些基因的广泛多样性 (图2)。对NRPS腺苷酸化结构域的详细分析揭示了代谢产物是如何在鞭毛藻中产生的。NRPS腺苷酸化结构域是NRPS复合物中的第一种酶,它选择性地将氨基酸整合到天然产物以及PKS/NRPS杂合代谢物的生物合成中。腺苷酸化(A)结构域可以作为独立的蛋白质发挥作用,这与细菌基因组中已知的酶明显不同。研究人员发现鞭毛藻中独立的α结构域利用半胱氨酸、缬氨酸和苯丙氨酸作为底物(图2),而不是共生科利用的主要底物甘氨酸、色氨酸和苯丙氨酸。
甘氨酸通过桥接和形成杂交分子而结合到共生科的复杂代谢物中,如虫黄藻毒素B (ZT-B)和虫黄藻酰胺D (ZAD-D);然而,从鞭毛藻中分离出的双鞭毛藻内酯和相关的聚酮化合物都不含甘氨酸,导致分子变得更小、更简单。鞭毛藻合成聚酮化合物,在自然界中通常是多元醇。这些聚酮化合物的碳架通常由乙酸酯组装而成,极少添加甘氨酸形成杂合聚酮化合物。甘氨酸仍然是从鞭毛藻分离的代谢物中唯一的氨基酸底物,研究人员的分析表明NRPS腺苷酸化结构域独特的底物亲和力导致了鞭毛藻代谢物的复杂性。
图2. 鞭毛藻腺苷酸化结构域的亲和力显示了甘氨酸作为生物合成特定毒素次生代谢物底物的重要性。
3 次生代谢物生物合成反应依赖于营养缺乏状态
目前尚不清楚是哪些营养组合导致了毒素的形成,这促使研究人员分析营养缺乏是否会影响鞭毛藻的次生代谢。研究人员进行了转录组测序,分析了422条途径,其中“代谢途径”和“次生代谢物的生物合成”富集了1187种蛋白质。在氮饥饿条件下,只有16个次生代谢基因(PKS和NRPS)差异表达(图3a,b)。GO注释分析表明,氮饥饿对氮转运和代谢以及阴离子输出有显著影响(图3a)。钾离子通道注释证实氮代谢是上调基因中最丰富的通道,而与碳酸氢盐释放相关通道是下调基因富集最多的GO注释。饥饿状态下,鞭毛藻通过下调碳酸氢盐输出系统来调节其碳水平和氮摄入量(图3a)。总的来说,研究人员的数据表明,鞭毛藻可以调节几种形式有机和无机氮的结合和利用,以响应氮的可用性。
然而,在磷酸盐饥饿条件下,108个PKS和NRPS单基因差异表达(图3b)。GO注释显示磷酸盐饥饿上调小分子生物合成,下调阴离子释放功能 (图3a)。KEGG途径富集证实核糖体、代谢途径和次生代谢物生物合成途径是上调基因中最富集的途径。在磷酸盐饥饿期间,参与氨基酸、铵、溶解的有机磷酸盐(DOP)、金属离子和硝酸盐摄取的基因显著上调,这表明鞭毛藻可以利用各种磷源,同时下调参与碳酸氢盐输出的基因,类似于在氮饥饿期间观察到的反应。消耗ATP的糖酵解途径的关键成分(如葡萄糖激酶、甘油醛-3-磷酸脱氢酶和丙酮酸激酶)和几种核糖体蛋白被显著上调,因为它们参与ATP驱动的蛋白质合成,以满足细胞对代谢和磷酸盐摄取的需求。在两种饥饿处理中,NRPS和PKS基因表达分为两个主要聚类(图3b),表明它们是次级代谢物生物合成所需的一组共表达基因。
磷酸盐饥饿期间,鞭毛藻固碳能力增加,几个关键的质体成分(图3a)被上调,包括磷酸盐转运蛋白。这种增加可能是促进细胞过程增强所必需的,正如在细小共生藻中观察到的那样。当环境参数如光、温度、盐度和营养水平发生变化时,鞭毛藻毒素的产生就会发生变化。目前的分析表明,当鞭毛藻遭受磷饥饿时,PKS和NRPS基因被上调(图3b)。这可以从进化的角度解释,其中微藻的生长在营养限制下变慢,因为细胞会转移碳资源用于防御 (图3a)。在缺磷期间观察到的鞭毛藻光合活性的增加是一种协调的生理反应,为次生代谢物的生物合成提供必需的能量。
图3. 鞭毛藻氮磷饥饿过程中的差异表达基因。a 氮和磷饥饿期间主要差异表达基因的示意图。b PKS和NRPS基因在氮和磷饥饿条件下的表达谱。c Dicer (DCL)、HEN1和AGO蛋白的存在表明鞭毛藻中存在功能性RNAi机制,并得到基因组和转录组数据的支持。
4 营养缺乏时microRNAs对毒素生物合成的可能调控机制
基于PKS和NRPS单基因在氮饥饿条件下的低表达(图3b),研究人员分析是否可能涉及microRNAs的转录后调控。研究人员发现鞭毛藻体内RNAi机制的预期成分与以前的报告一致 (图3c)。通过分析基因组和microRNAs,在磷酸盐饥饿下,研究人员发现两个microRNAs差异表达。与对照组相比,这两种microRNAs的上调率大于18倍,表明它们在磷酸盐饥饿期间可能具有显著的作用。在磷酸盐饥饿下,这两种上调的microRNAs靶向参与果糖-甘露糖代谢、蛋白聚糖合成和N-聚糖生物合成的途径。在氮饥饿条件下,研究人员发现一个差异表达的microRNA,其有303个潜在靶基因,KEGG途径鉴定发现丙酮酸-乳酸代谢为主要靶途径 (图 3d,e)。这将直接影响乙酰辅酶a的产生,乙酰辅酶a由丙酮酸合成,丙酮酸是聚酮化合物生物合成的关键底物,从而调节次级代谢。在氮饥饿条件下没有观察到显著的PKS和NRPS基因上调,其中microRNA介导的转录后调节可能通过靶向丙酮酸生物合成影响次级代谢。
5 转录组测序揭示了PKS转录物的多样性
可变剪接是一种重要的转录后调节机制,一个基因可以产生多个mRNAs,增加其多样性和复杂性。研究人员使用rMATS 调查了五种主要的可变剪接类型,并在5417个基因中确定了6970个可变剪接事件,其中外显子跳跃是最常见的可变剪接事件(77.2%)(图4a),其次是3’端选择和5’端选择(分别为6.8%和11.3%)。利用GO注释分析了可变剪接相关的生物学过程,表明离子转运、核酸代谢和RNA代谢过程是最丰富的过程 (图4b)。随后,研究人员评估了可变剪接事件是否与PKS基因相关。全基因组水平的可变剪接图谱分析揭示了一个PKS基因(g70808),它经历了两个可变剪接事件,3’端选择和外显子跳跃(图4c)。通过差异外显子使用分析,研究人员发现1个外显子在氮缺乏期间差异表达。
为了了解可变剪接如何对多功能聚酮化合物合酶异构体做出贡献,研究人员进行了Pacbio Isoform测序,并分析了几个包含除酰基转移酶结构域(AT)以外的所有PKS结构域的转录物,表明了这些酶的反式作用性质。AT基因确实是反式作用的,属于丙二酰辅酶A ACP转移酶家族,对丙二酰辅酶a链延长有贡献。通过在鞭毛藻基因组上绘制这些同种型,研究人员鉴定了跨越多个基因的PKS多顺反子转录本(图4d)。基于基因组中存在多个PKS基因及其预测的信号肽,研究人员分析了这些蛋白质是否位于细胞内。酮合酶和酮还原酶蛋白的免疫荧光定位显示它们位于线粒体、叶绿体和分泌体中。此外,研究人员在膜泡中检测到PKS蛋白,表明其可能有新的功能。通过结合不同的测序技术,研究人员检测了多顺反子PKS转录物,以及PKS基因中的可变剪接事件,加深了研究人员对鞭毛藻次生代谢的理解。基于Iso-Seq,研究人员研究了次级代谢物生物合成基因是否在其5’端含有拼接前导序列。在鞭毛藻中,基因转录后被认为需要SL序列的反式剪接。研究人员找到了548个包含原始序列和残留原始标签的序列,但是没有包含PKS转录本。这可能是由于转录物降解或在这些转录物的5’末端缺乏SL序列。
图4.可变剪接同种型和PKS基因多顺反子在鞭毛藻中的表达。a 可变剪接事件及其频率。b GO注释生物学过程显示所有经历可变剪接的基因显著富集。c 酮合酶基因(g70808)上鉴定出3’端选择(i)和外显子跳跃(ii)。d三个单向排列的PKS基因和跨越这些基因的多个多顺反子转录本。
6 鞭毛藻次级代谢产物的重复生物合成
聚酮化合物的生物合成类似于脂肪酸,由乙酰辅酶a引发,在一系列与丙二酰辅酶a的克莱森酯缩合反应中延伸,并在达到所需长度时终止。聚酮化合物的生物合成需要所有所需基因聚合成簇,但是对鞭毛藻基因组的研究表明, PKS基因簇并不存在。每个酮合酶都为一个不断增长的聚酮化合物链贡献两个碳,因此一个26元聚酮化合物至少需要12轮碳加成,这意味着鞭毛藻中不存在这样一个长簇。因此,鞭毛藻次生代谢物的生物合成可以以两种方式发生:(1)单功能的、分离的PKS蛋白形成酶复合物,并反复催化底物的添加;(2)多功能的小PKS蛋白在许多循环中利用底物,产生由重复结构域稳定的产物,该重复结构域有助于这种蛋白-蛋白相互作用(图5)。这两种策略都类似于通过水平基因转移获得的细菌和真菌系统的重复单功能和多功能PKSs。考虑到次生代谢基因在代谢物生物合成过程中趋向于共表达,鞭毛藻中这两种共存策略之间的相互作用可能是由反式酰基转移酶和NRPS结构域介导的(图3b)。
图5.基于基因组的鞭毛藻次生代谢过程。
结论
在这项研究中,研究人员应用整合组学方法来了解鞭毛藻次生代谢物的生物合成。为此,研究人员对鞭毛藻的基因组进行了测序,并确定了调节次生代谢物水平和结构多样性的关键特征。microRNAs介导的转录后调节的目标是初级丙酮酸代谢,随后影响次级代谢。这项研究阐明了鞭毛藻次生代谢中涉及的关键分子事件,促进了HAB形成和相关毒素产生的研究。鞭毛藻基因组的高通量测序不仅有助于理解毒素合成次级代谢基因,而且有助于更好地了解其基因组结构。本研究提供了鞭毛藻生物合成和进化的重要线索。