科研 | Trends Microbiol.:丙酮丁醇梭菌的代谢分析及菌株设计的系统生物学研究趋势
编译:Winifred,编辑:小白、江舜尧。
原创微文,欢迎转发转载。
丙酮丁醇梭菌作为一种非常有应用前景的生物燃料及大宗化学品的生产者,在全球范围内引起了研究人员的关注。为了开发大宗化学品代谢工程生产的商业方法,对丙酮丁醇梭菌的初级代谢及其代谢调控过程进行解析显得尤为重要。因此,本文回顾了丙酮丁醇梭菌的组学研究进展,总结了定量/综合组学方法在该菌的生理分析和代谢工程中的最新应用,为丙酮丁醇梭菌在该领域的研究奠定了理论基础。
论文ID
内容
1. 燃料和化学品生产
随着大气中二氧化碳含量的提高和石油资源的日益昂贵,使用可再生资源生产燃料及大宗化学产品成为一种新的趋势。目前,生物乙醇作为一种替代燃料已在全球市场进行商业化生产,但由于其能量含量低,与柴油混溶性低,与汽油的混合速率有限,以及具有高挥发性和高腐蚀性等特性,暂时无法满足人们对理想燃料的要求。而高级生物燃料如C3–C5醇则可避免当前乙醇燃料所面临的问题,成为理想的汽油替代品。
丙酮丁醇梭菌是工业大宗化学品如丁醇、丙酮和丁酸的天然生产者。然而,直接使用该菌生产化学品不仅产量较低、下游生产成本较高,而且这些化学产品的产生本身对细菌也有较大毒性。因此,为了促使丙酮丁醇梭菌更高效生产化学品,发酵出高纯度的C2–C3–C4醇混合物,研究者们正在付出大量努力对丙酮丁醇梭菌进行设计和改造。
近些年,已经有研究者使用系统生物学方法对丙酮丁醇梭菌菌株进行了合理的工程设计,并开发了一种连续工艺来生产具有高收率、高效价和高生产率的正丁醇,使正丁醇的生产更经济划算。此外,重组丙酮丁醇梭菌菌株还可用于生产其他工业化学品,例如1,3-丙二醇,2,3-丁二醇和丁酸酯等。为了合理地设计细菌,研究者们采用了多种系统生物学方法及合成生物学工具。
因此,本文作者对该领域的研究进展进行了综述,阐述了基因组规模的代谢模型、转录组学、蛋白质组学和代谢组学/流体动力学,以及它们用于开发丙酮丁醇梭菌菌株以生产大宗化学品以及不同突变体的完整生理学表征。
2. 基因组规模的代谢重建
在分批培养中,丙酮丁醇梭菌表现出两相行为:在酸生成阶段,丙酮丁醇梭菌会产生乙酸和丁酸等酸性物质,这降低了培养基的pH值,并迫使细菌转移到溶剂生成相中,在该相中生产出的酸被重新吸收,并生成为丙酮,乙醇和丁醇等溶剂(图1,图I框1)。此外,在磷酸盐限制的恒温培养中,丙酮丁醇梭菌可以保持三种稳定的生理状态(与氮或Mg2+限制培养相反,该培养状态下没有菌株退化):(i)酸生成状态(生成乙酸和丁酸),(ii)溶剂生成状态(生成丙酮,丁醇和乙醇)以及(iii)醇生成状态(生成丁醇和乙醇,但不生成丙酮)。基因组规模的代谢重建提供了高度精确的结构化平台,可在此平台上了解微生物体内代谢途径的系统生物学。
图I框1 分批培养中丙酮丁醇梭菌的生长、产物形成和细胞分化
丙酮丁醇梭菌在分批培养中的生长发生在三个不同的生长阶段,酸和大部分生物量在指数生长期产生,酸的积累会降低pH值,从而抑制细胞生长,从而导致细胞进入固定相。在过渡到固定相期间触发了溶剂生成,然后将酸部分重新吸收,并以3:6:1的比例生成丙酮,丁醇和乙醇(ABE溶剂)。在固定相结束时,发生丙酮丁醇梭菌的孢子形成和裂解,当前的任何GSM中都不包括分批发酵过程中的生物质组成变化。
生化代谢途径与基因组序列的整合带来了基因组规模代谢模型(GSM)的发展,简单地说,这些模型将代谢基因与代谢途径相关联,可用于目标生物的有关生理学、生物化学和遗传学的研究,且信息越多重构模型的预测能力就越好。
目前可供研究者使用的乙酰丁酸梭菌GSM的层次结构越来越详细,研究者们还可以使用最新更新的注释来添加新的代谢功能并逐步完善这些模型。最新的GSMiCac967模型虽然已进行实验验证,但与之前的GSMiCac802模型相比,GSMiCac967模型所包含的总体反应较少,且总体反应往往没有充分的文献或实验依据,比如基于丙酮丁醇梭菌严格厌氧特性的好氧反应。在iCac967模型中,新的或校正的反应包括:通过通过双歧丁酰辅酶A脱氢酶进行的反应;通过NADPH依赖性丁醇脱氢酶BdhA,BdhB和BdhC进行的反应;通过NADH依赖性谷氨酸脱氢酶进行的反应;通过苹果酸脱氢酶进行的反应;通过铁氧还蛋白NADP +还原酶进行的反应。
最新的GSM iCac802和iCac967,可依据碳吸收的变化捕获到了培养中的双相行为。无论是从酸生成阶段向溶剂生成的转变,还是该转变导致的微生物孢子的形成,均影响了生物质(蛋白质组和代谢组)的组成,但是目前还没有任何GSM可以解决该现象。另一方面,在以相同的特定生长速率(即0.05h-1的稀释速率)进行的磷酸盐限制的恒化培养中,生物量组成显示相对恒定,不论新陈代谢的类型(产酸,产溶剂或产醇)如何,都可以提高通量分布计算的准确性(图I框2)。
图I框2 在磷酸盐限制、不同的生理状态下,以恒定的特定生长速率生长丙酮丁醇梭菌的实验装置的示意图
丙酮丁醇梭菌可以在磷酸盐限制下连续培养,并以三个稳定的代谢状态维持:产酸,涉及在葡萄糖中性pH的生长过程中酸的产生;溶剂生成,涉及在低pH条件下葡萄糖生长期间产生ABE溶剂;以及酒精生成,其中包括在NAD(P)H可获得性高的条件下,在中性pH下生长期间生成乙醇和丁醇,而不生成丙酮。在相同的特定生长速率下进行的稳态连续培养(避免与分批培养中观察到的特定生长速率的变化相关的所有变化)可提供均质细胞(图I)和相对恒定的生物量组成,这对于获得准确的定量转录组学,蛋白质组学,代谢组学和通量数据。可以表征转录起始位点(TSS),转录后加工位点(PSS)和新的调节剂,而绝对蛋白合成率,碳和电子通量以及酶转换率可以在全基因组水平上进行测量。
虽然GSM可以帮助确定生物体的代谢潜力,但是在各种条件下确定代谢表型还需要结合其他信息,例如转录组学或蛋白质组学的数据。尤其是转录组学,需要获取基因组最完整的数据集。结合转录拓扑数据,iCac802的作者建立了一种称为CoreReg的方法。CoreReg根据基因表达的倍数变化修改了反应的通量范围,这是在丁酸和丁醇胁迫条件下通过实验观察到的。
图1 丙酮丁醇梭菌的中心代谢
绿色框表示酸生成条件下的初级产物,而红色框表示溶剂生成条件下的初级产物。红色的斜体字母表示相应的基因。缩写:ack,乙酸激酶;adc,乙酰乙酸脱羧酶;adhE1,醛脱氢酶;adhE2,双功能醛/醇脱氢酶;alsD,α-乙酰乳酸脱羧酶;alsS,乙酰乳酸合酶;bcd,丁酰辅酶A脱氢酶;bdh,丁醇脱氢酶;buk,丁酸激酶;crt,巴豆酶;ctfAB,CoA转移酶;etf,电子转移黄素蛋白;hbd,3-羟基丁酰辅酶A脱氢酶;hyd,氢化酶;ldh,乳酸脱氢酶;nfor,铁氧还蛋白:NAD(P)+氧化还原酶;pdc,丙酮酸脱羧酶;pfor,丙酮酸:铁氧还蛋白氧化还原酶;pta,磷酸转乙酰酶;ptb,磷酸转丁酰酶;thl,硫解酶;Fd ox代表氧化铁氧还蛋白,Fd red代表还原铁氧还蛋白。
3.转录组学、蛋白质组学和代谢组学
自2001年野生型丙酮丁醇梭菌ATCC 824的基因组测序完成以来,为了更好地该菌的非靶向和无偏见分析,研究者们已经通过各种高通量方法获得了丙酮丁醇梭菌的全基因组数据(图2)。
在早期,各种组学方法是独立使用的,但是随着组学数据的积累和最新技术的发展,科学界逐渐发展了全面的多组学方法。通过比较多组学研究(i)分析从酸生成到溶剂生成的不同代谢状态或过渡状态(在分批发酵的情况下为时间序列);(ii)分析代谢物应激,例如丁醇/丁酸酯应激;(iii)分析不同基质的使用情况;(iv)分析突变菌株与野生菌株的关键代谢;(v)分析组学方法学的发展等(表1)。
为了方便操作和管理,每次研究中都应考虑培养类型,大部分的研究采用分批培养的方法。但是分批培养方法提供的信息不够精确(特别是在溶剂生产和孢子形成的情况下),因为这些现象在分批培养时是会重叠出现的。而连续培养则可避免这些过程,同时还可保持恒定的特定生长速率(图I 框2),因此每次实验均应该充分考虑培养类型。
图2 定量系统生物学方法的综合组学分析
在稳态化学恒温器培养物中进行的组学分析之间的有机关系,括号中显示了每个水平组学的代表性研究参考编号。缩写:2-DE,二维电泳;GC,气相色谱;GSM,基因组规模的代谢模型;HPLC-MS,高效液相色谱-质谱法;LC / LC-MS / MS,二维反相液相色谱-串联质谱。
表1 丙酮丁醇梭菌的组学研究实例
3.1 转录组学
如表1中的描述,大多数研究通过DNA微阵列进行丙酮丁醇梭菌的转录组学分析。从过往的研究来看,E.T.Papoutsakis的研究团队于2003年发表了关于丙酮丁醇梭菌的第一个转录组学研究,并基于微阵列分析进行了七项开创性研究。在早期,只有这个研究小组和由G.N.Bennett领导的研究团队发表了使用微阵列的转录组学研究成果,仅在2010年以后才看到微阵列技术在丙酮丁醇梭菌研究中的广泛应用。2015年,本人作者坐在的研究团队通过量化所有3916个开放阅读框(ORF)(即染色体上的3738个ORF和178个ORF)上每个细胞的mRNA绝对量,突破了该技术的极限。
尽管早期的DNA微阵列研究仅涵盖部分基因组,并且仅提供相对有限的信息,但是这些大规模分析推动了对孢子形成与丁醇胁迫相关的代谢网络的全球转录调控的研究。此外,最近的研究重新审视了一些转录组学数据,并与其他组学数据相关联,如代谢组学研究重新审视了丙酮丁醇梭菌的最初转录组学研究。相关代谢产物的变化数据显示三羧酸(TCA)循环代谢物和相关的TCA循环酶编码基因之间有很好的一致性,但是在某些氨基酸途径上存在分歧,这意味可能出现了转录后水平的调控。
迄今为止,丙酮丁醇梭菌转录组研究中使用RNA测序(RNA-seq)的研究较少。目前仅出现了五篇使用丙酮丁醇梭菌RNA seq数据的出版物。第一份研究由E.T.Papoutsakis的团队于2013年发布,研究了159种小的非编码RNA(sRNA)对代谢物应激作出反应的机制。
2002年,研究者首次进行了丙酮丁醇梭菌的“系统级”蛋白质组学研究,当时仅通过二维电泳(2-DE)分析了130种蛋白质,用以比较产酸和产溶剂的化学恒温培养液。当时,尚无丙酮丁醇梭菌的其他组学数据。随后Sullivan和Bennett进行了2-DE分析,并将其数据与以前的转录组学研究的数据进行了比较,结果显示某些基因、蛋白质和转录水平无相关性,表明丙酮丁醇梭菌中可能存在复杂的调控机制。为了对丙酮丁醇梭菌进行定量蛋白质组学分析,同时基于定性双色微阵列和RNA-seq分析,重新回顾了以前的转录组学研究。
与高通量系统生物学方法相比,化学恒温器培养具有许多优势(图I框2)。因此,在许多大规模的研究中,通常选择化学恒温器作为栽培系统,以提供合理可靠的数据。稳态条件下,丙酮丁醇梭菌的首次组学研究于2010年发表,在这项研究中,定性的双色芯片和2-DE被用来分析酸发生和溶剂生成。在稳态条件下发现了包含CA_P0036-37的操纵子的显着产酸特异性表达,该表达在先前的批处理条件研究中并没有被发现。
最初的定量系统生物学研究是通过在产酸,产溶剂或产醇条件下,但始终以相同的比生长速率生长于化学恒温培养物中的丙酮丁醇梭菌进行。所有细胞的mRNA分子数量(使用定量单色微阵列)和每个细胞的蛋白质分子数量被确定并与通量分析的结果相关联。结果观察到大量基因每个细胞的mRNA分子少于0.2,这表明存在不同细胞之间表达的异质性,或存在高mRNA降解率。该研究作者未在进一步分析中排除在所有条件下显示每个细胞<0.2mRNA分子的基因。研究者同时观察到每个细胞的mRNA分子数量与蛋白质分子数量之间的线性关系,而与代谢状态无关。
同位素示踪剂的使用(主要是13C标记)有助于增进我们对丙酮丁醇梭菌代谢的了解。研究人员通过使用13C标记的底物,证明了TCA循环的分叉。M.R. Antoniewicz等人通过平行标记实验分别使用均匀标记的(U-13C)和1-13C底物发表了另一组代谢组学研究,这增加了高分辨率定量13C代谢通量分析(13C-MFA)中冗余测量的数量,揭示了有关TCA循环的新发现,如发现(i)α-酮戊二酸和琥珀酰-CoA /琥珀酸与(ii)富马酸/苹果酸和草酰乙酸之间没有明显的通量,以及存在从丙酮酸到天冬氨酸通过丙酮酸转化为富马酸的活性途径。此外,J.DRabinowitz等人揭示了碳和电子的重定向(因为在溶剂生成中特别活跃的酒精生产途径需要消耗NAD(P)H(图1))通量是由于代谢状态从酸生成转变为溶剂生成的缘故。
4. 生理学研究和代谢工程学中的定量组学方法
转录组学、蛋白质组学、代谢组学和通量组学已分别用于阐明丙酮丁醇梭菌代谢的重要特征以及基因调控的相互依赖性(图2)。完整的组学数据还以多种方式提供了对丙酮丁醇梭菌生理学的全面见解,包括通过鉴定产酸、产溶剂和产醇代谢途径;代谢从酸发生转变为溶剂发生;丁醇和丁酸胁迫的影响;孢子形成和生物膜形成。本节重点介绍了定量/整合组学方法在生理研究和丙酮丁醇梭菌代谢工程中的应用。
一些研究集中于产酸、产溶剂或产醇条件下稳态化学恒温器培养物中丙酮丁醇梭菌的生理分析,这些研究通过分析定量转录组学、蛋白质组学、通量组学和生化数据,阐明了参与两步丁醇途径的五种酶(AdhE1,AdhE2,BdhA,BdhB和BdhC)的活性分布(图1)。在成溶剂条件下,第一步主要由AdhE1的NADH依赖性醛脱氢酶活性进行,而第二步由BdhB的NADPH依赖性醇脱氢酶活性进行。其次,在致醇条件下,AdhE2负责NADH依赖的醛和醇脱氢酶的活性。当缺失adhE1时,adhE2在致溶剂条件下表达,AdhE2可以代替AdhE1催化丁酰CoA向丁醛的转化。
相反,当adhE2缺失时,AdhE1在任何新陈代谢条件下都无法替代AdhE2。使用相同的方法也阐明了两个同源的buk(或buk1)和buk2基因的作用。据报道,Buk是主要的丁酸激酶。此外,如果不破坏ptb基因,就无法实现buk的缺失,这很可能是由于磷酸丁酯积累的毒性所致(图1)。有趣的是,在所有稳态代谢条件下,DbukDptb突变体均高度表达了AdhE2,丁醇的收率很高,而乳酸是酒精生成的主要产物。Nguyen等人使用类似的方法对中枢新陈代谢的整体调节剂CA_P0037进行了表征。当CA_P0037中断时,酸生成和酒精生成的代谢通量发生了显着变化。酸(乳酸,乙酸和丁酸)是酒精生成的主要产物,而丁醇和乳酸的水平在酸生成中增加。这些行为与定量的转录组和蛋白质组学特征一致。
关于丁醇胁迫下丙酮丁醇梭菌的行为研究已有不少,但大多仅使用转录组数据,或结合蛋白质组学和通量组学的数据进行了研究(表1)。除了对丙酮丁醇梭菌的生理研究之外,代谢组学比较还帮助发现了两种新的聚酮化合物,即梭菌烯酸和梭菌糖。研究还表明,如果没有这些聚酮化合物参与孢子形成,碳水化合物转运和代谢的基因的表达就会下调。
代谢工程领域的目的是构建高产量、高生产率和高选择性的菌株。为了达到这个目的,通常通过数学模型用于预测、提出和表征所有新突变体的代谢途径。而大多数突变体的开发都没有数学和综合系统的支持。因此本文作者回顾了借助组学集成系统构建的一些成功的突变体。S.Y.Lee研究团队的研究表示,通过分析代谢流同时破坏乙酸盐和丁酸盐的形成途径,并过表达adhE1D485G,可以改善从乙酰辅酶A和丁酰辅酶A到丁醇的直接途径(图1)。因此,在分批培养条件下可获得丁醇的高收率(最大理论收率的76%)(图3A)。
图3 基于组学的乙酰丁酸梭菌代谢工程
根据本文作者所在团队的两项研究显示:(i)丙酮丁醇梭菌可以使用甘油,并在葡萄糖有限的恒化器培养物中将大部分电子通量从氢转移为醇形成,(ii)丁酸梭菌使用一种新的途径(一种不依赖B12的甘油脱水酶)从甘油生产1,3-丙二醇的方法,研究人员设计了一个丙酮丁醇梭菌突变体,该突变体可连续生产1,3-丙二醇,并具有高产率,高滴度和高生产率(图3B)。
Liu等研究人员在定性蛋白质组学分析中引入了NADH补偿模块,该模块可触发突变体产生2,3-丁二醇并同时消除丙酮的产生。随后观察到丙酮通路编码基因的显着下调和adhE2的高表达,这与上面提到的其他高降低功率状态下获得的结果非常相似(图3C)。
关于最近的一项研究,研究人员对丙酮丁醇梭菌突变体进行了改造,使其能够以很高的产率和很高的选择性和生产率连续生产正丁醇。通过使用GSM iCac967进行通量组学分析并准确计算所有电子通量,此外使用转录组学、蛋白质组学和通量组学指导了简单的工程设计。该菌株包含多个缺失,包括编码竞争途径的基因,例如丁酸形成(DptbDbuk),乳酸形成(Dldh),丙酮形成(DctfAB),以及氧化还原感应转录调节子(DrexA)。已知可以抑制参与C4形成途径的基因(thlA,crt-bcd-etfAB-hbd和adhE2)。除了这些缺失外,基因取代DthlA :: atoB和Dhbd :: hbd1还提供了具有改进特性的酶,这些酶可通过利用高NADPH / NADP +比例有效地将碳通量倾向于丁醇的形成。该方法获得的菌株以可以最大理论产率的83%产生丁醇(图3D)。
讨论
当在化学稳态培养中进行实验时,现在改进的GSM与定量转录组和蛋白质组数据结合使用,可以获取准确的通量数据。这些组学数据可用来(i)确定碳和电子通量的分布;(ii)阐明参与丙酮丁醇梭菌初级代谢的不同基因/酶;(iii)更好地了解丙酮丁醇梭菌的调控代谢;(iv)几种代谢突变体的生理特征;(v)构建可高产正丁醇的代谢工程菌株。
随着定量蛋白质组数据的可用性增加(每个细胞的蛋白质分子的数量),并且在基因组级别上已知每个酶的通量,现在已经有可能获得丙酮丁酸梭菌中每一种代谢酶的最大体内代谢率。这些数据对于开发丙酮丁酸梭菌的ME模型十分有用,该模型将代谢过程与蛋白表达和蛋白组分配约束相结合,可用来预测细胞内的分子组成,也可用来解释目前仍让科学家们头疼的或者需要诉诸现象学关系的细胞行为。