香山科学会议 | 从“试错”走向“设计”,中国学者探索合成生物学发展新阶段
此前引起轰动的人工合成淀粉“吸粉”无数,却鲜有人了解国内外合成生物学家为此所付出的十多年“设计-合成-测试-学习”的反复“试错”历程。就从中国科学院天津工业生物技术研究所2015年着手组织这一攻关项目,至今达到实验室人工淀粉合成途径的理论能量转化效率为玉米淀粉合成实际能量转化效率7倍的水平,也是经过六年,通过三个重大的优化阶段,才获得的成就。
诚而,现在的合成生物学还类似于“手工作坊”的阶段,依靠人工反复试错、积累经验,才能制造出具有目标功能的生物元件和线路,局限于非常简单的系统,离实际“高效”应用距离还很远。在日前召开的香山科学会议上,专家认为合成生物学应从目前依赖大量“人工试错”的阶段,努力迈向可理性设计、可预测功能的新高度。为此,要建立定量理论模型指导合成生物学验证,要利用工程生物学平台,为人工智能学习积累定量数据集,一句话,就是把合成生物学推向定量合成生物学的新发展阶段。
合成生物学仍处于依赖海量“工程化试错”阶段
那么,哪个阶段才能设计出类似于计算机的复杂、严谨的合成生命系统呢?
可预测、可设计,需要学科建设发力
“预测的前提是对生命过程的'真理解’,在'真理解’基础上建立模型,设计合成,才能提高实现预期目标的效率。”赵国屏告诉科技日报记者,这将是合成生物学下一个阶段的目标。
早在2008年,赵国屏前瞻性地在中科院成立了中国第一个“合成生物学重点实验室”,而今,他认为,合成生物学应该探索走向定量合成生物学阶段。
“定量生物学的概念很早就有,现在是要理性地把定量的模型作为合成的指导,而又用合成测试来验证定量模型,这种'融合会聚’就是定量合成生物学。”赵国屏解释,这是合成生物学学科在理论架构和技术体系上的进阶。
“合成生物学的社会属性体现在回馈社会和社会关切,”张先恩说道, “通过定量合成生物学,支撑普遍实现合成生物学的目标,并最终实现理解生命机制(造物致知)和回馈人类社会(造物致用)”。
如何进行定量?得益于分子生物学、大数据、人工智能等学科的发展,与会专家提出了以人工智能机器学习为核心的“黑箱模型”与以实验为基础的维象理论构建结合工程验证的“白箱模型”两种途径。它们都指向同一目标,即用严谨的数理逻辑思维研究生物系统基本原理,用简单定量关系描述复杂生物过程。
以“黑箱”为例,与“阿尔法·狗(Alpha Go)”师出同门的“阿尔法·折叠(Alpha Fold2)”能够通过机器学习比生物学家更快解出蛋白结构。但这样的深度学习算法,需要海量的与知识图谱相关的标准化的训练数据集,利用合成生物学工程化的平台,将有可能高效产生复杂生命的重要过程或关键节点的训练数据集,供“黑箱”解读,将习得的生命法则,用于合成生物学的设计。
理解生命,才能理性设计生命。定量合成生物学试图将海量“人工试错”扭转过来。
当被问及这样的转变有什么用时,赵国屏回答:学科发展的内在任务是对自然、对生命的认知,这就是合成生物学“造物致知”的科学认知出口。另一方面,它才能从根本上解决“造物致用”的社会需求出口中的效率问题和精准问题,以支撑“卡脖子”问题的解决。这才是真研究问题,研究真问题,最后能解决实际问题。