生物信息的未来:人工智能与合成生物学的交叉融合

编者按:

2020年,澳大利亚研究人员在EMBO Reports发文指出,生命科学与信息科学融合产生的未来场景,可被看作生物信息的未来。文章分析了代表合成生物学和人工智能融合领域的生物铸造厂,其融合发展带来的重大政策挑战,以及基因组编写计划(GP Write)和国际合成生物设施联盟(GBA)为此而做的一些努力。

生物铸造厂(Biofoundries)作为合成生物学和人工智能交叉融合的代表领域,为大规模合成生物的制造提供了平台。这不仅会为棘手的政策问题提供新的解决方案,而且生物铸造厂还可能对社会产生重大影响。生命科学与信息科学融合产生的未来场景是生物信息的未来。未来,当合成生物学应用实现商业化,公众对相关的政府和研究机构日益了解,将对变革潜能的认识和评估具有重要意义。科学家、技术人员、从业人员和决策者需要与生物铸造厂运营商和公众密切合作,共同塑造和引导生物信息的美好未来。

1  生物铸造厂

基因组铸造厂或生物铸造厂在高度自动化的设计-构建-测试-学习工作流程中,通过高通量模块化的实验室设备,设计和构建用于研究和生物技术的基因重组生物体,例如麻省理工学院铸造厂、银杏生物工厂、Amyris和伦敦生物铸造厂等学术机构和工业生物铸造厂。这些生物铸造厂可以作为单站点或全球集成实验室提供解决方案,其中每个站点都在工业或研究流程中发挥作用。一般来说,生物铸造厂不是根据它们的位置、使用的设备或生成的数据来分类,而是根据它们实现工程生物系统目标的自动化工作流程。

本文围绕生物铸造厂中合成生物学和人工智能整合框架的五个政策挑战:健康人群(Healthy People)、繁荣经济(Prosperous Economies)、弹性社会(Resilient Societies)、安全星球(a Secure Planet)和创新技术(Innovative Technologies)(图1)。“健康人群”领域关注健康结果、综合保健与健康的研究;“弹性社会”由能够加强伦理、公正和包容的社区创新组成;“繁荣经济和安全星球”的领域概括了生物铸造厂以可持续方式提高经济生产力并促进繁荣的能力;“创新技术”是指能够使合成生物学和人工智能进一步发展的技术、系统、设计和实践等。

图1  目前的重大挑战

2  生物铸造厂的融合

合成生物学和人工智能两个领域的技术在生物铸造厂中自然而然地结合。合成生物学中使用的设计-构建-测试学习周期非常适合机器学习(图2),具有良好表征的生物体非常适合人工智能的整合。例如,酿酒酵母是研究和工业的标准模式生物,具有几乎无限的新陈代谢设计空间以及更小的解决方案空间。解决方案空间中特定设计的质量检查是人工智能非常擅长的领域。目前,生物铸造厂工艺还是需要人们进行创造和评估的设计工作流程,但将来越来越多的生物铸造厂在设计-建造-测试-学习周期的每个环节都可以通过人工智能来实现。

图2  合成生物学与人工智能在生物铸造厂的融合

使用人工智能的最终目标是基于先前学习周期的自动化设计。合成生物学的设计和解决方案空间超出了人类的理解能力,人工智能能将这些空间降低到人可以进行有效生产和测试的规模。此外,人工智能还可以抵消人类设计师的认知偏差。通过在部署前标记次优流程,对组装过程产生积极的反馈。例如,微软的Station B就是一个人工智能实验室,Codexis和Zymergen也能通过专利软件和人工智能来设计新型蛋白质。通过人工智能,能够进行具有自动设计改变的多重测试周期,还可以及时调整设计方案,并进一步减少人类的工作。

因此,在最复杂的生物铸造厂中,人类已经从重复的工作流程中解放出来。减少设计生物铸造厂过程花费的时间,将更多的时间用于设计项目目标,例如,Synthace设计的Riffyn、Benchling和Antha等。目前,“人在循环中(human-in-the-loop)”的方法正在向“人在循环上(human-on-the-loop)”的方法过渡,在特定情况下,还会有“人在循环外(human-out-of-the-loop)”的方法。十多年来,企业已经在推动这种转变,例如,利用专有算法的专有数据创造价值。如果把合成生物学广义地定义为生物的工程化,那么生物信息也可以广义地定义为生物信息管理工程。从这个意义上,它不同于生物信息学,不仅是因为对现实世界中有机体的特性认识不同。相反,它是关于利用信息体系结构设计、创建和部署真实世界场景的新型生物设备。

3  迎接重大挑战

作为一种平台技术和科学实践模式,合成生物学已经解决了诸如合成青蒿素和生物燃料等所带来的经济和政治挑战,未来或将带来农业和新疗法的变革。几千年前,酵母的驯化从根本上改变了社会,珍妮纺纱机预示着工业化的到来,同样,工程生物学代表了农业和工业的新变化。合成生物学是基因水平生命科学的工业化。未来生命科学实验室的区别不在于用什么工具,而在于它们的使用方式以及它们的用途。生物铸造厂正在以变革的方式重塑生产力,而不仅仅是产量略有增加或成本略有下降的方式。

在健康人群领域,合成生物学正在癌症治疗、疫苗和镇痛剂生产以及基因治疗方面取得进展;在安全星球领域,合成生物学开发了新的作物品种,可以开发监测环境的生物传感器,合成生物学正在进行的人工光合作用研究作为可持续能源的来源可能将具有革命性意义;保护和促进弹性社会的挑战决定了需要不断地与公众接触,从而确保实现信息双向流动的稳定科学信息沟通框架。创新技术的部署或将带来新挑战。所用技术的广度与带有共同负面含义的词汇“合成”在一起,已经被更通用的术语“生物工程学”所采纳。事实上,在推广来自合成生物学的消费品时所使用的语言通常是“生物学的衍生”。

随着合成生物学不断发展,这门学科需要与公众进行包容性合作。这里有三个部分:描述生物设备和合成生物学过程的语言、用于让不同公众参与合成生物学伦理和发展的语言、与从根本上反对合成生物学的利益相关者接触时使用的语言。过度依赖计算机和工程隐喻也许只会在实践者和反对者间建立更高的障碍。如果合成生物学的语言能够与对立的话语接触并从中汲取经验,那么它更有可能在几十年内维持和持续发展这门学科。

最后,所有这些重大挑战领域都与繁荣经济的概念框架紧密联系。一方面,合成生物学的商业模式和价值主张或将引起世界的极不公平,资源进一步集中在少数人手中。另一方面,它可以显著提高全球平等。合作商业生态系统的一部分和循环经济的发展可以实现经济价值平等分配。以合成生物学为基础的农业改革有可能导致当前以传统模式集中领导和治理的跨国农业公司的分裂。开发能将废物转化为可回收物和原料的微生物菌株只是合成生物学实现循环经济的案例之一。如果世界各地的小规模农场主都能建造将农业废物转化为高价值化学品发酵罐,就可能颠覆传统的治理模式和商业模式。然而,国家、法律体系、研究人员和公司对待遗传信息资源的方式将是决定这条路径的主要因素。

合成生物学不仅为解决棘手问题提供了新的思路,而且为各国政府带来了新的担忧。到目前为止,社区正在积极解决这些问题。展望未来,毫无疑问,负责任的创新需要为生物铸造厂的新的运作方式奠定基础。

4  效益和影响

商业生物信息平台在遗传信息的创造、管理和保管过程中产生了阶段性变化。与世界各地人工智能伦理框架的发展相似,各国也需要考虑开发合成生物学伦理框架。

另一个复杂性是伦理状态随时间的变化。如果全球科学界或商业界共同定义一个合成生物学伦理框架,则它需要适应和进化的机制,这与实施人工智能的公司需要采用何种方式将预警社会期望变化的机制联系相类似。新兴技术定期审查的伦理框架,要成为规范企业开发和部署、面临风险的产品的准则。另外,在监控和监管方面,实现生物信息的真实世界时,之前的机制也可能行不通。

由国际基因合成联盟(IGSC)主导的毒素或病原体基因序列的筛选要求便是其中之一。然而,并不是所有合成公司都是该联盟的一部分;此外,只能对已知有滥用潜力的基因序列进行筛选。需要一系列多层次的安全协议保证更高的筛查效率。所有合成公司都必须参与并积极推广此类协议,秘密共享新发现的“两用性”元件。合作将确保所有参与者都能在进行开放国际生物铸造厂交流的同时,对彼此的活动保持信心,包括商业和研究,避免两用材料被无意卖给不受约束的买家。

5  基因组编写计划

基因组编写计划(GP Write)于2016年6月正式宣布,是以美国工程生物学卓越中心为基地,利用了20年来合成生物学和人工基因合成的工作,进行人类细胞系及其他具有农业和公共健康意义的生物体的整个基因组的工程。未来将要创造的能力以及这个项目的发现,在很大程度上或将影响全球公众对合成生物学的接受程度。

GPwrite项目团队对此高度重视,他们在2018年会议上就项目的伦理、法律和社会影响(ELSI)进行了陈述。律师、伦理学家、哲学家、科学家、政策和生物安全专家在早期阶段就参与其中。重要的是,GP-write从合成酵母项目中获得灵感并借鉴其伦理和管理声明。这一声明承认自我管理具有重要意义,科学家所进行的研究可以不断地评估和识别需关注问题,也可以促进机构和政府的相互监督。

GP-write致力于将细胞系中大型基因组工程和测试成本在10年内降低1000倍以上。在生物铸造厂中使用人工智能对实现这一目标至关重要。与其他项目相比,GP-write可能需要更多的工作来定义人类生活的解决方案以及可能导致的令人不安的事件,而不是人类模型与其他生命的相似性。尤其是GP-write将对生物铸造厂中合成生物学及人工智能与人类基因组信息的相互作用产生很大影响。确定人类基因组有多少解决方案是开放的研究问题,因为工程学是依赖全球伦理标准的社会问题。GP-write的活动及其衍生的技术可能迫使国家和国际监管机构面对社会、伦理和文化等相关问题。

因此,GP-write必须进行国际合作,其长期后果无法与其他探索式科学和商业项目相提并论,因为GP write可能会潜在划分为模式人体生物的解决方案和监管。在合成生物学和人工智能环境下,人类遗传数据的利用及再利用具有重大价值,包括具有健康、生活方式、社会地位等离线和在线数字的相关遗传信息。GP-write的发现可能上升到用于增强健康和访问生活方式数据的另一层次。

在繁荣经济、弹性社会、安全星球、健康人群和创新技术领域,参考对象始终是人。如果GP write的衍生技术能够使人类活得更长更健康,对地球上有限资源的相关性意味着什么?对全球经济体意味着什么?谁将从这些衍生技术中获取经济利益,它们将如何分配、以何种成本分配给谁?知道如何在生物信息世界中驾驭这些相互竞争的利益,这是GP-write未来需要面对的挑战。

6  国际合成生物设施联盟

考虑到这些情况,2019年5月成立的国际合成生物设施联盟(Global Biofoundry Alliance,GBA)将成为一个交流信息、制定标准及共同瞄准重大项目的国际中心。该联盟将成为制定和编纂国际准则的重要推动者。

当然,这些准则包括现实世界和数字世界的物质转移协议,以实现与模拟天文学平方公里阵列(SKA)的生物铸造厂合作。在SKA和GBA中,可以建立分散的实体基础设施,该设施由跨多个大洲的模块化部件构建,并通过高容量数据传输实现。GBA工作组是在领域内制定和协调国际标准的先行者,尤其是下一代生物铸造厂技术人员的教学和培训。正是在这个国际合成生物设施联盟的网络中,农业工业时代演变为生物信息时代。它们还将为不可预见的全球流行病或生物安全事件提供最先进的准备和应对措施。

自1975年亚洲会议以来,自我管理一直是生命科学领域的一项重要工作。随着生物信息时代的到来,并面向非技术性公众,自我管理的重要性前所未有。在协调一致的国际ELSI框架内,协调一致的解决问题需要成为这个新时代的特征。繁荣经济、弹性社会、安全星球、健康人群及创新技术的重大挑战是没有边界的。正因如此,人们更需要考虑,在合成生物学和人工智能不断交叉融合的发展中,生物信息未来分支的可能性。

(0)

相关推荐