逆合成AI—化学制药工艺学6
1 逆合成AI与计算机辅助药物合成软件的区别
之前介绍的计算机辅助药物合成软件如Chematica与逆合成AI的最大区别就是自我学习能力。Chematica没有自我学习能力,化学家需要手动输入有机分子、化学反应和合成规则,这样 Chematica才能基于此模仿人类化学家的思维方式进行工作。因此它不会创造新的有机反应,更不会完全代替人类,只是帮助化学家在合成某个目标分子时节约时间和金钱。逆合成AI则不需要化学家输入任何规则,只是基于已经报道的单步反应即可自行学习化学转化规则,并进行快速、高效的逆合成分析。理论上,它会像人类一样进行选择和判断,可以基于人类已有的经验和策略,自行创造新的策略实现合成目标分子的合成。
2018年上海大学的Mark Waller教授和德国明斯特大学的MarwinSegler博士等人在Nature 杂志报道了一款可以通过自主学习有机反应来设计分子合成路线的人工智能(AI)新工具(Nature,DOI: 10.1038/nature25978)。合成化学开始进入AI时代!(PS: 如果你既懂有机化学又懂AI,那么恭喜你!你已经赢在起跑线上了!)。
研究者通过先前设计的一个泛化性质够好,能够对所有分子进行单步逆合成分析的深度神经网络,然后从Reaxys数据库中自动提取出合成规则,经过选择,仅保留其中在反应中重复出现超过一定次数的“高质量”规则。随后,他们使用深度神经网络与蒙特卡洛树搜索(MonteCarlo tree search,MCTS)结合形成新的AI算法(3N-MCTS),依靠自动提取的规则数据进行训练和深度学习。
2 深度神经网络工作原理(deep neural networks)
这个用来对任意分子做单步逆合成分析的深度神经网路就是 Expansion policy network,来自于同样的几位作者于 2017发表的论文Neural‐Symbolic Machine Learning for Retrosynthesis and Reaction Prediction 中(Chem.Eur. J. DOI: 10.1002/chem.201605499)。
深度神经网络的工作机制如上图所示(以化合物1为例),首先网络对化合物1进行分子指纹化(即将分子结构式数字化),然后以ECFP4为指纹输入网络,输出是一个经由网络检索和分析后最可能的反应规则,最后将这些反应规则使用于原分子来得到逆合成的产物。
3 蒙特卡洛树搜索与逆合成分析
蒙特卡洛树搜索在逆合成分析中的应用
蒙特卡洛树搜索(MCTS)是一种用于某些决策过程的启发式搜索算法,最引人注目的是在游戏中的使用,一个主要例子是电脑围棋程序AlphaGo。研究者发现蒙特卡洛树搜索与化学家的逆合成分析有异曲同工之处。我们可以将上图搜索树中的两端的节点看成是产物(A)和原料(D),其他节点则是合成子的集合。在逆合成中,搜索树可以通过“向后工作”,递归分析分子和将它们转化为更简单的前体,直到获得一组已知或可商购的有机分子。因此理论上可以用蒙特卡洛树搜索结合深度神经网络代替化学家完成逆合成分析。
4 蒙特卡洛树搜索进行合成路线分析的原理
(1) 选择。在第一个3N-MCTS阶段中,从根节点开始(目标分子)的搜索树,算法按顺序选择树中最有前途的下一个位置,直到达到下一个节点(图a)。该算法平衡了高价值的选择节点和未开发节点。如果访问叶节点第一次,由发布直接评估。如果访问了第二次,通过扩展策略通过处理进行扩展。
(2) 扩展(该过程需要借助深度神经网络图b,目标是找到可能的反应物)。通过应用扩展程序确定的最可能的转换决定了当前位置的后续位置。预测的跟进位置将添加到搜索树节点的子代,即是最有前途的合成路线。
(3) 推进。该阶段目标就是对反应物进行更深的探索,即“快速的通过模拟来看看这些个反应物到底好不好用”。
(4) 更新。该阶段是对前三个阶段工作进行总结评分,并反馈最终结果。
5 逆合成AI与化学家的异同
为了更容易说明问题,我们可以打个简单的比方。深度神经网络就像合成化学相关的教材、讲稿和参考文献(前人总结的书面材料),而蒙特卡洛树搜索就像人的自我学习、模仿思考能力。使用深度神经网络与蒙特卡洛树搜索进行训练和深度学习产生的逆合成AI,就好比人不断学习最后变成了合成化学家。不同的是,逆合成AI的学习时间短,而人的学习途径更多,而且能做的事情也更多。(PS:当然这是由于目前AI技术所限。)
6 逆合成AI与自动机器人的结合
那逆合成AI除了药物分子合成路线设计外,还可以做的更多吗?答案是肯定的。2019年《Science》发表了一篇题为“Arobotic platform for flow synthesis of organic compounds informed by AIplanning”(DOI:10.1126/science.aax1566)的论文,文章描述了一种结合AI设计合成路线和机器人执行的自动化合成平台,该方法基于美国专利和Reaxys数据库中的反应训练了人工智能算法,能够为给定分子提出合成路线,包括反应条件,并根据步骤数和预测产量评估哪条路径最佳。同时,该系统拥有一个灵活的机器人手臂,能够执行所有合成操作流程,实现自动化合成。研究人员证明该机器人平台可以成功用于15个化学小分子药物的合成路线设计和自动化合成,包括利多卡因30倍速合成过程。
7 小结
逆合成AI对于药物合成研究是开创性的,他可以大大提高药物分子的合成效率。这可以让化学家把更多的时间和精力集中在对更深层次问题的思考上,比如“该合成什么样的分子”、“为什么要合成这样的分子”,而不是“怎样合成分子”。然而电影《异形契约》中大卫对人类的反叛,对表明了现在人类对于AI发展的担忧。毕竟如果你创造一个各方面都比你强的“物种”,你觉得它会一直听从你的指挥吗?