AI技术正在突破你所不知道的医药领域
英矽智能宣布利用AI药物研发平台
发现针对肾纤维化的临床前候选药物
今年二月,业界领先的人工智能药物研发公司英矽智能宣布,利用其自主研发的人工智能平台成功发现纤维化的新靶点,并针对该靶点获得了具有前景的治疗特发性肺纤维化(IPF)的临床前候选药物。不到半年,英矽智能宣布获得了由AI发现的治疗肾纤维化的全新临床前候选化合物,达成又一个里程碑的突破。而与此前被纳入中国第一批罕见病目录的特发性肺纤维化相比,肾纤维化是一个未被满足且日益增长的医疗需求。
什么是纤维化?
纤维化(Fibrosis)不是疾病,而是多种类型组织损伤尤其是在慢性炎症性疾病过程中,组织修复反应失调的结局。简单来说,我们的身体具有强大的修复机制,可以促进伤口愈合。这是复杂的动态过程,涉及四个生理事件的紧密调控级联,包括凝血、肉芽组织形成、再上皮化和细胞外基质(ECM)重塑。在某些不利条件下,正常的伤口愈合过程可能会转为纤维化,这是一种病理过程,也称为纤维化瘢痕。当我们身体中的正常功能组织逐渐被没有功能的疤痕组织替代时,会导致器官和系统功能丧失,甚至是死亡。
数据显示,在工业化世界中,因纤维化引起的死亡人数占总死亡人数比例的45%。在各种引起纤维化的疾病,包括特发性肺纤维化、肝硬化、心血管疾病和慢性肾脏疾病等,都与年龄增长高度相关,这意味着纤维化不仅是一个全球健康问题,而且由于人口老龄化的发展,纤维化问题正在变得日益严重。纤维化是一种系统性疾病,可以影响任何器官,更常见于心脏、肺、肾、肝和皮肤。不同的纤维增生性疾病中的纤维化既有各自的独特机制,也有共同的调控过程。
英矽智能的研究人员一直在关注常见的纤维化机制,并在今年2月发现了一种新的泛纤维化靶点,有望成为各种抗纤维化药物发现的起点。英矽智能利用由深度学习 (DL) 驱动的靶点识别平台PandaOmics,结合化合物生成平台Chemistry 42,开发出了抗纤维化药物发现的创新方法,快速实现了两种纤维化适应症的临床前候选化合物设计,包括:在18个月内开发出了IPF临床前候选药物,及在此后不到半年的时间内,获得全新结构的肾纤维化临床前候选药物。
肾纤维化
日益增长却未被满足的临床需求
肾脏在人体生理学中起着至关重要的作用,包括清除废物、维持体液平衡、参与新陈代谢和生成维生素D。肾脏还产生调节红细胞生成和血压的激素。由各种原因所造成的肾单位严重破坏,以及肾实质性不可逆转的功能损害会造成肾功能失调,而肾功能失调通常会在全身产生连锁反应,导致慢性肾炎、肾衰甚至是更严重的后果。
据《柳叶刀》研究报告,中国慢性肾脏疾病患者人数居全球第一位。据中华医学会肾脏病学分会统计数据显示,中国成人慢性肾病的患病率为10.8%,总数高达1.2亿人,即平均每10人就有1名慢性肾脏疾病患者,而知晓率只有12.5%。慢性肾脏疾病造成的公共卫生威胁没有被充分的认识。
肾纤维化是慢性肾脏疾病的主要后果,虽然不同的因素如糖尿病、高血压、化学毒性或感染等均可引发慢性肾脏疾病,但肾纤维化是其共同结果,这将逐渐导致完全的肾功能异常。患者在早期可能没有症状,通常在晚期被诊断出肾纤维化,而此时唯一的选择是透析或肾移植。
2016年,仅在美国就有超过10万名患者排队等待肾移植,每月的新增排队人数为3000多人。平均每位患者需要透析大约3.6年才能接受肾移植。每年透析患者的死亡率高达20%,而移植则受到器官短缺的限制。即使在移植后,新器官也会逐渐衰竭,通常在10年内,需要重新透析或移植新肾脏。
另外值得注意的是,慢性肾脏病发病率最高的群体是65岁以上人群。随着人口老龄化的不断加剧,慢性肾脏疾病的威胁正在成为日益严重亟待解决的问题。
应对肾纤维化的挑战
虽然过去几十年间,人们在慢性肾脏疾病研究中已投入数十亿美元,但还没有任何实质性的临床实践可以有效治疗慢性肾脏病和其他病理学改变。与其他治疗领域相比,在肾脏病学领域发表的随机对照试验(RCT)的数量较少,而且大多数肾脏病学领域的大型RCT结果均为阴性。也缺乏评估临床终点或替代终点的肾脏病学研究。
由于肾纤维化通常被认为在慢性肾脏病的病理学中发挥了主要作用,且是慢性肾脏病的终末期表现,因此许多研究都关注纤维化通路及其靶点。在动物模型中,科学家们重点研究了早期被证明在肾脏疾病进展过程中会导致炎症和纤维化的主要生长因子或细胞因子。包括非常流行的血管紧张素II (Ang-II)、转化生长因子-β(TGF-β)、血小板衍生生长因子 (PDGF)、结缔组织生长因子(CTGF)、内皮素-1 (ET-1)、巨噬细胞趋化蛋白-1 (MCP-1)和肿瘤坏死因子-α (TNF-α)。
尽管已有一些靶向上述因子的候选药物进入了临床试验,且肾素-血管紧张素系统抑制剂目前正用于慢性肾脏病患者,但肾纤维化靶向研究的总体情况仍不乐观。肾纤维化领域的许多药物发现失败都是由于靶点选择不当或先导化合物不佳所致。此外,肾纤维化受多种不同途径的复杂的信号通路所影响,因此,仅针对一条通路不够有效。为了发现治疗肾脏纤维化的有效药物,必须构建稳定的疾病模型,并选择对疾病有实质性效果的泛纤维化靶点。
利用深度学习解决问题
由于肾纤维化极其复杂,了解疾病机制需要采用先进技术和系统方法。一方面,多组学分析提供了纤维化发展的潜在分子过程的基本数据。传统转录组学方法与新兴技术的无缝结合,包括蛋白质组学、代谢组学和基因组学等,为生物系统的深入研究提供了前所未有的机会。
另一方面,人工智能的应用,尤其是深度学习,已证明可以帮助药物发现过程的每个步骤,特别是在靶点识别和化合物阶段。在对复杂的大型多维数据集的处理中,如:基因组学、蛋白质组学、临床数据、有关靶点的结构数据和非结构化文本(研究论文、专利、资助等,)在进行建模时深度学习模型和自然语言处理技术也凸显出高效运作能力并提供真正的帮助。
英矽智能决定利用自主研发的人工智能平台PandaOmics和Chemistry 42切入纤维化药物发现领域,公司的关键优势是能够处理多模态大数据并构建复杂的疾病模型用于靶点选择。这些平台包括数百个模块,如生成式对抗神经网络(GAN)、自然语言处理(NLP)引擎和统计组件,即所有模块均可协同工作。
英矽智能的团队花了近7年的时间构建数百个AI模型(每个模型负责一项特定任务)并集成到一个平台中,该平台能够生成假设、选择靶点、生成化合物和预测临床试验结果。据了解,这可能是市场上最全面的药物设计平台。
2020年,团队利用基于生成式对抗网络(GAN)的综合药物发现平台,在纤维化领域第一次成功完成了重大概念验证。发现了细胞内泛纤维化的新靶点,并设计了一种候选药物,已被证明其在临床前实验中对特发性肺纤维化有显著疗效。
据介绍,为了建立初始假设,团队针对多组学和临床数据集训练了深度神经网络,以预测组织特异性纤维化。随后,应用了PandaOmics 靶点发现平台中的各种靶点发现工具,并建立了复杂的评分机制(该项研究也发表在顶级期刊Science中),通过深度特征选择、因果推断和从头通路重建找到了相关靶点。并利用自然语言处理 (NLP) 引擎分析了数百万数据文件,包括专利、研究出版物、资助和临床试验数据库,以评估靶点新颖性和疾病关联评分。在此基础上, PandaOmics 发现了20个验证靶点,团队从中筛选出了一个全新的靶点,优先用于进一步分析。
Chemistry42 是用于药物发现的化合物合成和设计软件。该软件包括一整套生成和评分引擎,利用英矽智能早在2015年就应用于医学领域的先进的深度学习技术从头开始“想象”分子。Chemistry42可以自动创建具有适当理化性质的药物分子结构。在这个项目研究里,团队利用 Chemistry42小分子设计库,与 PandaOmics 发现的新靶点进行结合。
通过这项概念验证研究,英矽智能展示了如何大幅加快人工智能驱动的药物发现过程,并实现成本优化的。在这项研究中,团队在不到18个月内完成了从概念到临床前候选化合物发现的整个过程,且成本远低于标准药物发现的投入。
变革药物的发现
应对肾纤维化的重要里程碑
在宣布获得首个针对肺纤维化的临床前候选化合物后,英矽智能将目光转向肾纤维化,另一个影响更广泛,且存在巨大未被满足医疗需求的领域。
基于特发性肺纤维化项目的成功,英矽智能利用PandaOmics展开了针对肾纤维化的靶点研究,并利用Chemistry42生成了具有药物性质的全新化合物。前期实验结果表明,该化合物可显著抑制肾纤维化的发展,并调节肌成纤维细胞的激活,这是组织修复和伤口愈合的关键。公司计划在2022年完成新药临床试验申请的研究。
自纤维化药物发现项目启动以来,英矽智能在大约24个月内发现了两种临床前候选药物,用于治疗特发性肺纤维化和肾纤维化。与传统的制药方法相比,集成人工智能驱动的药物设计展现了一种候选药物发现的新范式,大幅改进了药物发现的速度和成本。
正如2013年诺贝尔化学奖得主、英矽智能科学咨询委员会成员Michael Levitt所评价的那样:“一种好的药物通常是安全的、易制造、并且针对人们所担心的疾病,但是要真正实现这些目标并不容易,这就是英矽智能所做的工作取得突破性进展的原因。我认为英矽智能将会影响整个生物医药行业,让人们看到它是如何以比传统方法更高效、更经济的方法,为未被满足的医疗需求带来创新药物的。
英矽智能(Insilico Medicine)是一家由人工智能驱动的端到端创新药物研发公司,基于生成对抗网络(GANs)、深度强化学习(RL)、预训练模(Transformer)及其他机器学习技术,构建强大且高效的人工智能药物研发平台,用于识别全新靶点并生成具有特定属性分子结构的候选 药物,聚焦癌症、纤维化、传染性疾病、神经退行性疾病等未被满足医疗需求领域,推进并加速创新药物研发。