近年来,以抗体为代表的大分子药物进入快速发展期,风头更是超过了小分子药物。截至 2020 年底,美国 FDA 已经累计批准 99 款抗体药物上市,未来还将呈上升趋势。与此同时,抗体药物的市场规模不断攀升,预计 2021 年全球抗体药物市场将超 1500 亿美元。“全球抗体药物属于千亿美元市场,生物制药公司和科研机构对于抗体序列测定的需求不断扩大,抗体测序服务处于一片蓝海之中。然而,传统分析方法依赖已有蛋白质序列数据库信息,无法分析全新的蛋白质或者抗体,蛋白质从头测序是是一种解决方法。我们在全球 De novo Sequencing(从头测序)市场进行了 20 年研究,约占据了蛋白质从头测序软件市场的 70%,蛋白组学测序软件市场的10%。” 李明说。蛋白质从头测序指的是在没有序列库进行比对的情况下,直接对蛋白质氨基酸序列进行测定的全新测序技术。
2021 年,李明教授团队在 Nature Machine Intelligence 再发最新研究,进一步优化改进了其原有 De Novo Peptide Sequencing 软件 DeepNovo 机器学习模型,并发布了最新版本 PointNovo。李明是加拿大滑铁卢大学终身教授、加拿大皇家科学院院士,也是一名生物信息学家。他在算法设计和信息理论领域造诣颇深,在蛋白质从头测序领域拥有 20 年研究经验。20 年前,他创办了 Bioinformatics Solutions Inc(BSI),该公司为蛋白质组学领域以及生物药行业提供算法和软件解决方案。2021 年初,李明在中国武汉落地百蓁生物,据他介绍,百蓁生物将会基于 BSI 的软件为中国制药公司、科研院所提供蛋白质组学、抗体药物以及新抗原从头测序服务。日前,在由清华大学智能产业研究院举办、络绎学术直播的第二期 AIR 学术沙龙上,李明教授做了题为《人工智能赋能个体化癌症免疫治疗》的演讲。在此之际,生辉与李明聊了聊蛋白质从头测序的发展以及百蓁生物的具体落地情况。图 | 滑铁卢大学教授、百蓁生物创始人兼董事长(来源:受访者提供)最早的蛋白质从头测序依赖于质谱仪,测量精度不高,而且测量的速度也比较慢。此后,很多研究团队开始了对蛋白质从头测序技术的不断优化。早在 2016 年,李明团队在 Nature Scientific Report 上发表了全球第一篇抗体测序论文,这是全球第一次实现对单克隆抗体从头预测,但是仍面临精准度不高,以及样本量大等问题。2017 年,李明团队再发文,第一次将深度学习神经网络引入了蛋白质从头测序中,并以此开发了 DeepNovo 计算模型,以此测定蛋白质氨基酸序列。也就是说通过该软件能够分析质谱原始谱图数据,提供肽段 de novo 测序结果,进一步可通过序列标签组装成完整抗体蛋白序列。李明告诉生辉,2017 年,BSI 实现了将以算法为核心的 De Novo sequencing 改变为以深度学习网络为核心的蛋白序列测定,引入了 DIA 数据(数据非依赖采集),并通过使用大量的生物数据训练、验证和测试其机器学习模型。引入深度学习的优势在于预测精度、速度大大提升,而且可以进行个体化训练。2021 年,李明团队继续优化了 DeepNovo 软件,并将其升级为 PointNovo。“升级后的 PointNovo 不再依赖于质谱仪的精度,速度得到了极大提升。现在,我们的精度比全球领先水平提高了 50%,这意味着我们抗原、抗体测序会更为精确,同时需要的样品量也得以减少,比如说现在细胞量只需要 107,而改进前样本量需要 108。” 李明说道。样品量是蛋白质从头测序技术革命的一大关键,也是蛋白质从头测序能否应用于抗体、抗原测序的核心所在,毕竟人体产生的新抗原数量并不多。以新抗原为例,目前新抗原测序常用的方法主要是基于基因组学和转录组学等组学技术,有业内人士认为,利用蛋白质从头测序可能会出现测量不全以及样品量要求过高等局限性。李明也重点提到了新抗原的从头测序。他向生辉具体讲解了如何利用 PointNovo 鉴定新抗原:首先在癌组织里面将癌细胞产生的新抗原提取出来,然后利用质谱仪 DIA 采集模式将新抗原肽段产生谱图数据,利用软件分析;然后利用个人的 HLA 肽段重新训练个体化模型,继续识别患者产生的新抗原。最后也是最关键的一步是鉴定新抗原是否能激起免疫反应,也就是验证其有效性,这个往往需要使用干实验室进行验证。现在,很多疾病治疗都需要与 AI 相结合,随着 AI 和信息科学与疾病治疗的结合,生物学开始从湿试验向干试验转变。“生命科学领域存在大量的数据,单纯靠湿实验室远远不够。个性化治疗需要干实验室化,AI 将会帮助生物学家将制药流程从湿实验室转到干实验室,个性化治疗离不开 AI。” 李明说。这样测出的新抗原序列就相当于 “药”,鉴定完成后,就可以交给医院、科研机构或者生物制药公司,根据实际需要制备成疫苗或者细胞疗法。抗体测序也是如此,这就相当于打通了抗体药物、新抗原最终成药过程中的 “关键环节”。接下来制药公司就会基于抗体序列进行一些修饰改造,或者是基于新生抗原开发成癌症疫苗或者细胞疗法。简单一句话描述 BSI 和百蓁生物所做的事情 —— 蛋白质从头测序。据李明介绍,BSI 成立于 20 年前,主要开发蛋白质从头测序软件,占据蛋白质从头测序软件市场 70% 的份额,蛋白组学测序软件市场占据10%的份额;今年 1 月,他在武汉落地成立了百蓁生物,主要为科研院所和制药公司提供 CRO 服务,包括抗体测序与表征、糖基化分析、新抗原从头测序、蛋白组学等。“我们 20 多年一直聚焦于蛋白质测序一个环节,现阶段百蓁生物主要以抗体测序为主,新抗原测序业务将开始展开。” 李明说道。“新成立的百蓁生物将面向中国客户,而 BSI 面对全球客户。” 李明补充道。随着公司的落地,新抗原测序业务将会开始全面推进。新生抗原应用广泛,可以用于制备癌症疫苗、HIV 疫苗、新冠肺炎疫苗等。据透露,目前百蓁生物已经与跨国药企达成了 HPV 疫苗合作,提供测序服务。李明告诉生辉,现阶段百蓁生物的融资计划也已提上日程,正在进行 A 轮融资,目前已经收到了一些投资意向。完成融资后,百蓁生物将会发力新抗原业务,包括合作艾滋病新抗原疫苗业务、推进癌症新抗原业务的服务,和蛋白序列的糖基化修饰服务。“抗体序列就是对一级结构测序,新抗原制备出来以后,需要鉴定其免疫反应,可能需要预测 TCR 的三维结构。据此,我们在郑州计算所建立了实验室,推进抗体或者 TCR 三维结构测定。” 李明这样描述下一步的发展规划。