科研 | iScience:机器学习助力小鼠多器官转录组预测人类临床结果

编译:西土城外杠杆精,编辑:十九、江舜尧。

原创微文,欢迎转发转载。

导读

药物研发过程可能因预料之外的副作用和/或疗效不够好而功亏一篑,平均仅有13.8%的候选药物能够通过临床试验筛选,低成功率加上单个药物的研发试验成本高达1.61亿到18亿美金,导致药物价格居高不下,医疗费用高昂。效果及不良反应预测的偏差主要是由于药物的临床前试验使用的是细胞、器官或动物模型,结果外推到人时会有外推误差。除了试验方法之外,也有采用机器学习方法通过药物的结构和功能预测效果的计算方法。

虽然试验方法和计算方法都已经见到一些成效,但是还有一些局限性,目前的实验研究通常是有“偏”的,因为检测的项目是在实验前就设计好的,可能只检测了一些想要关注的项目和一些常规项目,会遗漏某些不良反应;目前现有的机器学习方法预测药物效果及不良反应时需要一些先验知识,需要知道药物的某些形状(如结构)对应的机制及靶点,多数仅限于对小分子药物进行预测,而且难以预测多种物质混合的药物的效果。

为了更好的在临床试验前对药物的效果和不良反应进行预测,研究者开发了一种将试验和机器学习计算结合的方法,采用小鼠给药后多器官的转录组学数据,借助机器学习的计算方法来预测在人体中的适应症和不良反应。

论文ID

原名:Predicting Human Clinical Outcomes Using Mouse Multi-Organ Transcriptome

译名:使用小鼠多器官转录组预测人类临床结果

期刊:iScience(暂无影响因子)

发表时间:2020.01

通讯作者:Thomas N. Sato

通讯作者单位:Karydo TherapeutiX株式会社

DOI号:doi.org/10.1016/j.isci.2019.100791

实验设计

研究流程图如下图1,选取15种人类临床结果已知的药物处理小鼠,收集小鼠24个器官的转录组数据,从美国食品及药物管理局不良反应报告系统(US Food and Drug Adverse Event ReportingSystem,FAERS)以及药物副作用资源(Side Effect Resource,SIDER)等数据库获取临床结果信息,根据已知的临床结果中不同性别年龄的不良反应、适应症等数据训练模型,完成从小鼠转录组数据人类临床结果预测及判别模型(可以理解为为各个转录组指标创建参考的“正常值范围”或“正常的表达模式”,用来预测临床结果)。创建完成的从小鼠转录组结果到个体临床结果的转换工具被称为“humanized Mouse-DataBase,individualized”(hMDB-i)。
创建hMDB-i后,将新的待筛选药物“X”作用后,小鼠24个器官的转录组数据输入hMDB-i,即可获取预测的药物“X”导致的个体临床结果。为了验证/评估此方法的准确性,研究者采用了支持向量机(Support VectorMachine,SVM)、随机森林(Random Forest)、集成学习多数投票法等多种机器学习方法,对上述15种药物的不良反应、治疗适应症等的预测效果进行了交叉验证。并且与既有的其他预测方法进行了比较。

图1 研究流程图

结果

采用SVM模型预测不良反应

采用SVM模型训练数据,使用小鼠24个器官的转录组数据预测FAERS数据库中的不良反应事件(Adverse Event,AE)。为了确保模型的稳定性,采用交叉验证(cross-validation)的方法评估模型的预测效果:每次采用14个药物的转录组数据和AEs数据做为训练集训练模型,然后使用最后余下的1个药物做验证集进行验证。依次轮换,直到每个药物都被当做验证集一次。每个药物做为验证集时,各个性别/年龄组的验证准确度(accuracy)、查准率(Precision)和查全率(Recall)、F1得分(F-measure)见下图2 B,结果显示:15个药物的总计264个性别/年龄组中有200个组中的准确度超过0.7,有52个组中的准确度超过0.9。查准率在156个组中超过0.5。如果以对某个药物结果中的性别/年龄组是否有AE发生的判断为依据计算准确度和查准率,那么有13个药的准确度超过0.5。查全率稍低,提示此模型可能漏掉了一些AEs。

AEs中的严重不良反应事件(serious AEs,SAEs)虽然可能发生例数更少,但是影响更大,因此对SAEs的预测有时更为重要,在15个药物中的204个性别/年龄组有统计死亡事件,其中有141个组报告了死亡事件,对这204个组别的预测结果显示,模型预测有148个组发生死亡事件,仅有12个发生死亡事件的组未被预测出来。

为了评估真实世界数据中一些可能偏倚、混杂等对模型的影响,研究者采用SIDER(Version 4.1,http://sideeffects.embl.de)数据库进行验证评估,结果显示15种药物的准确度在0.677–0.827,查准率0.023–0.523,查全率0.571–0.963。见图2 D,与FAERS数据库的表现相当,进一步的证实了研究者模型的有效性。

图2 使用SVM模型预测AE的结果汇总
a 分析流程;
b 展示交叉验证结果的混淆矩阵,柱状图展示每个药物下属的不同性别、不同年龄组的准确度、查准率、查全率和F1得分;
c 展示各个年龄/性别组的死亡实际发生情况和模型预测结果;
d 模型对SIDER4.1数据库中AE的预测结果。
采用随机森林预测死亡

采用随机森林构建模型预测死亡,通过交叉验证计算每个药物做为验证集时,各个药物验证时的结果以及准确度(accuracy)、查准率(Precision)和查全率(Recall)、F1得分(F-measure),RF与SVM预测的对比结果见下图3 A下图3B,结果显示:除了3种药物(asenapine、empagliflozin、lurasidone)其余12种药物的准确度、查准率、查全率均大于0.5。此外,尽管asenapine、empagliflozin、lurasidone三种药物的查准率在0.2-0.4之间,他们的查全率分别为1.0、1.0和0.667。从图中来看,RF和SVM的模型表现接近。

图 3 SVM和RF比较预测死亡事件
a 各个性别/年龄组对死亡(有/无)的预测情况;
b 各个药物验证时的准确度(accuracy)、查准率(Precision)和查全率(Recall)、F1得分(F-measure)。
采用Link-Prediction(LP)框架预测AE

采用LP模型对AEs进行预测,使用(1)24个器官的转录组数据(2)FAERS中各个药物汇报的AEs数据(3)每个适应症的AEs数据共3个数据集进行测试。使用一类支持向量机(one-class SVM,详见补充材料)测试模型。结果显示,对于alendronate、clozapine和evolocumab (Repatha)这三种药物,相比之前的SVM/RF hMDB-i平台,LP框架预测的查准率略有提升,查全率有很大的提升,见下图4。LP框架相比原来的SVM/RF hMDB-i平台预测结果更容易发现AEs和SAEs。

图4 药物alendronate、clozapine和evolocumab中通过LP框架正确预测但是未被原来的SVM/RF hMDB-i正确预测的严重不良反应。
预测治疗适应症(Therapeutic Indications,TIs)

确认药物的适应症对于药物的研发同样至关重要。采用LP模型对TIs进行预测,使用(1)24个器官的转录组数据(2)FAERS中各个药物汇报的TIs数据(3)每个适应症的AEs数据共3个数据集进行训练。使用一类支持向量机(one-class SVM,详见补充材料)训练模型。

15种药物采用交叉验证法,每次使用14种药物训练模型,采用余下的1种药物进行验证,结果显示所有15种药物的准确度全部>0.78,11种药物的查全率>0.8,然而查准率只有acetaminophen为1.0,其余的药物均<0.35。

与其他基于多特征筛选的预测方法比较

已经有通过计算机模拟预测SEs/AEs的研究报道,Wang等(Wang et al., 2016)曾经报道过通过整合基因中的药物副作用“标签”预测SEs/AEs。研究者通过比对两种方法,发现15种药物中,Wang的模型能预测本研究中的9种药物(alendronate、aripiprazole、acetaminophen、asenapine、cisplatin、clozapine、doxycycline、lenalidomide和olanzapine),因为Wang等的模型只适用于小分子药,无法预测生物制剂/抗体药(本研究中的evolocumab)以及多肽类药(本研究中的teriparatide)。

对两种方法都能预测的9种药物进行比较,在7种药物中,本研究提出的方法在SIDER数据库和FAERS数据库中均检出了远多于Wang等模型的SEs/AEs,在另外两种药物(aripiprazole和lenalidomide)中也检出了许多Wang等的模型漏掉的SEs/AEs。

讨论

临床前对药物的SEs、TIs预测对于药物研发具有重大价值,本研究在前人研究的基础之上,通过实验方法与计算方法相结合,搭建了小鼠数据到人类临床表型的桥梁,既往已经有一些预测方法/模型提出,但是这些方法/模型可能受到药物的剂型或者先验知识等限制,难以对部分药物推广,本预测方法对药物的剂型没有要求,且在两种方法都能预测的药物中,在多数药物的预测SEs表现优于既往模型。

通过采用多器官转录组,仅使用15种药物,就能够在交叉验证中对大多数药物的SEs、TIs进行有效预测,提示多个器官之间的转录组数据之间可能存在某种未被揭示的联系,能够反映/预测机体的健康状态/疾病预后。

然而,该研究中,如果一种不良反应/治疗适应症未在训练集中,那么可能也无法预测出来,这一点可以通过扩大药物数目来解决,随着药物的数目增多,各种不良反应/治疗适应症被覆盖到的概率都会增加,预测模型也就具有学习预测相应指标的能力。不过这一工程可能花费巨大,不是一个实验室能够独立完成的,完成3732种批准药物的24个器官转录组测序预计会投入2千万-3千万美元,不过如果能够切实帮助新药研发和药物的临床反应估计,这些投入也是值得尝试的。


更多推荐

科研 | PNAS:转录组学揭示急性和慢性饮酒对肝脏昼夜新陈代谢有不同的影响

重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

(0)

相关推荐