将数据处理成本降低到1/10,这家公司如何将AI与CRO结合?
CRO是医药行业专业化、细分化、风险平均化的产物,主要目的是为了提升研发效率,但在整个CRO产业链条中,还有很多低效环节拖累着行业发展。为了加速新药研发流程,AI被引入来去疴除弊,药物发现是AI的主战场。本文所介绍的遥领医疗科技,便是一家将AI应用于改造数据收集业务流程的CRO公司。
遥领医疗科技作为一家技术创新型CRO组织,将人工智能技术应用到临床研究领域,利用最先进的IT和人工智能技术,提高临床研究的数据收集效率,大幅度降低数据收集与数据处理成本。
在AI发展如火如荼的今天,如何做到将AI与垂直细分领域深度结合,在改造传统流程的同时,帮助从业人员提高工作效率,是行业的热门话题。
对此,动脉网专访了北京遥领医疗科技的CTO胡启曈先生,揭秘这家医疗科技公司,如何做到用AI技术将以往整体成本降低到十分之一,同时提高研究证据的质量。
三大系统进行数据收集、清洗、标准化流程
在临床试验中,IV期临床试验包括新药上市后应用研究阶段。其目的是考察在广泛使用条件下的药物的疗效和不良反应,评价在普通或者特殊人群中使用的利益与风险关系以及改进给药剂量等。遥领医疗科技目前主要专注于IV期临床和上市后研究。
临床试验CRO的主要业务内容可分为:临床试验技术服务、临床试验数据管理服务、临床试验统计分析服务和注册申请相关服务。其中临床试验技术服务是最主要的业务内容,临床试验统计分析服务技术含量最高,盈利能力较强。
临床试验涉及医院、药企、患者多个群体,AI并不是第一次和新药研发领域牵手,在化合物发现、靶向药物发现方面,AI也已经开始应用。小众一些的领域,在国外的患者社区中,AI还被用来匹配临床试验患者。无论如何联姻药企,都是为了提高整个新药研发的效率,降低新药研发成本。
新药研发平均耗时10年,其中很多时间都是由于选择低效的网站或研究设计而浪费。动脉网此前采访Medidata总裁 Ross 时,他表示,根据他们的研究调查过的30个临床试验中,几乎所有临床试验都有数据质量问题,大部分试验在不良事件反应上存在差异,90%存在数据不一致,30%的试验显示可能存在误操作。
传统的流程不止是消耗大量的时间成本,还可能直接导致整个项目的失败。监管部门正在加大人员投入和培训,在提升审批速度的同时审批标准也会与国际接轨。而CRO企业中糟糕的数据不仅会造成监管流程的拖长,很可能还会造成审批流程的失败。
遥领医疗科技目前研发了三大系统解决数据的收集、数据处理和标准化问题。包括Verify系统、RDCS系统、Million Data系统。Verify系统主要解决低成本数据收集问题,目前Verify系统可以做到只需要用原先工作时间和成本的1/10完成工作。
胡启曈对动脉网说到:“临床数据收集中经常会遇到很多问题,例如无效数据和不完整的数据,RDCS系统不仅可以进行数据清理,除此之外,还可以对数据进行标准化处理。”
目前,遥领医疗主要服务于四类客户。国内的药企以及CRO企业和CSO公司,此外遥领医疗科技还服务于各类医药协会,进行真实世界研究的探索。
AI助力低成本、高质量、高效率的数据收集
在整个对数据的采集、结构化、标准化的处理过程中,AI在每个环节都扮演了重要角色。
在数据收集方面,遥领医疗科技数据主要来自两个渠道,一是与医院的HIS系统对接,二是通过OCR识别原始医疗数据文件。而AI在其中能够加持的部分在于运用NLP自然语言处理技术。
胡启曈解释道:“OCR技术虽然是一个比较成熟的模块,但它的错词率约为20%-30%,对于临床试验来说,这样的错误率对于后续的结构化或者EDC表格填充,会造成很大的影响。因此,我们在OCR识别之后又添加了一个医学语言后处理模块,这个模块可以用一些医学垂直语言模型来校正错词,从而提高识别的准确率。”
在标准化这方面,由于以往分散孤立的数据收集方式、表达方式和记录方式的不同,造成大量数据只能是“死数据”。遥领医疗科技在RDCS系统中建立了独家自研的知识图谱系统,能够将不同的表达数据统一为一种标准化的数据。
胡启曈举了一个简单的例子来说明:“比如上呼吸道感染,有的可能叫感冒发热,在各个医院表达可能不一样,以往完全依赖于人工标注,现在通过RDCS系统这样的一个标准化系统,可以把它统一成同一种概念。”
标准化处理数据之后,数据能够进行重组和处理。数据和数据之间的匹配才能挖掘出价值。
Million Data系统对数据应用统计模型进一步加工处理。例如T检验、Cox回归模型、KM生存曲线等统计模型,并且对数据进行启发式引导,这些统计模型可以帮助药企的各个部门和临床研究者进行数据分析和统计,帮助他们进行智能决策。
除了通过电子化的方式提高效率以外,遥领医疗科技还用结构化的方式来压缩整个临床试验所耗费的时间。
在结构化上,遥领医疗科技采用machine reading comprehensive(机器阅读理解)的方式,可以实现对内容的自动识别并填充到对应的项目EDC中。而标准化流程则是通过知识图谱。
胡启曈对动脉网解释到:“有些术语需要把上位词和下位词相对应起来,比如支气管炎,可能和呼吸道疾病在文字重复上没有任何关系,但是你需要在机器的认知层面上很好地理解它。”
CRO行业的市场规模天花板就是药企的研发费用
CRO行业有一句俗话:行业市场规模的天花板是药企的研发费用。
目前,中国已经跃升为全球第二大用药国家,是全球药品市场增速最快的经济体。在利好政策释放的背景下,无论跨国企业还是国内企业都更加注重研发投入。
对于药企而言,随着新药研发难度的增加和国际制药企业在专利悬崖前的盈利下滑,国际制药企业开始更多的将CRO企业纳入其医药研发环节中,以控制成本、缩短周期、减少研发风险。
对于内资药企而言,NMPA、医保局推行的药审改革:两票制、带量采购、创新药优先审评审批、仿制药一致性评价等,中国CRO行业将迎来前所未有的发展机遇。另外,中国药企在研发投入上以往一直是“重销售,轻研发”,但现在格局正在改变。
根据欧盟委员会在2015-2016财年统计的全球2500个药企样本研发投入数据来看,相比于2015年,中国药企的研发投入增长速度最快,为27.5%,远超过全球9.8%的年增长率。
想要在CRO发展前所未有的机遇中赢得发展机会,提高数据收集质量是大势所趋。很多CRO公司也正在进行这方面的改造,但是他们更多地选择外部的IT公司或者采用云计算公司的开发解决方案。
想要更好地解决多方的痛点,IT公司首先需要能够提供完整的解决方案,如何介入医院的系统是一个艰难的过程。另外在成本上可能也不具有优势。而遥领医疗科技则是以先进的IT技术为驱动,加持自己的CRO服务。
能够将AI和CRO结合,在行业内并不多见。用胡启曈的话说,AI相当于一个锤子,而CRO是我们深入垂直行业的钉子。而钉子和锤子的相遇,来源于遥领医疗科技团队的坚持。想要结合锤子和钉子,锤子和钉子都必须要硬。
胡启曈对动脉网说道,自己毕业于约翰霍普金斯大学,作为一个学习AI出身技术的人员,选择将AI应用于CRO企业,机缘在于和遥领医疗科技创始人张洪亮的相遇。
在2017年选择以人工智能等IT技术为驱动力之前,张洪亮已经在CRO行业有深厚的积累,在临床试验研究领域深耕多年,也正因为如此,他发现临床试验中其实有很多瓶颈需要突破和改变,于是他开始打造一家用AI驱动临床试验的公司。
目前,遥领医疗已经和济民可信、成都倍特药业、中南大学湘雅二医院等多家企业和机构达成合作。接下来,遥领医疗将继续加大研发力量,务求将大样本量真实世界研究成本降低到传统模式的1/20以下。
文 | 杨雪
微信 | hhhh333yyyy
添加时请注明:姓名-公司-职位
后台发送关键词即可获得相关好文
网站、公众号等转载请联系授权
“2018未来医疗100强论坛”是动脉网打造的属于医健领域创新者的年度盛会。本论坛将以未来医疗100强榜单&奖项的发布为契机,举办14场主题论坛,邀请近200位行业大咖,聚集国内外最为活跃的医疗健康创新企业、上市公司、金融机构、医疗机构等产业核心力量,促进产业链有效互动合作,推动创新健康医疗产业的变革进程。长按识别图中二维码,即可报名!
近期推荐
★ 中国医院百强“王者”榜单出炉,但有65%的医院信息化还是“青铜”水平……
★ 做远程口腔4年估值达到32亿美元,这个行业还可以这样玩?
★ 这个领域诞生了市值130亿美元的独角兽,国内刚刚起步,腾讯也在跟进
VB100