更懂医生的嘉和美康,其大数据临床科研平台都有哪些亮点?
数据重复采集,利用率低;
数据存储分散且结构不一;
数据质量和完整性缺乏统一监控;
数据查询逻辑复杂;
医学研究阶段性验证困难;
研究思路难挖掘……
类似上面这些临床科研的问题,还有很多。终归而言,提高医疗数据的质量才是解决问题的关键。
目前,患者的病案在绝大部分医院都以非结构化或半结构化的方式进行存储。这种信息,医生难以直接利用,只能采用人工誊写或摘抄的方式整理数据,极大地增加了科研数据采集的时间成本。
此外,科研数据根据课题研究目的不同,往往来源于多个业务系统。并且根据治疗方式和阶段的不同,数据的类别也具有多样性,如患者的随访、CRF表单以及生物样本、组学分析等数据。这就造成了,医生在实际数据收集和整理过程中,需要来回在多个系统间切换,并将多系统来源的数据人工进行关联核对,因此错误成本显著提升。
除此之外,科研课题如何切入,如何实现创新型的研究思路和观点,也困扰着当代的医生群体。
基于以上问题,以大数据为基础的科研平台在研究型医院建设过程中逐步体现出其重要的位置和优势,也成为近年来,以大数据为基础的新型临床研究模式的新热点。
从临床系统到科研大数据平台
大数据平台通常基于Hadoop技术,实现海量异质数据,包括非结构病历数据与大规模影像数据的标准化存储,并通过自然语言处理(NLP)等技术实现数据的标准化、规范化处理。同时,大数据平台所汇集的医疗数据,还为深度学习等方法提供了海量训练与验证集,从而推动了医疗数据智能分析的发展。
时下大热的病历数据的自然语言处理以及医疗影像的AI分析,其基础便是大数据平台。
作为国内电子病历的代表性企业,嘉和美康从2013年起便开始了大数据平台的研发和探索。经过几年的沉淀,嘉和美康逐步实现了Hadoop、Spark、机器学习等大数据相关技术的成熟应用。而以往电子病历等临床系统项目的积累,也为公司大数据模型的建立打下了坚实基础。
2017年,在医院医生越来越强烈的科研需求下,嘉和美康大数据事业部正式推出了大数据临床科研平台。
嘉和美康供图
据动脉网了解,该平台主要借助大数据处理、自然语言分词、机器学习、知识图谱等技术,整合并挖掘包括电子病历、检验检查、医疗影像、基因序列等在内的海量医疗数据,形成以患者为中心的完整时间序列研究资源库。
此外,平台还利用数据挖掘算法,实现临床数据的深度解析与可视化,辅助临床医生构思科研想法以及提出病因假设。
从效率上看,大数据临床科研平台基于大样本临床试验,能够快速完成问题验证并生成统计结果,降低科研成本,提升医疗机构服务质量和科研成果转化效率。
五大优势功能
大数据临床科研平台,在国内并不少见。嘉和美康大数据事业部凭借多年对临床数据深入透析经验,建立起了五大产品优势:
1、多级数据分层模型
嘉和美康大数据事业部的大数据临床科研平台针对临床数据复杂的分级结构,特别是病历文书、检查报告等,研发出了“多级数据分层模型”。该模型能深度挖掘各层次数据,把数据的颗粒度做到极致,并建立其层次关系,从而能支撑复杂关联性分析等深度的科研应用研究。
据嘉和美康大数据事业部科研产品部总监甘伟介绍:“多级数据分层模型的数据颗粒度优势,主要建立在病历的复杂结构程度上。经过多年电子病历系统的研发,目前嘉和美康的系统已经覆盖了全国1200多家医院,对病历的理解十分深刻。所以在分析数据时,要比其他公司分析得更为细致,颗粒度更小。”
举例来说,如果医生想要研究饮酒对某种疾病的影响,首先第一层要观察其是否饮酒,第二层要观察其酒龄,第三层要研究其喝的是红酒、白酒或者是其他类型的酒。对疾病的差异分析,颗粒度越细,医生研究得也就越深入。
2、专病库
嘉和美康大数据事业部的大数据临床科研平台专病库是以专科疾病为中心,整合患者在院期间,包括门急诊在内的各类临床诊疗资料,具体包括病历文书、检验检查、医嘱用药、手麻、护理等。
除此之外,患者随访数据、生物样本数据、组学研究数据或公开发布的环境质量数据,以及一些自主维护的课题库数据以及疾病专有标签数据,也被纳入到专病库中。
基于专病库,科研PI(课题负责人)可以不用再像以前一样,带着研究生去病案室耗时耗力地翻阅纸质病案,摘取关键信息点。
另外,医生的视野往往依赖于过往的临床经验,因此发现的临床问题也很局限。但当其有了基于多学科数据的专病库之后,便可以借助科研平台,对海量数据进行多维度分析。利用可视化功能,医生能够发现过去难以发掘的临床问题,找出科研的新思路。
嘉和美康供图
3、数据智能质控
评价一份病案的质量往往需要从两个角度出发,从形式上包括组成部分的完整性、实效性、格式规范性,从内涵上要求内容准确、详实,能满足思辩和学术探讨。
过去,医院多以人工方式开展病案质控。如某三甲医院,聘请了30多位资深临床专家组成病案内涵质控专家组。同时,每月有数十位主任、教授、主治医师对科室病案进行自查。
智能质控,是指通过明确一些常用的质控规则,再通过机器学习,补充和完善质控体系。嘉和美康大数据事业部针对大数据资源库每个数据项,实现实时多级的质量监控,包括资源的完整度、异常数据点、异常数据类型以及数据分布情况等。
并可针对不规范数据进行溯源分析,追溯到原始病历文书,发现书写误差。比如入院记录里的评分和出院记录的评分不一致,确定诊断和患者的症状不符等。
据甘伟介绍:“一方面,医生可以对所需数据的数据质量一目了然;另一方面,他还能及时发现问题,尽早采取培训、必填项等方式规范医生病历书写,从源头提高数据质量。”
4、数据深度挖掘
嘉和美康大数据事业部的大数据临床科研平台的数据深度挖掘能力包括两大特点:病种分析和在线统计建模。
1) 病种分析
病种分析提供影响因素分析、预测分析、干预分析三大核心主题的分析研究。
影响因素分析,围绕专病相关几千个维度分析挖掘疾病的危险因素,并进行分类排名;有利于进行疾病的相关性分析的同时,还可以挖掘出影响平均住院日等运营指标的相关因素,从而定位相关业务环节,进行针对性的调控。
预测分析,通过学习相关真实病历,借助时间序列分析、神经网络等大数据挖掘技术,构建疾病预测模型,实现对患者相关疾病危险因素预测分析、疾病严重程度分级,治疗效果评估。同时,还支持对门诊量、住院量、手术以及相关费用的预测,为医院运营管理提供参考。
干预分析,针对用药、手术、放疗等治疗手段,进行关键事件前后的对比分析,从而直接产出治疗效果对比报告。
2) 在线统计建模
过去,医生写科研论文之前,需要把excel表的数据处理成统计软件能用的格式。这个过程中,需要耗费很长的时间,包括一些数据转化、空值处理,以及一些数据的不规范。利用科研平台,医生不需要再像以前一样,只需通过平台将数据处理好,量化成统计软件需要的格式即可。
数据统计方面,嘉和美康大数据事业部还提供在线统计模型工具。
目前,科研平台已整合医学上常用的统计算法40余种,包括独立样本T检验、卡方检验、回归分析、相关分析以及Cox回归等。其操作设计完全结合医学专业特点以及科学研究思路,将大部分数据处理和量化过程转由后台直接完成,省去人工处理数据的复杂度,提高科研效率。
且考虑到临床医生统计学知识匮乏的现状,平台上还智能的融合了统计模型推荐以及模型结果解析等。分析后的结果可直接导出,供医生撰写论文中时使用。
5、数据导出
平台可针对数据的分类模型,定制每种分类数据的导出模式,基于关键事件处理、复杂逻辑计算、自动行列转换、智能标准化值域输出等新技术。替代统计学处理之前大量的手工数据处理工作,为医生在阶段性统计阶段节省大量时间。
不限于院内,广阔的应用空间
大数据临床科研平台的应用场景,并不限于医院内。
在临床辅助方面,科研平台通过对真实世界数据的学习,包括网上疾病的一些诊疗指南建立起的知识库,辅助医生规范其诊疗行为。让不管是进修医师还是资深医师,都能够根据知识库,将相应的治疗方案推荐给医生,让他快速完成工作,减少失误的概率。
除此之外,在一些拓展领域,科研平台也有着广泛的应用价值。
甘伟表示:“除了为医院和医生端提供服务之外,嘉和美康目前已经联合CRO公司,辅助药厂去做一些三期四期的临床评价,以及药品的适应症和一致性评价的研究。后续,嘉和美康大数据事业部还计划与保险公司合作,为其提供医保控费、保单设计、不良记录的核查等方面的服务。”
文|郝雪阳
微信|changyoudashijie
添加时请注明:姓名-公司-职位
后台发送关键词即可获得相关好文
网站、公众号等转载请联系授权
点击一下,领先大步
长按识别,即可报名
近期推荐
★ 电子病历新政激活医疗信息化两大百亿市场,医院达标应如何选择
★ 2018医疗科技世界论坛日程出炉!60位大咖分享,探讨产业变革的核心驱动力!
植发专题
★ Histogen
“医药数字化转型”专题
★ 阿斯利康 ★ Oscar health
“心理健康+案例”专题