北大医信王琦:电子病历与健康医疗大数据,要突破四大壁垒 【电子病历和健康医疗大数据系列】
随着国家健康医疗大数据政策的推行,电子病历作为其中的基础数据库之一,在医院信息系统中的地位不断攀升。无论是创业公司还是上市公司,都在进行这方面技术的尝试和探索。
作为国内知名医疗信息系统解决方案的提供商和服务商,北大医信成立至今已有20余年。依托于北京大学和方正集团,通过不断创新的医疗信息化技术助力医改发展。
目前,北大医信累积用户3000余家,遍布全国28个省、市、自治区,其中三级医院200余家,已经成为国内最大的数字化医院和区域医疗卫生解决方案提供商和服务商之一。
以知识发展与利用的智慧HIT3.0时代,是北大医信对于信息化发展下一阶段的定义。在这一阶段,北大医信会积极探索基于电子病历等医疗大数据的药品研发、医疗保险、远程医疗和健康管理等衍生服务。
基于北大医信的发展阶段,针对电子病历在健康医疗大数据的应用问题,动脉网专访了北大医信大数据总监王琦。
北大医信大数据总监王琦
电子病历的发展的4个阶段
EMR(电子病历)的概念很广,包括CDR(临床数据仓库)、CDSS(临床决策支持系统)、医学词汇表、CPOE(医生医嘱录入系统)、临床文档等系统中的数据。由于医院的信息系统种类繁多,因此只能靠集成平台把信息汇总起来,之后再传到CDR中。
简单来说,CDR就好比仓库,无论是业务数据还是临床数据,医院内所有的数据都要进入到入到CDR中。而电子病历的业务要更贴近临床,因为只有在住院环节,电子病历的概念才会形成。
如果对电子病历的发展进行一个划分,大致可以分为四个阶段:
第一阶段,在医疗机构内部实现广泛的临床信息系统。从无到有的一个阶段,把纸质文件电子化,那个时候叫CDR。
第二阶段,在医疗机构内部实现以病人为中心的信息集成。从图像慢慢发展到数字化,也就是电子病历的采集形式。第二个阶段是在院内把患者为中心去把信息集成到一起,电子病历的信息不是输入进去,而是从各个系统抽取一部分,再加上医生的主观判断,合成在一起,才叫电子病历的概念。
第三阶段,在医疗机构内部信息化的基础上,实现医疗机构之间的病人信息共享,构建区域化的电子病历系统。因为只有区域化的电子病历系统才是以患者为中心形成的信息共享平台,也就是国家正在规划建设的EHR的概念。
第四阶段,云计算+大数据+物联网时代的电子病历。要发展个性化的治疗和精准医学,需要以个人为单位去开展服务。电子病历除了原本的患者信息之外,还要将范围扩大到与个人健康相关的非医疗信息,如饮食、运动、环境等因素。在这个阶段,一个新的概念出现了——PHR(个人健康档案)。
健康医疗大数据的形成壁垒
健康医疗大数据,包含整个医疗体系的信息,如电子病历、电子处方、人口健康信息等数据。这些数据融合在一起才叫健康医疗大数据。尤其是电子病历,它包含最完善的临床数据。
利用电子病历形成大数据,壁垒主要包含五个方面:
1、要形成广泛的大数据,需要通过标准化去实现互联互通。
然而,一家医院内的数据无法称之为大数据,只有在一定的区域内才能形成全生命周期的健康医疗大数据。但这却存在一个供需问题的悖论:大数据的供给方是医院,但需求却来源于外部,如政府、药企和保险公司。它们对于医院的数据有着强烈的需求,但作为数据的提供方医院来说,需求却并不强烈。
2、医疗机构的电子病历化程度太低。
目前,国内大部分二级以下医院,特别是边远地区的医院信息化程度极低,这导致我国人口健康状态的评估和掌握缺乏数据依据。
3、机器学习所带来的数据深度挖掘能力。
现阶段,医院临床医生对电子病历最大的需求集中在科研论文这一环。医生在医院内部用的数据,其实只是对现有数据的深度挖掘,还不算真正意义上的大数据。一家医院毕竟数据量有限,所以他们的需求更多是有限数据样本的深度挖掘和信息提取,这需要机器学习算法的支撑。
4、全过程、全周期的电子病例是核心。
数据源头的质量是关键。我国目前很多电子病历产品都是模板拖拽,不同公司的产品基本都有着固定的形式,医生需要填写的内容有很多项。如果一位医生花费一两个小时去完成病例,在时间效率产出比的前提下,电子病例的质量就会难以把控。
5、信息化企业难以判断某一项临床数据是否有价值。
类似患者的高血压数据,由于高血压类别较多,哪几类数据需要调用,电子病历系统需要进行判断。如果没有智能的手段去分析,很难把真正需要研究的数据准确地导出,这让健康大数据的分析结果,以及医院研究结论的真实性难以保证。
北大医信的两大解决方案
针对目前电子病历发展的4个问题,北大医信的做法是:
1、针对数据互联互通和信息化程度较低的问题,北大医信在贵州卫生计生委的牵头下,已经成功部署了一个省级电子病历共享平台,这是全国首家省级大数据平台。
在当地,北大医信打通了145家医院的部分临床数据。预计在2017年年底,可以完成200家医院的互联互通。把这些数据向卫委汇集,在这个过程中进行标准的统一。
区域的平台和共享工程包含两件事:一是数据如何抓上来,二是系统如何部署下去。
因此,北大医信将电子病历产品分为了院内和院外两个部分。这套名为智慧区域卫生的区域性平台,共包含5大组成部分:基层医疗、公共卫生、协同医疗、卫生管理和健康管理。
第一部分是医院内部使用的传统电子病历信息系统,通过与其它系统的相互结合,形成完备的电子病历体系。
第二部分是政府级的区域共享平台。它的任务主要是做数据的抓取和互联互通,并不做业务体系的下沉。
第三部分是云医院管理平台,一款云SaaS产品。通过这款产品,可以把基层医疗卫生机构的医院管理信息和电子病历数据抓到一起,统一化管理和部署。
数据的上行通过区域共享数据平台,覆盖二级三级医院。下行通过云医院管理系统,覆盖基层医疗机构。这样就可以把卫生计生委的标准和互联互通的规则直接通过一个中心部署到各个终端里,从而实现数据的统一。
电子病历的互联互通,对于患者而言最直接的好处在于,不需要再带着厚重的病历四处求医。医院之间的病历互认,让患者可以省去很多重复的检验环节。对医院病案科来说,纸质化病历的替代,也能最大限度地节省存储的成本。
目前,除了贵州之外,包括银川、深圳罗湖等地的医共体,张家港、北京海淀区的医联体,北大医信都作为技术提供方参与其中。北大医信SaaS云医院也已在全国400多家基层医疗机构实现了部署。
2、针对电子病历数据质量的问题,北大医信参考国外一些成熟的数据模型和知识库,对自然语言处理之后的数据进行一些优化,从而形成自己的知识图谱。在某一个特定主题下,发掘研究数据点是否有价值,从而判断哪些数据需要调用,从源头保证电子病历获取到的数据的真实性和有效性。
由于病人信息多以文本形式存储,而文本描述通常存在非标准化的歧义。所以,如何把非结构化数据转化为统一的结构化数据,是医学信息处理的重要一环。
将非结构化医疗数据转化为结构化数据,需要一系列医学自然语言处理技术,包括:“医学名实体识别”,“名实体自动编码”,“名实体修饰词识别”,“时间信息抽取”等。北大医信通过这样的创新技术手段,就能够缩短医生在电子病历填写方面所耗费的时间。
与美国电子病历发展的差异性
美国最大的电子病历公司Epic Systems的商业模式是以病人为中心来开发产品,确保帮助医生提供高效、免费的医疗服务。其中,医院和医疗机构是付费方,通过软件产品、云服务、远程医疗和数据共享来盈利。
从就医模式上来讲,美国的电子病历的应用和中国存在较大差异。美国的居民多是通过私人医生来就医。对他们而言,健康要大于疾病,健康位于金字塔的顶端。
而我国则刚好相反,呈倒金字塔形。患者得了疾病才会考虑自己的健康问题。美国的患者并不太需要把自己的病历完全交给医院,基本上私人医生掌握患者很长一段时间的周期性数据。
但在国内,家庭医生制度还处于发展阶段,医疗行为基本上都发生在医疗机构,特别是三甲医院的虹吸效应。所以从数据上看,医院依旧是电子病历的中心点,而非患者。
另外,即使是在医院内,大数据的应用也并不容易,这涉及到医院的管理体制。由于医院所有的数据都集中在信息中心,因此即便是上了电子病历系统,临床医生也无法直接调取数据进行查阅,还需要通过信息科和伦理委员会,包括学术委员会的审核,才能最终对数据进行查阅和应用,这是一个固有的流程。
总之,电子病历在健康医疗大数据的应用发展,由于各方面条件尚未成熟,还尚需时日。随着顶层政策的推行,区域卫生平台的建立,医院系统的不断更新换代,电子病历的潜力正被不断被释放出来。
文|郝雪阳
近期推荐
★ 药品“零加成”九月底要在所有公立医院推行,还有哪些问题待解?
★ 成立8年如何催生并影响无创产前检测产业?贝瑞和康创始回忆录
★ 美国IEEE院士加盟,红杉资本领投,这家医疗人工智能公司究竟有何魅力?
声明:动脉网所刊载内容之知识产权为动脉网及相关权利人专属所有或持有。文中出现的采访数据均由受访者提供并确认。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。