名老中医医案 知识图谱
随着信息时代的来临,知识呈现出爆炸式增长的现象,计算机处理技术水平和存储能力也得到了迅速提高,且实现了越来越便捷的信息分析、检索,甚至可视化等先进的功能,使得近年来出现了以知识单元为前提、可以快速获取知识及了解学科前沿知识的一种方法,即知识图谱。知识图谱的概念是由谷歌公司提出的。谷歌公司于 2012 年发布了知识图谱项目,并宣布将以此为基础构建下一代智能化搜索引擎。目前,知识图谱的应用也得了到中医界的重视。
图谱构建方法
1. 数据来源
中医医案知识图谱数据主要分为“医案数据”和“术语数据”,其中医案数据来源于刘炳凡名老中医工作室以及首届和第二届国医大师们对内、外、妇、儿、肿瘤等疾病的专病用方经验。
2. 数据标准化
中医医案是医者在诊疗过程中自然语言的描述,其表述缺乏规范性和标准性。目前随着各种书写规范、诊疗标准及教材的推广,术语应用逐渐趋向统一,但实际应用中还存在诸多问题。中医医案的个性化、非标准化加大了源数据处理的难度。依据“标准”替换不规范的术语,保证图谱节点内容的一致性。
3. 关系定义
知识图谱的本质是通过定义实体及实体之间的关系来关联知识。“实体”作为图谱知识节点表示方法,表达了知识的结构、概念之间的关系。在图谱中每一个实体都包含名称、定义和注释。人们通常将实体关系定义为 RDF 三元组,以中医医案知识图谱为例,三元组的形式为“实体 - 关系 - 实体”,其中实体为医案中的病、证、治、方、药,而关系可用来连接两个实体,刻画它们之间的关联。
4. 图形化展示

图1:实体关系示例

图2:医案知识图谱展示界面(1)
图谱以鼻咽癌为起点,以药物为终点,清晰地呈现了中医医案中病、证、治、方、药之间的关联,相较于传统的知识检索,知识图谱能够协助用户迅速发现所关注的知识衍生,驾驭复杂的中医药知识体系,并在浏览中发现具有潜在关联的知识孤岛。


图3:医案知识图谱展示界面(2)
中医学的诊疗精髓即辨证论治,在中医医案中尽显无遗,正如章太炎先生所谓: “中医之成绩,医案最著,欲求前人之经验心得,医案最有线索可寻”。中医医案的记录形式均以辨证思路为核心,强调个案的个性差异。但是,中医医案相对零散,多以文本作为载体呈现,医案之间缺乏交互性,导致学习者难以从零散的医案中组织知识进行高效的管理与分析。针对以上问题,提出以医案中的“四诊信息”和“组方用药”作为数据输入; 以知识图谱的形式将辨证与疾病加以关联,以病证结合的方式探讨某一疾病的某一证型关联到的某种治法,以及该治法所涉及到的中医图 3 医案知识图谱展示界面(2)方剂和药物组成,从而可以更好地发现名老中医对具体疾病、具体证型的治疗原则和用方、用药规律。
同时,从该图谱构建过程中我们发现,由于某一医家具体疾病的医案数量有限,导致图谱关联该疾病所涉及的范围存在局限性。为此,我们将来源不同的名老中医医案进行收集和整理,虽然在数量上弥补了不足,但由于不同医家对疾病的具体证型和划分标准存在差异,很难做到标准化、规范化。即使研究者进行规范化后也存在一定的主观性,给图谱关联结果带来了一定的偏倚。相信随着中医药临床术语标准化应用的推广和机器学习以及自然语言处理技术的成熟,将知识图谱和中医药文献、电子病历等领域的医学知识联系起来,构建全医学领域的知识图谱,必将在中医药事业发展中发挥更加重要的作用。
文献来源:邓宇,周卫强,张振铭,宁泽璞,谭英.基于名老中医医案的知识图谱构建[J].湖南中医杂志,2019,35(07):186-187.
