建立知识图谱领域标准体系!张钹院士、李涓子教授等人共论知识图谱产业发展

2021 年 1 月 8 日,由中国电子技术标准化研究院主办的 “第一届知识图谱产业发展论坛” 在北京成功召开。会上发布了首批知识图谱产品认证证书、知识驱动先锋企业榜单、优秀案例集等相关成果。
论坛还邀请到了中国科学院院士、清华大学教授张钹,电子标准院副院长程多福,工业和信息化部科技司标准处处长徐鹏,清华大学人工智能研究院知识智能中心主任李涓子等专家学者出席论坛,分享各方在技术研究、行业应用和市场推广中的先进经验。来自知识图谱领域的相关专家和企业代表共计 70 余人参加了现场会议,线上直播点击量达到 4 万 4 千余人次。

“首批知识图谱认证企业名单”发布

为了总结梳理知识图谱在各领域落地应用中的好经验、好做法,电子标准院联合联想、华为等 32 家单位编写了《认知智能时代:知识图谱实践案例集》及其速读版,并在会上由张钹院士和程多福副院长共同见证发布。
案例集汇集了知识图谱在智慧电网、智慧能源、智慧金融、智慧医疗、智慧司法、智慧教育、智慧营销、智能制造、智慧交通、智慧政务、智慧公安等 13 个领域的 38 个实践案例,从基本情况、案例成效、技术路线、示范意义及展望等方面对各案例进行了阐述。
为进一步强化和提升知识图谱相关产品的质量,规范知识图谱在构建与应用过程中的性能指标和功能要求,电子标准院还联合20余家单位共同研制了《知识图谱构建平台认证技术规范》、《知识图谱应用平台认证技术规范》,并完成了首批13家单位的产品认证工作。会上,程多福副院长向通过知识图谱产品认证的企业颁发了认证证书。
其中,由张钹院士担任首席顾问的北京智谱华章科技有限公司(智谱・AI),凭借其优秀的知识图谱产品 “科技情报知识图谱平台(V2.1.0)”荣登榜上。
当前,人工智能的发展经历了从表示、计算到感知两个阶段,下一个阶段的核心是认知。2016 年,中国科学院院士、清华大学人工智能研究院院长张钹提出了第三代 AI 体系的雏形,并于 2018 年底正式公开第三代 AI 的理论框架体系,其核心思想为:建立可解释、鲁棒性的 AI 理论和方法;发展安全、可靠、可信及可扩展的 AI 技术;推动 AI 创新应用。
清华大学教授、系副主任,智谱・AI 首席科学家唐杰此前也表示,全新的认知图谱概念,包括三个核心:常识图谱。比如说高精度知识图谱的构建,领域制度的应用系统,超大规模城市知识图谱的构建,还有基于知识图谱的搜索和推荐等。逻辑生成。与计算模型相关,需要超大规模的预训练模型,并且能够自动进行内容生成。认知推理。即让计算机有逻辑推理和思维能力,像人一样思考。
“作为认知图谱概念的提出者,知识工程技术的引领者,我们认为,知识图谱+深度学习+认知心理,打造知识和认知推理双轮驱动的框架,将是接下来一个重要的研究方向。”唐杰表示。
此外,电子标准院还遴选了通过应用知识图谱取得显著成效的 12 家 “知识驱动先锋企业”,并由韦莎副主任和李涓子教授共同颁发了证书。
在 2017 年,国务院印发了《新一代人工智能发展规划》,规划中提出了加强知识计算引擎与知识服务技术领域的具体的专项工作的意见。“首批知识图谱认证企业名单” 的发布不仅是对响应国务院新一代人工智能发展规划的优秀的中小企业的肯定,同时也有利于推动广大的人工智能企业增强自身发展知识图谱技术的能力和数据服务工作。
知识图谱已经相继在智能能源、智能金融、智能制造、智能医疗等领域已经得到了很好的应用发展,并且呈现了很强的发展潜力。电子标准院希望通过这些平台建设、相关的案例征集和产品认证,更好的促进人工智能知识图谱在产业应用方面是深度与广度。
知识图谱标准化与产品认证规范解读
会上,电子标准院的李瑞琪博士做了名为《知识图谱标准化与产品认证规范解读》的报告,报告主要分为四个部分:相关产业政策、产业生态图谱、标准化现状介绍、认证技术规范解读。
在政策不熟、技术研发、标准研制、产业化推广、前沿应用场景试点等多方面因素的共同驱动下,知识图谱逐渐实现了在众多领域的落地应用与深度融合,同时在各行业的数字化转型过程中,跨领域、行业或产业的知识图谱也逐渐获得关注。
随着知识图谱在各领域的深化应用,已形成了知识工程顶层标准、知识图谱共性基础标准、知识图谱细化域标准及配套白皮书、案例集等协同推进的标准化工作局面,在研重点及其关系如下图所示。
知识图谱的高质量构建既有赖于知识表示、知识建模、知识获取、知识融合、知识储存、知识计算等核心环节的协同发展,也有赖于各个支撑环节的保障,知识图谱构建流程如下图所示。
知识图谱构建与应用相关软件产品及服务平台数量快速攀升,宣传推广维度繁杂,用户企业在线筛选、采购、集成、部署及验收等方面耗时长、成本高且质量难保障。
为进一步规范知识图谱构建与应用相关软件产品或服务平台的基础功能及性能要求,中国电子技术标准化研究院联合北京赛西认证等 10 余家单位依托国家标准和团体标准等研制了《知识图谱构建平台认证技术规范》、《知识图谱应用平台认证技术规范》及配套实施规则。
产品认证技术规范的指标体系主要分为两个部分:知识图谱构建与知识图谱应用。知识图谱应用包括了几个特性:安全性、可靠性、响应性、可移植性和易用性。知识图谱构建从知识表示、知识建模、知识获取、知识融合、知识储存、知识计算几个方面进行审核认证。
李瑞琪博士表示,下一步的工作计划主要侧重于三个方面一是持续推进产品认证及能力成熟度评估工作;二是组建知识图谱产业推进方针;三是推进知识建模、知识融合、知识交换及细分领域标准研制。

张钹院士:知识图谱的产业发展

清华大学人工智能研究院的张钹院士在会上作了名为《知识图谱的产业发展》的主旨报告。
张钹院士首先从本体论角度扩展了知识图谱的定义:以对象和它们之间的关系来描述。并通过定义一组概念和类别来表示这些对象。还包括个体、特征、规则、公理、事件和功能等概念。他将知识图谱产业分为了两大类:一是“+知识图谱”,主要包括信息网络产业+知识图谱和AI产业+知识图谱;二是“知识图谱+”,主要是围绕知识图谱的基础设施。在会上张钹院士主要讲述了第一大类。
张院士表示,知识图谱产业发展面临着诸多的挑战;在知识图谱的构建上,从结构化数据(表格、图),文本(图书、新闻),网络采集的数据(文献、网页)等(人工或半自动)提取“实体”和“关系”是一项十分费时与费力的工作,而且具有误差。在隐私与知识产权方面,也颇有争议。
在与人工智能的结合方面,经历了几个发展阶段:第一代人工智能是符号主义 (知识驱动),运用认知心理学的知识表示(规则)与获取的方法,但并不实用;第二代人工智能是连接主义 (数据驱动),采用神经科学,脑启发 (Brain-inspired) 的路线,但是单纯基于数据有很大的局限性:不安全、不可信、不可靠、不易推广。
所以为了解决前两代的不足,第三代人工智能必须采用“知识驱动+数据驱动”的方法。张钹院士指出利用知识、数据、算法、算力四项要素,发展以知识驱动与数据驱动融合的第三代人工智能势在必行。
针对知识图谱表示的局限性,有待加强对自然语言所表示自由文本的应用,并考虑具备容错能力的推理机制;知识图谱产业发展中还面临构建方法限制、隐私、知识产权等多个挑战,有待关注和突破。

李涓子:知识工程自动化

清华大学计算机系知识工程研究所、清华大学人工智能研究院智能研究中心的李涓子教授在会上作了名为《知识工程自动化:知识生产和融合平台》的主题报告。
李涓子教授指出了目前知识智能研究面临的挑战:在基础理论上,如何去实现知识驱动和数据驱动相结合的知识表示和推理;在关键技术上,如何构建高精度、大规模知识获取和集群体智能的、开放的、融合的结构化知识资源;在应用示范上,需要建立知识图谱自动化支撑平台,去赋能各个行业和领域的应用。
清华大学知识智能研究中心以以下三个方面为目标:
一是开展理论研究。支持鲁棒可解释人工智能的大规模知识表示、获取、推理与计算的基础理论和方法。
二是构建知识平台。建设融合世界知识、常识知识的大规模知识图谱以及典型行业知识库,建成知识自动化和知识计算服务平台。
三是促进交流合作。经常性地组织知识智能有关学术活动,增进学术交流;普及知识智能技术,促进产学合作。
构建知识平台方面其主要的工作是“以百科知识的自动化生产”,把百科知识这种既包含结构化,也包含半结构化和非结构化的知识来进行结构化知识构建,同时去链接文本资源。目标实际上是希望去规范化百科知识的生产的处理流程,然后提供全流程的功能接口,并且把它赋能到领域的图谱构建。
会议还邀请了国网电力物联网平台技术联合实验室常务副主任冯珺、杭州依图医疗技术有限公司科研总监颜子夜、中车株洲电力机车研究所有限公司AI技术主任设计师李晨和华为技术有限公司高级技术专家侯圣峦等知名专家就知识图谱标准化、知识工程自动化、企业级知识计算平台建设及知识图谱在电力、医疗和制造业等领域中的应用分享了主题报告。
为推动构建完善知识图谱生态体系,促进知识图谱相关产学研用各方的协作与交流,本次会议同期还召开了知识图谱产业推进方阵筹备会,就方阵组织架构、主要任务、运营与合作机制及未来规划等议题进行了探讨。后续,将进一步深入讨论方阵组建方案。
知识图谱产业推进方阵筹备会参会单位(排名不分先后)
编辑:吴玲竹
编审:王新凯
排版:沈晶
参考链接:
https://mp.weixin.qq.com/s/Cz7aOnjYJiWhzQuFZSB9kg
(0)

相关推荐