LW
论文的主要工作以基于知识图谱的专利推荐为主题,从研究背景和意义、国内外研究现状、用户需求分析、系统概要设计、核心算法设计、系统详细设计以及系统实现与测试等几个方面对基于知识图谱的专利推荐系统进行详细描述。
第1章 绪论
1.1 背景和意义
传统的文献检索方法难以保证快速从海量的文献集合中获取关键的文献信息和相关知识,更难挖掘数据中蕴含的关联关系
本文设计和构建的专利数据知识图谱,不仅基于专利的TCP分类号、申请人、地区等外部信息从宏观上研究科学技术的发展概况W。而且对专利信息进行文本挖掘,提取科学技术关键词,抽取各专利之间在技术、合作等方面存在的内在联系,从微观上研究科学技术发展的关联关系。本文结合现有的中文知识图谱技术,对专利数据知识图谱进行构建,获取百科知识和科技博客的相关数据,实现对专利数据中的技术名词、机构等实体知识进行内容补充。
1.2 国内外研究现状
google搜索的知识图谱、百度的“知心”知识图谱、搜狗的“知立方”、上海交通大学的学术知识图谱AceKG、国内外学者在专利上的研究
1.3 系统解决的主要问题
1.源数据获取与集成
2.专利之间关联关系研宄
3.专利数据知识图谱构建
4.面向需求的专利推荐
5.系统设计
1.4 本文主要工作
基于知识图谱技术,结合自然语言处理算法,实现专利数据的知识检索与推荐,并将其应用到创新工作中。
1.5 论文的组织结构
第2章系统需求分析
基于知识图谱的专利推荐系统的目标和用户需求,依据从企业和普通用户调研获取的业务需求报告,分析确定系统的需求和功能。
2.1 系统目标与主要任务
目标:
整合不同来源和结构的数据,包括专利库和各种知识平台等,提取数据中蕴含的知识实体和关系,结合本文设计的算法模型,实现专利数据知识图谱构建、专利知识检索、面向发明需求的专利推荐与专利多维展示等功能。
任务:
1. 数据的分析与计算
2. 系统展示结果的可视化设计。
2.2 系统功能需求分析
2.2.1 多源数据获取
2.2.2 专利数据处理
2.2.3 专利数据知识图谱构建
2.2.4 专利知识检索
1.专利信息检索需求分析
2.作者信息检索需求分析
3.主题信息检索需求分析
4.机构信息检索需求分析
2.2.5 面向发明需求的专利推荐
2.2.6 专利多维展示
2.3 系统非功能性需求分析
页面设计需求、系统性能需求、系统可靠性需求和系统的可扩展性需求。
第3章 系统概要设计
3.1 系统功能架构设计
3.2 系统软件架构设计
3.3 系统技术架构设计
3.4 系统网络架构设计
第4章 系统详细设计
4.1 核心算法介绍
4.1.1 基于Keras的深度学习分词模型
4.1.2 基于TextRank的关键词提取算法
4.1.3 RAKE关键短语提取算法
4.1.4 基于K-means的实体识别算法
4.1.5 基于多维评分模型的专利推荐算法
4.2 多源数据获取
4.3 专利数据处理
4.4 专利数据知识图谱构建
4.4.1 专利分类主题词库构建
4.4.2 专利的实体与属性提取
4.4.3 实体识别
4.4.4 专利的关系与属性提取
4.4.5 三元组数据存储
4.4.6 专利数据知识图谱构建类图
4.5 专利知识检索
4.5.1 专利信息检索
4.5.2 作者信息检索
4.5.3 主题信息检索
4.5.4 机构信息检索
4.6 面向发明需求的专利推荐