【信息抽取】如何使用BERT进行关系抽取

2024-06-11 22:07:29

事物、概念之间的关系是人类知识中非常重要的一个部分，但是他们通常隐藏在海量的非结构文本中。为了从文本中抽取这些关系事实，从早期的模式匹配到近年的神经网络，大量的研究在多年前就已经展开。

然而，随着互联网的爆炸发展，人类的知识也随之飞速的增长，因而对关系抽取（Relation Extraction, RE）提出了更高的要求，需要一个有效的RE系统，能够利用更多的数据；有效的获取更多的关系；高效的处理更多复杂的文本；具有较好的扩展性，能够迁移到更多的领域。

本文首先介绍一种基于预训练模型的关系抽取方法，即能够引入现今最有效的预训练模型BERT，来进行关系分类的方法。

作者&编辑 | 小Dream哥

1 预训练模型

预训练模型是近一两年来NLP领域取得的非常重要的进展。基于大型的预训练模型finetune下游任务，是如今NLP领域非常流行的做法，在很多的NLP任务中都取得了SOTA的效果，我们在此前也写了很多的文章进行介绍，感兴趣的读者可以看看：

【NLP】深入浅出解析BERT原理及其表征的内容

【NLP】GPT：第一个引入Transformer的预训练模型

【NLP】XLnet：GPT和BERT的合体，博采众长，所以更强

【技术综述】深度学习在自然语言处理中的应用

【每周NLP论文推荐】从预训练模型掌握NLP的基本发展脉络

既然预训练模型这么有效，自然会有用它来做关系抽取和分类的了，我们今天就介绍基于BERT的关系抽取模型。

本文涉及的模型参考论文如下：

[1] Wu S , He Y . Enriching Pre-trained Language Model with Entity Information for Relation Classification[J]. 2019.

[2] Giorgi J , Wang X , Sahar N , et al. End-to-end Named Entity Recognition and Relation Extraction using Pre-trained Language Models[J]. 2019.

2 关系分类

引入BERT进行关系分类，主要目的是为了利用BERT预训练时学到的大量语言本身的知识。基于此，结合关系分类任务的特点，下面介绍一种典型的基于BERT的关系分类模型，并做一些有益的讨论。

1) 模型结构

如上图所示，是该模型的结构，下面做一个简单的介绍：

1.输入层，跟典型的BERT输入层无异。需要注意的是，在这个模型中，分别用特殊符号$和#号标识两个实体的位置。

2.利用了BERT特征抽取后2个部分的特征：

BERT【CLS】位置的embeding和两个实体相对应的embeding

3.将上述3个特征拼接起来，再接一个全连接层和softmax层输出关系的分类。

论文中用到的模型参数如下，感兴趣同学可以复现一下：

2) 模型结果

模型结构并不复杂，但是取得了不错的效果：

我们可以认为模型对分类任务起到关键效果的部分有3个：

1.BERT【CLS】embedding，学习到了句子级的特征

2.BERT实体embedding，学习到了实体的语义特征

3.特殊符号，带给了模型实体的边界及位置信息

论文做了实验来论证这3部分特征的作用，如下图所示：

1.R-BERT-NO-SEP-NO-ENT 代表既没有分隔符也没有实体embedding特征的模型

2.R-BERT-NO-SEP代表既没有分隔符的模型

3.R-BERT-NO-ENT代表既没有实体embedding特征的模型

4.R-BERT代表完整的模型结构

结果可以看出，实体embedding和分隔符对模型效果贡献了很大。这主要是因为，在关系分类的任务中，句子的语义信息和两个实体的词级信息均很重要。通过两个分隔符，能够帮助BERT学习两个实体的位置，从而提高模型对实体的表征能力。

3 BERT Joint抽取模型

上述模型是一个单纯的关系分类模型，在前面的关系抽取文章中我们提到过，联合抽取通常具有更好的效果，下面介绍一种基于BERT的联合抽取模型，即通过一个模型能够得到输入文本中的实体以及实体之间的关系，供读者参考。

1) 模型结构

如上图所示，是本文要介绍的联合抽取模型的结构图，可以把这个模型分成3个部分：

1.NER Module，实体抽取模块。

2.RE Module，关系分类模块。

3. BERT，共享特征抽取模块。

对于实体抽取模块，跟此前我们介绍的基于BERT的实体抽取模型没有差别，不了解的同学可以出门左转先看一下：

【NLP-NER】如何使用BERT来做命名实体识别

RE模块相对复杂一点，我们详细介绍一下，

RE模块的输入将两个部分的输入近拼接得到：

1.BERT对输入序列编码得到的特征序列；

2.NER模块的输出，经过argmax函数得到一个跟输入序列长度相同的，转化为固定维度的序列。

拼接得到的向量分别通过一个Feed Forward层，通过一个biaffine分类器，预测出实体之间的关系。

biaffine分类器的实际作用如下：

2) 模型结果

如上图所示，该模型在几个数据集中均取得了不错的效果，感兴趣的同学可以实现一下试试。

总结

目前，基于预训练模型的关系抽取即分类模型均取得了SOTA的效果，在实际的生产中也都得到了一定的应用。从事NLP相关工作的读者，务必要熟悉相关的模型。

下期预告：暂无

知识星球推荐

扫描上面的二维码，就可以加入我们的星球，助你成长为一名合格的自然语言处理算法工程师。

知识星球主要有以下内容：

(1) 聊天机器人。

(2) 知识图谱。

(3) NLP预训练模型。

转载文章请后台联系

侵权必究

其他内容

动态词向量在序列标注任务中的应用与实践

摘要:动态词向量会根据上下文动态的进行变化,相比于传统的 Word2Vec 等静态词向量,能更好的处理 NLP 任务中的 "一词多义" 的现象.本文介绍了动态词向量在序列标注任务上 ...
自监督学习: 人工智能的未来

导读什么是自监督学习?为什么自监督学习是AI的未来?自监督学习如何实现? 本文将回顾下自监督学习的前世今生,介绍它在CV.NLP.Graph.RecSys.RL等领域已经取得的令人惊叹的效果! 1. ...
NLP任务增强：通过引入外部知识来提供额外信息

NewBeeNLP 永远有料,永远有趣 186篇原创内容公众号 0.前言 NLP任务中,常见的做法是根据「当前输入」进行建模,进而设计出我们的模型,通常用到的信息只有「当前局部的信息」. 这和人类最 ...
综述 | 三大路径，一文总览知识图谱融合预训练模型的研究进展

当前,预训练模型已是AI领域较为成熟的一项技术,但由于基于神经网络架构的模型本身不具有常识能力,在一些涉及逻辑推理和认知的任务上力有不逮. 近年来,知识图谱越来越受到人们的关注,知识图谱旨在提供一种复 ...
ENRIE：知识图谱与BERT相结合，为语言模型赋能助力

来自:朴素人工智能感谢清华大学自然语言处理实验室对预训练语言模型架构的梳理,我们将沿此脉络前行,探索预训练语言模型的前沿技术,红框中为已介绍的文章,绿框中为本期介绍的模型,欢迎大家留言讨论交流. E ...
NLP模型BERT和经典数据集！

每日干货 &每月组队学习,不错过 Datawhale干货作者:陈安东,中央民族大学,Datawhale成员对于刚入门NLP的伙伴来说,看到NLP任务很容易觉得眼花缭乱,找不到切入点.总的来 ...
预训练模型，NLP的版本答案！

NewBeeNLP 永远有料,永远有趣 222篇原创内容公众号 1. 碎碎念大概是两年前,跟百度的nlp组,参与合作过Ernie在对话系统上的应用. 问题其实很多,模型训练慢,一个月迭代一次很正常 ...
【文本信息抽取与结构化】详聊如何用BERT实现关系抽取

常常在想,自然语言处理到底在做的是一件什么样的事情?到目前为止,我所接触到的NLP其实都是在做一件事情,即将自然语言转化为一种计算机能够理解的形式.这一点在知识图谱.信息抽取.文本摘要这些任务中格外明 ...
【信息抽取】介绍一种端到端的关系抽取方法

事物.概念之间的关系是人类知识中非常重要的一个部分,但是他们通常隐藏在海量的非结构文本中.为了从文本中抽取这些关系事实,从早期的模式匹配到近年的神经网络,大量的研究在多年前就已经展开. 然而,随着互联 ...
【信息抽取】如何使用循环神经网络进行关系抽取

事物.概念之间的关系是人类知识中非常重要的一个部分,但是他们通常隐藏在海量的非结构文本中.为了从文本中抽取这些关系事实,从早期的模式匹配到近年的神经网络,大量的研究在多年前就已经展开. 然而,随着互联 ...
【信息抽取】如何使用卷积神经网络进行关系抽取

事物.概念之间的关系是人类知识中非常重要的一个部分,但是他们通常隐藏在海量的非结构文本中.为了从文本中抽取这些关系事实,从早期的模式匹配到近年的神经网络,大量的研究在多年前就已经展开. 然而,随着互联 ...
【信息抽取】NLP中关系抽取的概念，发展及其展望

事物.概念之间的关系是人类知识中非常重要的一个部分,但是他们通常隐藏在海量的非结构文本中.为了从文本中抽取这些关系事实,从早期的模式匹配到近年的神经网络,大量的研究在多年前就已经展开. 然而,随着互联 ...
【文本信息抽取与结构化】深入了解关系抽取你需要知道的东西

常常在想,自然语言处理到底在做的是一件什么样的事情?到目前为止,我所接触到的NLP其实都是在做一件事情,即将自然语言转化为一种计算机能够理解的形式.这一点在知识图谱.信息抽取.文本摘要这些任务中格外明 ...
【直播课】知识图谱第三期直播-关系抽取及分类

前言最近几年知识图谱作为人工智能领域很热门的一项技术,已经在不少领域都取得了不少成功的落地案例.不过知识图谱作为人工智能的一个底层技术,确实不如图像,语音等技术一样让人能很直观的感受到它的存在.于是 ...
关系抽取一步到位！

本文主要详细解读关系抽取SOTA论文Two are Better than One:Joint Entity and Relation Extraction with Table-Sequence E ...
复杂语境下的实体关系抽取

嘉宾:曾道建湖南师范大学助理教授整理:盛泳潘重庆大学助理研究员出品:DataFunTalk 导读:实体关系抽取是知识图谱构建过程中的一个重要环节,同时也是信息抽取中的一个主要任务.近年来, ...

【信息抽取】如何使用BERT进行关系抽取

相关推荐