版权说明 操作指南
首页 > 成果 > 详情

一种实体关系联合抽取方法、装置、设备及介质

认领
导出
反馈
分享
QQ微信 微博
成果类型:
专利
发明/设计人:
曾道建;谢依玲;赵超;田剑
申请/专利权人:
长沙理工大学
专利类型:
发明专利
语种:
中文
申请时间:
2020-06-12
申请/专利号:
CN202010538132.5
公开时间:
2020-09-15
公开号:
CN111666427A
主申请人地址:
410114 湖南省长沙市天心区万家丽南路二段960号
申请地区:
湖南
机构署名:
本校为第一完成单位
主权项:
1.一种实体关系联合抽取方法,其特征在于,包括: 获取训练样本数据; 利用所述训练样本数据对预先搭建的实体关系抽取模型进行训练,得到训练后模型;其中,所述实体关系抽取模型中包括自注意力层;所述自注意力层用于在训练过程中基于句子中其他三元组对当前预测关系的影响进行注意力计算; 当获取到待进行实体关系抽取的目标文本,利用所述训练后模型输出对应的实体关系抽取结果。 2.根据权利要求1所述的实体关系联合抽取方法,其特征在于,所述实体关系抽取模型,还包括BERT层、NER层以及表填充层; 相应的,所述利用所述训练样本数据对预先搭建的实体关系抽取模型进行训练,包括: 将所述训练样本数据输入至所述BERT层,通过所述BERT层对句子进行划分,并将划分出的每个词映射为对应的词向量,以得到句子的上下文表示; 通过所述NER层对所述词向量进行线性CRF计算,得到对应的预测实体标记序列,以及将所述预测实体标记序列转换为对应的标签嵌入序列; 对所述词向量和所述标签嵌入序列进行拼接,得到目标向量; 通过所述表填充层对所述目标向量进行实体关系预测,得到对应的预测实体关系; 将所述预测实体关系输入至所述自注意力层进行注意力计算,得到对应的注意力计算后实体关系; 对所述注意力计算后实体关系与预定义关系向量进行内积运算,然后通过多标签分类器进行分类,得到每个词对应的实体关系。 3.根据权利要求2所述的实体关系联合抽取方法,其特征在于,还包括: 利用标签序列损失函数计算标签序列损失;其中,所述标签序列损失函数为 其中,τ为训练集,所述训练集包括全部所述训练样本数据,y*为词序列x的人工标注的正确关系,所述词序列为通过所述BERT层对句子进行划分,得到的序列,p(y*|x)为y*对应的概率值。 4.根据权利要求2所述的实体关系联合抽取方法,其特征在于,还包括: 利用表填充损失函数计算表填充损失;其中,所述表填充损失函数为 其中,LRE为表填充损失,τ为训练集,所述训练集包括全部所述训练样本数据,x为训练集τ句子中对应的词序列,为词xi的训练集中人工标注的正确关系;表示词xi的第j个有关系的实体,表示词xi和间的训练集中人工标注的正确关系,第k个关系表示为为词xi和间有关系的概率。 5.根据权利要求2所述的实体关系联合抽取方法,其特征在于,所述通过所述BERT层对句子进行划分,并将划分出的每个词映射为对应的词向量,包括: 通过所述BERT层对句子进行划分,将划分出的每个词转换为对应的向量,然后将转换出的向量输入至编码器编码,以得到所述词向量。 6.根据权利要求2所述的实体关系联合抽取方法,其特征在于,还包括: 计算训练损失;所述训练损失包括标签序列损失和表填充损失。 7.一种实体关系联合抽取装置,其特征在于,包括: 数据获取模块,用于获取训练样本数据; 模型训练模块,用于利用所述训练样本数据对预先搭建的实体关系抽取模型进行训练,得到训练后模型;其中,所述实体关系抽取模型中包括自注意力层;所述自注意力层用于在训练过程中基于句子中其他三元组对当前预测关系的影响进行注意力计算; 关系抽取模块,用于当获取到待进行实体关系抽取的目标文本,利用所述训练后模型输出对应的实体关系抽取结果。 8.根据权利要求7所述的实体关系联合抽取装置,其特征在于, 还包括训练损失计算模块,用于计算训练损失;所述训练损失包括标签序列损失和表填充损失。 9.一种实体关系联合抽取设备,其特征在于,包括处理器和存储器;其中, 所述存储器,用于保存计算机程序; 所述处理器,用于执行所述计算机程序以实现如权利要求1至6任一项所述的实体关系联合抽取方法。 10.一种计算机可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的实体关系联合抽取方法。
摘要:
本申请公开了一种实体关系联合抽取方法、装置、设备及介质,包括:获取训练样本数据;利用所述训练样本数据对预先搭建的实体关系抽取模型进行训练,得到训练后模型;其中,所述实体关系抽取模型中包括自注意力层;所述自注意力层用于在训练过程中基于句子中其他三元组对当前预测关系的影响进行注意力计算;当获取到待进行实体关系抽取的目标文本,利用所述训练后模型输出对应的实体关系抽取结果。这样,对包括自注意力层的实体关系抽取模型进行训练,能够在实体关系的抽取过程中考虑其他三元组对当前预测关系的影响,从而提升实体关系抽取的准确度。

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com