实体关系联合抽取方法技术

技术编号:31506579 阅读:28 留言:0更新日期:2021-12-22 23:38
本发明专利技术涉及计算机技术领域,公开了一种实体关系联合抽取方法,本发明专利技术通过BiLSTM对待测语句进行编码,获取token的固定维表示;利用两个自注意力层和门控制机制捕获实体表征之间的权重值,从而获得所述待测语句对应的实体;利用GANCE模型对所述实体进行解码获得预测关系;引入同方差不确定性来实现自动加权损失计算,并更新预测关系获得最终抽取结果,由于采用双重自注意力机制和门控制机制动态融合标签信息,有效获取实体远距离依赖关系,并引入同方差不确定性自动平衡NER和RE两个子任务的权重损失,实现了在实体关系抽取中提升了准确性的技术效果。性的技术效果。性的技术效果。

【技术实现步骤摘要】
实体关系联合抽取方法


[0001]本申请涉及计算机
,特别是涉及一种实体关系联合抽取方法。

技术介绍

[0002]实体识别与关系抽取作为文本挖掘中的重要步骤,近年来成为研究的热点。其主要目的是从非结构化文本中自动地抽取实体以及相关实体关系结构,在知识图谱构建,信息检索和系统问答等自然语言处理任务中起着至关重要的作用。
[0003]传统的实体关系抽取分为两个步骤,即以管道式模式进行命名实体识别(NameEntityRecognize,NER)和关系抽取(RelationExtract,RE)。然而该方法存在错误传递的缺点,即在NER步骤中产生的错误会影响RE的效果。,该方法的两个子任务在交互过程中忽略了任务相关性,然而这两个子任务之间的相关性是有助于提高关系抽取的识别率。尽管先前的工作已经取得很大成果,然而这些方法仍然存在不足。首先,目前所提出的联合模型或管道模型没有关注两个子任务损失的权重问题,忽略了任务之间的相对权重损失。然而对于联合模型来说,正确的权重损失对于抽取结果是至关重要的。其次,关系抽取通常情况下依赖的是一些相关实体,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种实体关系联合抽取方法,其特征在于,所述方法包括:通过BiLSTM对待测语句进行编码,获取token的固定维表示;利用两个自注意力层和门控制机制捕获实体表征之间的权重值,从而获得所述待测语句对应的实体;利用GANCE模型对所述实体进行解码获得预测关系;引入同方差不确定性来实现自动加权损失计算,并更新预测关系获得最终抽取结果。2.如权利要求1所述的方法,其特征在于,所述通过BiLSTM对待测语句进行编码,获取token的固定维表示的步骤之前,还包括:使用分布式特征表示作为BiLSTM的输入。3.如权利要求1所述的方法,其特征在于,所述利用两个自注意力层和门控制机制捕获实体表征之间的权重值,从而获得所述待测语句对应的实体的步骤之前,还包括:利用自注意力机制构建两个注意力层,并选择比例点积的方法。4.如权利要求1所述的方法,所述利用GANCE模型对所述实体进行解码获得预测关系的步骤之前,还包括:收集待训练参数,获取所述参数中的标签;利用门控机制动态的所述将标签信息融合到模型GANCE中,以对模型进行训练。5.如权利要求4所述的方法,其特征在于,所述收集待训练参数,获取所述参数中的标签的步骤,包括:收集待训练参数,采用BIO标注方式对所述待训练参数进行标注以获得对应的标签;采用随机初始化的向量作为标签的模型初次输入。6.如权利要求4所述的方法,其特征在于,所述利用门控机制动态的所述将标签信息融合到模型GANCE中,以对模型进行训练的步骤,包括:利用门控机制动态的将标签信息融合到模型GANCE中,其具体方法为:α=σ(W
t
M
t
+W
l
L+b
f
)M
F
=...

【专利技术属性】
技术研发人员:赵薇
申请(专利权)人:湖南警察学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1