当前位置: 首页 > 专利查询>北京大学专利>正文

实体关系抽取方法、装置、设备及介质制造方法及图纸

技术编号:37442883 阅读:31 留言:0更新日期:2023-05-06 09:14
本发明专利技术提供一种实体关系抽取方法、装置、设备及介质,包括:基于待识别文档的目标实体对以及待识别关系,确定包含所述目标实体对与所述待识别关系之间的映射关系的三维数据结构;基于所述三维数据结构,使用三重注意力机制分别捕获所述三维数据结构在不同语义空间下的交互特征;基于所述交互特征,确定所述目标实体对的关系类别概率;其中,所述关系类别概率用于确定所述目标实体对所属的语义关系类型,所述三重注意力机制的卷积层采用形变卷积。本发明专利技术用以解决现有技术中文档的实体关系推理的准确性不够高的缺陷,实现一种更准确的文档的实体关系抽取方法,提升文档的所有信息的关系推理能力。的关系推理能力。的关系推理能力。

【技术实现步骤摘要】
实体关系抽取方法、装置、设备及介质


[0001]本专利技术涉及自然语言处理技术
,尤其涉及一种实体关系抽取方法、装置、设备及介质。

技术介绍

[0002]实体关系抽取任务是信息提取中的重要任务之一,它为下游任务提供结构化信息,例如知识图的构建,自动抽象和机器问答。实体关系抽取是从文本中抽取出一对实体并给出实体间关系,可以分为管道式抽取和联合式抽取两种方式,管道式抽取即先后进行实体识别和关系抽取两个子任务;联合式抽取则是同时进行实体识别和关系分类。
[0003]实体关系抽取是从非结构化文本中抽取实体关系三元组,需要模型具有更强的建模和推理能力来有效捕捉文本中存在的实体内和实体间的复杂交互,如相关实体在不同语义空间下的关联,来确定目标实体对及所属的关系类别。
[0004]而在许多文本中,大量的关系事实是以多个句子表达的,文本中的多个实体之间,往往存在复杂的相互关系,因此需要一种更准确的文档的实体关系抽取方法,提升文档的所有信息的关系推理能力。

技术实现思路

[0005]本专利技术提供一种实体关系抽取方法、装置、设备及介质,用以解决现有技术中文档的实体关系推理的准确性不够高的缺陷,实现一种更准确的文档的实体关系抽取方法,提升文档的所有信息的关系推理能力。
[0006]本专利技术提供一种实体关系抽取方法,包括:
[0007]基于待识别文档的目标实体对以及待识别关系,确定包含所述目标实体对与所述待识别关系之间的映射关系的三维数据结构;
[0008]基于所述三维数据结构,使用三重注意力机制分别捕获所述三维数据结构在不同语义空间下的交互特征;
[0009]基于所述交互特征,确定所述目标实体对的关系类别概率;
[0010]其中,所述关系类别概率用于确定所述目标实体对所属的语义关系类型,所述三重注意力机制的卷积层采用形变卷积。
[0011]根据本专利技术提供的一种实体关系抽取方法,所述目标实体对包括头实体和尾实体;
[0012]所述语义空间包括所述头实体与所述尾实体之间的第一语义空间,所述头实体与关系之间的第二语义空间,以及所述尾实体与关系之间的第三语义空间;
[0013]所述交互特征包括所述头实体与所述尾实体之间的第一交互特征,所述头实体与关系之间的第二交互特征,以及所述尾实体与关系之间的第三交互特征。
[0014]根据本专利技术提供的一种实体关系抽取方法,所述目标实体对是基于如下步骤确定的:
[0015]基于所述待识别文档的每个句子和每个词,确定语义相似的实体提及向量,所述实体提及向量对应的实体词的语义相似;
[0016]聚合所述实体提及向量,确定实体向量,所述实体向量对应于一个或多个实体提及向量;
[0017]基于所述实体向量,确定所述待识别文档中的目标实体对。
[0018]根据本专利技术提供的一种实体关系抽取方法,基于所述实体向量,确定所述待识别文档中的目标实体对,包括:
[0019]基于所述实体向量,确定所述实体向量对应的上下文向量;
[0020]融合所述实体向量和所述上下文向量,确定所述融合实体向量;
[0021]基于所述融合实体向量,确定所述待识别文档中的目标实体对。
[0022]根据本专利技术提供的一种实体关系抽取方法,基于所述融合实体向量,确定所述待识别文档中的目标实体对,包括:
[0023]将所述融合实体向量平均分为若干个组,得到实体向量分组;
[0024]基于所述实体向量分组和变换矩阵,确定所述待识别文档中的目标实体对。
[0025]根据本专利技术提供的一种实体关系抽取方法,基于所述交互特征,确定所述目标实体对的关系类别概率,包括:
[0026]基于所述交互特征,确定所述待识别文档的文档整体关系表征;
[0027]基于所述交互特征,确定所述目标实体对的语义关系表征;
[0028]基于所述文档整体关系表征和所述语义关系表征,确定所述目标实体对的关系类别概率。
[0029]本专利技术还提供一种实体关系抽取装置,包括:
[0030]三维编码聚合模块,用于基于待识别文档的目标实体对以及待识别关系,确定包含所述目标实体对与所述待识别关系之间的映射关系的三维数据结构;
[0031]语义交互模块,用于基于所述三维数据结构,使用三重注意力机制分别捕获所述三维数据结构在不同语义空间下的交互特征;
[0032]关系分类模块,用于基于所述交互特征,确定所述目标实体对的关系类别概率;
[0033]其中,所述关系类别概率用于确定所述目标实体对所属的语义关系类型,所述三重注意力机制的卷积层采用形变卷积。
[0034]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述实体关系抽取方法。
[0035]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述实体关系抽取方法。
[0036]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述实体关系抽取方法。
[0037]本专利技术提供的实体关系抽取方法、装置、设备及介质,通过对“实体/实体”二维数据结构的实体对进行扩展,形成“实体/实体/关系”三维数据结构,并采用基于形变卷积的三重注意力机制有效区分不同语义空间下的交互表征,从而自适应地增强对文档结构特征的识别,以此来实现提升文档的所有信息的关系推理能力,实现一种更准确的文档的实体
关系抽取方法。
附图说明
[0038]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0039]图1是本专利技术提供的实体关系抽取方法的流程示意图之一;
[0040]图2是本专利技术提供的实体关系抽取方法的流程示意图之二;
[0041]图3是本专利技术提供的实体关系抽取方法的流程示意图之三;
[0042]图4是本专利技术提供的实体关系抽取方法的流程示意图之四;
[0043]图5是本专利技术提供的实体关系抽取方法的流程示意图之五;
[0044]图6是本专利技术提供的实体关系抽取装置的结构示意图;
[0045]图7是本专利技术提供的电子设备的结构示意图。
具体实施方式
[0046]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0047]下面结合图1
‑本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种实体关系抽取方法,其特征在于,包括:基于待识别文档的目标实体对以及待识别关系,确定包含所述目标实体对与所述待识别关系之间的映射关系的三维数据结构;基于所述三维数据结构,使用三重注意力机制分别捕获所述三维数据结构在不同语义空间下的交互特征;基于所述交互特征,确定所述目标实体对的关系类别概率;其中,所述关系类别概率用于确定所述目标实体对所属的语义关系类型,所述三重注意力机制的卷积层采用形变卷积。2.根据权利要求1所述的实体关系抽取方法,其特征在于,所述目标实体对包括头实体和尾实体;所述语义空间包括所述头实体与所述尾实体之间的第一语义空间,所述头实体与关系之间的第二语义空间,以及所述尾实体与关系之间的第三语义空间;所述交互特征包括所述头实体与所述尾实体之间的第一交互特征,所述头实体与关系之间的第二交互特征,以及所述尾实体与关系之间的第三交互特征。3.根据权利要求1所述的实体关系抽取方法,其特征在于,所述目标实体对是基于如下步骤确定的:基于所述待识别文档的每个句子和每个词,确定语义相似的实体提及向量,所述实体提及向量对应的实体词的语义相似;聚合所述实体提及向量,确定实体向量,所述实体向量对应于一个或多个实体提及向量;基于所述实体向量,确定所述待识别文档中的目标实体对。4.根据权利要求3所述的实体关系抽取方法,其特征在于,基于所述实体向量,确定所述待识别文档中的目标实体对,包括:基于所述实体向量,确定所述实体向量对应的上下文向量;融合所述实体向量和所述上下文向量,确定所述融合实体向量;基于所述融合实体向量,确定所述待识别文档中的目标实体对。5.根据权利要求4所述的实体关系抽取方法,其特征在于,基...

【专利技术属性】
技术研发人员:赵文王宇王震熊冠铭温立强
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1