实体关系抽取方法及装置、存储介质、电子设备制造方法及图纸

技术编号:23149943 阅读:20 留言:0更新日期:2020-01-18 13:48
本公开提供一种实体关系抽取方法及装置、电子设备、存储介质;涉及自然语言处理技术领域。所述方法包括:获取待抽取实体关系的文本,通过实体和关系联合抽取模型对该文本进行处理,得到第一实体关系三元组;确定文本中的词语及词语对应的标签,根据关系规则集对词语及标签进行匹配,确定第二实体关系三元组;根据所述词语及所述标签构建实体对,通过关系分类模型对该文本进行处理,确定针对所述实体对的第三实体关系三元组;根据第一实体关系三元组、第二实体关系三元组和第三实体关系三元组,确定实体关系抽取结果。本公开可以提高实体关系抽取的准确性。

Entity relation extraction method and device, storage medium and electronic equipment

【技术实现步骤摘要】
实体关系抽取方法及装置、存储介质、电子设备
本公开涉及自然语言处理
,具体而言,涉及一种实体关系抽取方法、实体关系抽取装置、电子设备以及计算机可读存储介质。
技术介绍
近年来,随着信息技术的不断发展,产生了大量的非结构化文本数据,例如新闻稿等,非结构化的数据不利于快速分析和处理。信息抽取研究了如何从这些文本提取出结构化的数据,信息抽取包括实体抽取和实体关系抽取,其中,实体指具有客观意义或指代性较强的词语,包括人名、地名、组织机构名、时间日期、专有名词等。相关技术中,在抽取实体关系时,准确性较低。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种实体关系抽取方法、实体关系抽取装置、电子设备以及计算机可读存储介质,进而在一定程度上克服由于相关技术的限制和缺陷而导致的在抽取实体关系时准确性较低的问题。根据本公开的第一方面,提供一种实体关系抽取方法,包括:获取待抽取实体关系的文本,通过实体和关系联合抽取模型对所述文本进行处理,得到第一实体关系三元组;确定所述文本中的词语及所述词语对应的标签,根据关系规则集对所述文本中的词语及所述标签进行匹配,确定第二实体关系三元组;根据所述词语及所述标签构建实体对,通过关系分类模型对所述文本进行处理,确定针对所述实体对的第三实体关系三元组;根据所述第一实体关系三元组、所述第二实体关系三元组和所述第三实体关系三元组,确定实体关系抽取结果。在本公开的一种示例性实施例中,所述根据所述第一实体关系三元组、所述第二实体关系三元组和所述第三实体关系三元组,确定实体关系抽取结果,包括:从所述第一实体关系三元组、所述第二实体关系三元组和所述第三实体关系三元组中选取第一实体之间及第二实体之间均相同的目标实体关系三元组;根据所述目标实体关系三元组,确定实体关系抽取结果。在本公开的一种示例性实施例中,所述根据所述目标实体关系三元组,确定实体关系抽取结果,包括:对所述目标实体关系三元组中的实体关系向量进行加权平均,得到目标实体关系向量;将所述目标实体关系三元组中第一实体和第二实体,以及所述目标实体关系向量中最大值对应的实体关系作为实体关系抽取结果。在本公开的一种示例性实施例中,所述根据关系规则集对所述文本中的词语及所述标签进行匹配,确定第二实体关系三元组,包括:针对所述关系规则集中的每条关系规则,判断所述文本中的单个词语是否与该关系规则中的关系触发词语相同;在所述单个词语与所述关系触发词语相同时,搜索所述标签中是否存在与该关系规则中第一实体标签相同的第一目标标签,以及与该关系规则中第二实体标签相同的第二目标标签;在第一目标标签和第二目标标签均存在时,根据第一目标标签对应的词语、第二目标标签对应的词语以及该关系规则中的实体关系类型,构建第二实体关系三元组。在本公开的一种示例性实施例中,所述通过实体和关系联合抽取模型对所述文本进行处理,得到第一实体关系三元组,包括:对所述文本进行分词处理,得到多个词语;将所述多个词语转换为语义向量,将所述语义向量输入实体和关系联合抽取模型,得到词语标签;根据所述词语标签,构建第一实体关系三元组。在本公开的一种示例性实施例中,在所述根据所述词语及所述标签构建实体对之后,所述方法还包括:对所述文本中的实体对进行标记,得到标记后的文本;所述通过关系分类模型对所述文本进行处理,确定第三实体关系三元组,具体包括:所述通过关系分类模型对所述标记后的文本进行处理,确定第三实体关系三元组。在本公开的一种示例性实施例中,所述通过关系分类模型对所述标记后的文本进行处理,确定第三实体关系三元组,包括:将所述标记后文本转换为对应的文本语义向量;将所述文本语义向量输入关系分类模型,得到实体关系的概率分布向量;根据所述实体对以及所述概率分布向量,构建第三实体关系三元组。在本公开的一种示例性实施例中,所述方法还包括:对所获取的初始文本进行指代消解,得到所述待抽取实体关系的文本。根据本公开的第二方面,提供一种实体关系抽取装置,包括:第一实体关系三元组确定模块,用于获取待抽取实体关系的文本,通过实体和关系联合抽取模型对所述文本进行处理,得到第一实体关系三元组;第二实体关系三元组确定模块,用于确定所述文本中的词语及所述词语对应的标签,根据关系规则集对所述文本中的词语及所述标签进行匹配,确定第二实体关系三元组;第三实体关系三元组确定模块,用于根据所述词语及所述标签构建实体对,通过关系分类模型对所述文本进行处理,确定针对所述实体对的第三实体关系三元组;实体关系抽取结果确定模块,用于根据所述第一实体关系三元组、所述第二实体关系三元组和所述第三实体关系三元组,确定实体关系抽取结果。在本公开的一种示例性实施例中,所述实体关系抽取结果确定模块,包括:目标三元组选取单元,用于从所述第一实体关系三元组、所述第二实体关系三元组和所述第三实体关系三元组中选取第一实体之间及第二实体之间均相同的目标实体关系三元组;抽取结果确定单元,用于根据所述目标实体关系三元组,确定实体关系抽取结果。在本公开的一种示例性实施例中,所述抽取结果确定单元,具体用于对所述目标实体关系三元组中的实体关系向量进行加权平均,得到目标实体关系向量;将所述目标实体关系三元组中第一实体和第二实体,以及所述目标实体关系向量中最大值对应的实体关系作为实体关系抽取结果。在本公开的一种示例性实施例中,所述第一实体关系三元组确定模块,包括:分词单元,用于对所述文本进行分词处理,得到多个词语;词语标签确定单元,用于将所述多个词语转换为语义向量,将所述语义向量输入实体和关系联合抽取模型,得到词语标签;第一三元组构建单元,用于根据所述词语标签,构建第一实体关系三元组。在本公开的一种示例性实施例中,所述第二实体关系三元组确定模块,包括:触发词语判断单元,用于针对所述关系规则集中的每条关系规则,判断所述文本中的单个词语是否与该关系规则中的关系触发词语相同;目标标签判断单元,用于在单个词语与所述关系触发词语相同时,搜索所述标签中是否存在与该关系规则中第一实体标签相同的第一目标标签,以及与该关系规则中第二实体标签相同的第二目标标签;第二三元组构建单元,用于在第一目标标签和第二目标标签均存在时,根据第一目标标签对应的词语、第二目标标签对应的词语以及该关系规则中的实体关系类型,构建第二实体关系三元组。在本公开的一种示例性实施例中,所述装置还包括:标记模块,用于对所述文本中的实体对进行标记,得到标记后的文本;所述第三实体关系三元组确定模块,具体用于通过关系分类模型对所述标记后的文本进行处理,本文档来自技高网...

【技术保护点】
1.一种实体关系抽取方法,其特征在于,所述方法包括:/n获取待抽取实体关系的文本,通过实体和关系联合抽取模型对所述文本进行处理,得到第一实体关系三元组;/n确定所述文本中的词语及所述词语对应的标签,根据关系规则集对所述文本中的词语及所述标签进行匹配,确定第二实体关系三元组;/n根据所述词语及所述标签构建实体对,通过关系分类模型对所述文本进行处理,确定针对所述实体对的第三实体关系三元组;/n根据所述第一实体关系三元组、所述第二实体关系三元组和所述第三实体关系三元组,确定实体关系抽取结果。/n

【技术特征摘要】
1.一种实体关系抽取方法,其特征在于,所述方法包括:
获取待抽取实体关系的文本,通过实体和关系联合抽取模型对所述文本进行处理,得到第一实体关系三元组;
确定所述文本中的词语及所述词语对应的标签,根据关系规则集对所述文本中的词语及所述标签进行匹配,确定第二实体关系三元组;
根据所述词语及所述标签构建实体对,通过关系分类模型对所述文本进行处理,确定针对所述实体对的第三实体关系三元组;
根据所述第一实体关系三元组、所述第二实体关系三元组和所述第三实体关系三元组,确定实体关系抽取结果。


2.根据权利要求1所述的方法,其特征在于,所述根据所述第一实体关系三元组、所述第二实体关系三元组和所述第三实体关系三元组,确定实体关系抽取结果,包括:
从所述第一实体关系三元组、所述第二实体关系三元组和所述第三实体关系三元组中选取第一实体之间及第二实体之间均相同的目标实体关系三元组;
根据所述目标实体关系三元组,确定实体关系抽取结果。


3.根据权利要求2所述的方法,其特征在于,所述根据所述目标实体关系三元组,确定实体关系抽取结果,包括:
对所述目标实体关系三元组中的实体关系向量进行加权平均,得到目标实体关系向量;
将所述目标实体关系三元组中第一实体和第二实体,以及所述目标实体关系向量中最大值对应的实体关系作为实体关系抽取结果。


4.根据权利要求1所述的方法,其特征在于,所述根据关系规则集对所述文本中的词语及所述标签进行匹配,确定第二实体关系三元组,包括:
针对所述关系规则集中的每条关系规则,判断所述文本中的单个词语是否与该关系规则中的关系触发词语相同;
在所述单个词语与所述关系触发词语相同时,搜索所述标签中是否存在与该关系规则中第一实体标签相同的第一目标标签,以及与该关系规则中第二实体标签相同的第二目标标签;
在第一目标标签和第二目标标签均存在时,根据第一目标标签对应的词语、第二目标标签对应的词语以及该关系规则中的实体关系类型,构建第二实体关系三元组。


5.根据权利要求1所述的方法,其特征在于,所述通过实体和关系联合抽取模型对所述文本进行处理,得到第一实体关系三元组,包括:
对所述文本进行分词处理,得到多个词语;
将...

【专利技术属性】
技术研发人员:任朝淦何源张钧波郑宇
申请(专利权)人:京东城市北京数字科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1