文本关系抽取方法、装置、存储介质及计算机设备制造方法及图纸

技术编号:29024165 阅读:23 留言:0更新日期:2021-06-26 05:25
本申请实施例公开了一种文本关系抽取方法、装置、存储介质及计算机设备,其中,该方法包括:获取目标实体对的目标文本和关系集合;通过训练好的关系抽取模型预测出关系集合中每个关系对应的初始得分;根据关系集合中每个关系对应的初始得分,从关系集合中选择出候选关系;将候选关系输入训练好的问答系统模型进行处理,以得到候选关系中每个候选关系对应的问答得分;根据候选关系中每个候选关系对应的初始得分和问答得分进行得分更新,以得到候选关系中每个候选关系对应的第一更新后得分;根据第一更新后得分,预测目标实体对在目标文本中的语义关系。本申请实施例通过问答系统模型来验证关系抽取模型的输出结果,有效提高模型的关系抽取性能。的关系抽取性能。的关系抽取性能。

【技术实现步骤摘要】
文本关系抽取方法、装置、存储介质及计算机设备


[0001]本申请涉及信息抽取
,具体涉及一种文本关系抽取方法、装置、存储介质及计算机设备。

技术介绍

[0002]信息抽取是自然语言理解的核心任务之一。在信息抽取中,关系抽取又是最重要的子任务之一。关系抽取旨在从包含一个实体对的文本中识别出该实体对的语义关系。
[0003]传统的关系抽取主要研究如何设计有效的特征。在近几年,随着深度学习的兴起,深度关系抽取得到了广泛的研究。但当前的研究主要集中在如何设计有效的神经网络架构,从而自动从文本和实体中抽取有效的关系判别信息。专利技术人将之前的研究归纳为“特征层面”和“模型层面”的研究。但由于各种不可抗拒因素(如数据规模受限,数据噪声以及最优模型架构难以获得等),当前的关系抽取从模型层面或特征层面很难得到显著的性能提升。

技术实现思路

[0004]本申请实施例提供一种文本关系抽取方法、装置、存储介质及计算机设备,可以通过问答系统模型来验证关系抽取模型的输出结果,有效提高模型的关系抽取性能,提高预测语义关系的准确率。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本关系抽取方法,其特征在于,所述方法包括:获取目标实体对的目标文本和关系集合;通过训练好的关系抽取模型预测出所述关系集合中每个关系对应的初始得分;根据所述关系集合中每个关系对应的初始得分,从所述关系集合中选择出候选关系;将所述候选关系输入训练好的问答系统模型进行处理,以得到所述候选关系中每个候选关系对应的问答得分;根据所述候选关系中每个候选关系对应的初始得分和问答得分,更新所述候选关系中所有候选关系的得分,以得到所述候选关系中每个候选关系对应的第一更新后得分;根据所述第一更新后得分,预测所述目标实体对在所述目标文本中的语义关系。2.如权利要求1所述的文本关系抽取方法,其特征在于,所述根据所述关系集合中每个关系对应的初始得分,从所述关系集合中选择出候选关系,包括:从所述关系集合中选择初始得分最高的前α%以及初始得分最低的后β%对应的关系作为候选关系,其中α和β均为0到100之间的自然数。3.如权利要求1所述的文本关系抽取方法,其特征在于,所述根据所述关系集合中每个关系对应的初始得分,从所述关系集合中选择出候选关系,包括:从所述关系集合中选择初始得分最高的前k个关系作为候选关系,其中k为大于0的正整数。4.如权利要求1

3任一项所述的文本关系抽取方法,其特征在于,所述将所述候选关系输入训练好的问答系统模型进行处理,以得到所述候选关系中每个候选关系对应的问答得分,包括:基于所述目标实体对的头实体和所述候选关系,构建所述候选关系中每个候选关系对应的问题;基于所述构建的问题和所述目标实体对的目标文本,通过所述训练好的问答系统模型预测所述目标实体对的尾实体是否是与所述问题匹配的答案,以得到所述候选关系中每个候选关系对应的问答得分。5.如权利要求1所述的文本关系抽取方法,其特征在于,根据所述候选关系中每个候选关系对应的初始得分和问答得分,更新所述候选关系中所有候选关系的得分,以得到所述候选关系中每个候选关系对应的第一更新后得分,包括:基于第一预设公式对所述候选关系中每个候选关系对应的初始得分和问答得分进行更新处理,以得到所述候选关系中每个候选关系对应的第一更新后得分。6.如权利要求5所述的文本关系抽取方法,其特征在于,所述根据所述第一更新后得分,预测所述目标实体对在目标文本中的语义关系,包括:根据所述第一更新后得分,对所有候选关系进行得分排序;从得分排序后的所述所有候选关系中选择得分大于给定阈值的关系,作为所述目标实体对在目标文本中的语义关系。7.如权利要求5所述的文本关系抽取方法,其特征在于,所述方法还包括:获取所述关系集合中除所述候选关系之外的其余未被选中的关系对应的初始得分;基于第二预设公式对所述其余未被选中的关系对应的初始得分进行更新处理,以得到所述其余未被选中的关系对应的第二更新后得分。
8.如权利要求7所述的文本关系抽取方法,其特征在于,所述根据所述第一更新后得分,预测所述目标实体对在目标文本中的语义关系,包括:根据所述第一更新后得分和所述第二更新后得分,预测所述目标实体对在目标文本中的语义关系。9.如权利要求8所述的文本关系抽取方法,其特征在于,所述根据所述第一更新后得分和所述第二更新后得分,预测所述目标实体对在目标文本中的语义关系,包括:根据所述第一更新后得...

【专利技术属性】
技术研发人员:蒋海云史树明
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1