信息抽取方法、信息抽取装置和电子设备制造方法及图纸

技术编号:24853525 阅读:43 留言:0更新日期:2020-07-10 19:07
本申请公开了信息抽取方法、信息抽取装置和电子设备,涉及数据挖掘领域。具体实现方案为:获取文本信息;获取文本信息中的第一主关系元组;获取N个主关系元组,N个主关系元组包括根据第一主关系元组的参数获得的至少一个第二主关系元组,N为正整数;根据第一主关系元组和N个主关系元组,确定文本信息的信息抽取结果。由于在对文本信息进行信息抽取时,先抽取文本信息的第一主关系元组,然后再对第一主关系元组的参数进行主关系元组抽取,这种从大范围到小范围的逐步抽取方法,可使得抽取覆盖的范围更细致,从而获得更全和更准确的抽取结果。

【技术实现步骤摘要】
信息抽取方法、信息抽取装置和电子设备
本申请涉及计算机
中的数据挖掘技术,尤其涉及一种信息抽取方法、信息抽取装置和电子设备。
技术介绍
信息抽取在人工智能应用中扮演着非常重要的角色,越来越多的上层应用,依赖于信息抽取的结果。例如知识库构建、事理图谱构建均依赖着实体关系抽取、事件抽取、因果关系抽取的技术。法律、医疗等领域的查询、决策支持系统的构建也依赖信息抽取的返回的结果。信息抽取的结果往往以关系元组的形式存在。然而,元组的遗漏,元组内参数的遗漏和错误,都不同程度的影响着信息抽取的结果。也就是说,现有的信息抽取方法,信息抽取的准确度和全面度较低。
技术实现思路
本申请实施例提供一种信息抽取方法、信息抽取装置和电子设备,以解决现有的信息抽取,准确度和全面度较低的问题。为解决上述技术问题,本申请是这样实现的:本申请第一方面提供一种信息抽取方法,包括:获取文本信息;获取所述文本信息中的第一主关系元组;获取N个主关系元组,所述N个主关系元组包括根据所述第一主关系元组的参数获得的至少本文档来自技高网...

【技术保护点】
1.一种信息抽取方法,其特征在于,包括:/n获取文本信息;/n获取所述文本信息中的第一主关系元组;/n获取N个主关系元组,所述N个主关系元组包括根据所述第一主关系元组的参数获得的至少一个第二主关系元组,N为正整数;/n根据所述第一主关系元组和所述N个主关系元组,确定所述文本信息的信息抽取结果;/n其中,所述第一主关系元组为未被所述文本信息中其他关系元组包含的关系元组,所述第二主关系元组为未被所述第一主关系元组的参数中其他关系元组包含的关系元组。/n

【技术特征摘要】
1.一种信息抽取方法,其特征在于,包括:
获取文本信息;
获取所述文本信息中的第一主关系元组;
获取N个主关系元组,所述N个主关系元组包括根据所述第一主关系元组的参数获得的至少一个第二主关系元组,N为正整数;
根据所述第一主关系元组和所述N个主关系元组,确定所述文本信息的信息抽取结果;
其中,所述第一主关系元组为未被所述文本信息中其他关系元组包含的关系元组,所述第二主关系元组为未被所述第一主关系元组的参数中其他关系元组包含的关系元组。


2.根据权利要求1所述的信息抽取方法,其特征在于,所述N个主关系元组还包括:
从所述第二主关系元组的参数中得到的至少一个第三主关系元组,其中,所述第三主关系元组为未被所述第二主关系元组的参数中其他关系元组包含的关系元组。


3.根据权利要求1所述的信息抽取方法,其特征在于,所述获取N个主关系元组,包括:
从所述第一主关系元组的参数中获取所述至少一个第二主关系元组;
对所述N个主关系元组中第i次获取的主关系元组的参数进行主关系元组抽取,以得到第i+1次获取的主关系元组,其中,所述第二主关系元组为所述N个主关系元组中第1次获取的主关系元组,所述N个主关系元组中最后一次获取的主关系元组中的参数不包括主关系元组,i为小于或者等于所述N的正整数。


4.根据权利要求1所述的信息抽取方法,其特征在于,所述获取所述文本信息中的第一主关系元组,包括:
将所述文本信息输入至神经网络模型,获得所述文本信息的第一主关系元组;其中,所述神经网络模型包括编码器和解码器,所述编码器用于根据所述文本信息获得编码特征,所述解码器用于根据所述编码特征获得所述文本信息的第一主关系元组。


5.根据权利要求4所述的信息抽取方法,其特征在于,所述编码器通过对无标注的训练语料进行上下文预测确定。


6.一种信息抽取装置,其特征在于,包括:
第一获取模块,用于获取文本信息;
第二获取模块,用于获取所述文本信息中的第一主关系元组;
第三获取模块,用于获取N个主关系元组,所述N个主关系元组包括根据所述第一主关系元组的参数获得的至少一个第二...

【专利技术属性】
技术研发人员:王鑫孙明明李平
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1