一种基于神经网络的实体关系补全方法及装置制造方法及图纸

技术编号:26376476 阅读:23 留言:0更新日期:2020-11-19 23:45
本发明专利技术公开了基于神经网络的实体关系补全方法及装置,其中方法包括:采集用户语料;通过训练好的实体关系抽取模型对用户语料进行实体关系抽取,生成目标句式;判断目标句式是否存在关系残缺或实体残缺;若存在关系残缺,则根据目标句式中的实体对在预存的实体关系知识库进行匹配,补全目标句式中残缺的关系;若存在实体残缺,则根据目标句式中已有的实体和关系在预存的实体关系知识库中进行匹配,补全目标句式中残缺的实体;根据补全后的目标句式,给予用户以相应的反馈。本发明专利技术通过利用神经网络技术获得的实体关系抽取模型来对用户语料进行实体关系抽取,使得实体关系的识别更为准确,通过预存的实体关系知识库帮助用户补全实体或关系。

【技术实现步骤摘要】
一种基于神经网络的实体关系补全方法及装置
本专利技术涉及自然语音处理领域,尤其涉及一种基于神经网络的实体关系补全方法及装置。
技术介绍
随着网络技术的迅速发展,智能终端逐渐设计人们生活的方方面面,随着人工智能相关技术的日益成熟,各类终端的智能化程度也越来越高。语音交互作为智能终端应用中主流的交互方式之一,极大地方便了各个用户的使用。比如各类家教机、学习的使用,孩子们可以通过语音向家教机、学习机问各种不懂的问题,然后学习机再给予孩子相应的回应。一般的,由于语言表达的复杂性和多样性,特别是孩子的语言表达能力可能较弱,可能表达了一大串,实际有用的信息只是其中几个词,而家教机可能一下无法抓取到孩子表述的信息重点内容,因而也难以理解并给予相应的反馈。即使获取到孩子的疑问有效信息,如何对该疑问信息进行处理,从而快速给予用户以反馈也是现在需要解决改进的难题之一。
技术实现思路
为解决上述技术问题,本专利技术提供一种基于神经网络的实体关系补全方法及装置,具体的,本专利技术的技术方案如下:一方面,本专利技术公开了一种基于神经网络的实体关系补全方法,包括:采集用户语料;通过训练好的实体关系抽取模型对所述用户语料进行实体关系抽取,生成目标句式;判断所述目标句式是否存在关系残缺或实体残缺;若所述目标句式中存在关系残缺,则根据所述目标句式中的实体对在预存的实体关系知识库进行匹配,补全所述目标句式中残缺的关系;若所述目标句式中存在实体残缺,则根据所述目标句式中已有的实体和关系在预存的实体关系知识库中进行匹配,补全所述目标句式中残缺的实体;根据补全后的目标句式,给予所述用户以相应的反馈。优选地,在在采集用户语料前还包括:爬取语料信息,构建语料初始库;对所述语料初始库中的语料信息进行筛选标注,获取标注后的包含实体关系的语料信息;根据所有标注后的包含实体关系的语料信息,构建实体关系抽取训练库;将所述实体关系抽取训练库中的语料信息作为实体关系抽取训练样本,输入初始模型进行训练学习,获得实体关系抽取模型。优选地,所述基于神经网络的实体关系补全方法还包括:若所述目标句式不存在关系残缺或实体残缺,则进一步判断所述目标句式中的实体对及其关系是否已存在于所述实体关系知识库中;当所述目标句式中的实体对及其关系未存在于所述实体关系知识库中,则检验所述目标句式中的实体对及其关系是否正确;当检验所述目标句式中的实体对及其关系正确时,将所述目标句式中的实体对及其关系补充到所述实体关系知识库中。优选地,所述检验所述目标句式中的实体对及其关系是否正确包括:根据所述目标句式中的实体对或其中一个实体及关系,查找到相关的参考文本信息;从所述参考文本信息中抽取出所述参考文本信息中包含的实体对及其关系;将所述目标句式与从所述参考文本信息中抽取到的实体对及其关系进行匹配;当所述目标句式与从所述参考文本信息中抽取到的实体对及其关系匹配成功时,判定所述目标句式中的实体对及其关系正确。优选地,从所述参考文本信息中抽取出所述参考文本信息中包含的实体对及其关系包括:根据所述目标句式中的实体或关系,在所述参考文本信息中进行查找,获取关联语句;将查找到的关联语句输入所述实体关系抽取模型,抽取出所述关联语句中包含的实体对及其关系。另一方面,本专利技术还公开了一种基于神经网络的实体关系补全装置,包括:语料采集模块,用于采集用户语料;实体关系抽取模块,用于通过训练好的实体关系抽取模型对所述用户语料进行实体关系抽取,生成目标句式;残缺判断模块,用于判断所述目标句式是否存在关系残缺或实体残缺;匹配补全模块,用于当所述目标句式中存在关系残缺时,根据所述目标句式中的实体对在预存的实体关系知识库进行匹配,补全所述目标句式中残缺的关系;当所述目标句式中存在实体残缺时,根据所述目标句式中已有的实体和关系在预存的实体关系知识库中进行匹配,补全所述目标句式中残缺的实体;反馈模块,用于根据补全后的目标句式,给予所述用户以相应的反馈。优选地,所述基于神经网络的实体关系补全装置还包括:语料爬取模块,用于爬取语料信息;语料库构建模块,用于根据所述爬取到的语料信息,构建语料初始库;筛选标注模块,用于对所述语料初始库中的语料信息进行筛选标注,获取标注后的包含实体关系的语料信息;所述语料库构建模块,还用于根据所有标注后的包含实体关系的语料信息,构建实体关系抽取训练库;学习训练模块,用于将所述实体关系抽取训练库中的语料信息作为实体关系抽取训练样本,输入初始模型进行训练学习,获得实体关系抽取模型。优选地,所述基于神经网络的实体关系补全装置还包括:查找模块,用于当所述目标句式不存在关系残缺或实体残缺时,进一步判断所述目标句式中的实体对及其关系是否已存在于所述实体关系知识库中;实体关系校验模块,用于当所述目标句式中的实体对及其关系未存在于所述实体关系知识库中时,检验所述目标句式中的实体对及其关系是否正确;扩充模块,用于当检验所述目标句式中的实体对及其关系正确时,将所述目标句式中的实体对及其关系补充到所述实体关系知识库中。优选地,所述基于神经网络的实体关系补全装置还包括:查找判断模块,用于当所述目标句式不存在关系残缺或实体残缺时,进一步判断所述目标句式中的实体对及其关系是否已存在于所述实体关系知识库中;实体关系校验模块,用于当所述目标句式中的实体对及其关系未存在于所述实体关系知识库中时,检验所述目标句式中的实体对及其关系是否正确;扩充模块,用于当检验所述目标句式中的实体对及其关系正确时,将所述目标句式中的实体对及其关系补充到所述实体关系知识库中。优选地,所述实体关系校验模块包括:参考文本获取子模块,用于根据所述目标句式中的实体对或其中一个实体及关系,查找到相关的参考文本信息,便于所述实体关系抽取模块从所述参考文本信息中抽取出所述参考文本信息中包含的实体对及其关系;实体关系匹配子模块,用于将所述目标句式与从所述参考文本信息中抽取到的实体对及其关系进行匹配;实体关系判断子模块,用于当所述目标句式与从所述参考文本信息中抽取到的实体对及其关系匹配成功时,判定所述目标句式中的实体对及其关系正确。优选地,所述实体关系抽取模块包括:关联语句获取子模块,还用于根据所述目标句式中的实体或关系,在所述参考文本信息中进行查找,获取关联语句;实体关系抽取子模块,还用于将查找到的关联语句输入所述实体关系抽取模型,抽取出所述关联语句中包含的实体对及其关系。本专利技术至少具备以下一项技术效果:(1)鉴于语言表达的多样性和复杂性,本专利技术采用了基于神经网络技术获得的实体关系抽取模型进行实体关系的识别和抽取,实体关系的识别更为准确,从而可快速而有效的获取到有用信息(实体、关系)。此外,基于神经网本文档来自技高网...

【技术保护点】
1.一种基于神经网络的实体关系补全方法,其特征在于,包括:/n采集用户语料;/n通过训练好的实体关系抽取模型对所述用户语料进行实体关系抽取,生成目标句式;/n判断所述目标句式是否存在关系残缺或实体残缺;/n若所述目标句式中存在关系残缺,则根据所述目标句式中的实体对在预存的实体关系知识库进行匹配,补全所述目标句式中残缺的关系;/n若所述目标句式中存在实体残缺,则根据所述目标句式中已有的实体和关系在预存的实体关系知识库中进行匹配,补全所述目标句式中残缺的实体;/n根据补全后的目标句式,给予所述用户以相应的反馈。/n

【技术特征摘要】
1.一种基于神经网络的实体关系补全方法,其特征在于,包括:
采集用户语料;
通过训练好的实体关系抽取模型对所述用户语料进行实体关系抽取,生成目标句式;
判断所述目标句式是否存在关系残缺或实体残缺;
若所述目标句式中存在关系残缺,则根据所述目标句式中的实体对在预存的实体关系知识库进行匹配,补全所述目标句式中残缺的关系;
若所述目标句式中存在实体残缺,则根据所述目标句式中已有的实体和关系在预存的实体关系知识库中进行匹配,补全所述目标句式中残缺的实体;
根据补全后的目标句式,给予所述用户以相应的反馈。


2.根据权利要求1所述的一种基于神经网络的实体关系补全方法,其特征在于,在采集用户语料前还包括:
爬取语料信息,构建语料初始库;
对所述语料初始库中的语料信息进行筛选标注,获取标注后的包含实体关系的语料信息;
根据所有标注后的包含实体关系的语料信息,构建实体关系抽取训练库;
将所述实体关系抽取训练库中的语料信息作为实体关系抽取训练样本,输入初始模型进行训练学习,获得实体关系抽取模型。


3.根据权利要求1或2所述的一种基于神经网络的实体关系补全方法,其特征在于,还包括:
若所述目标句式不存在关系残缺或实体残缺,则进一步判断所述目标句式中的实体对及其关系是否已存在于所述实体关系知识库中;
当所述目标句式中的实体对及其关系未存在于所述实体关系知识库中,则检验所述目标句式中的实体对及其关系是否正确;
当检验所述目标句式中的实体对及其关系正确时,将所述目标句式中的实体对及其关系补充到所述实体关系知识库中。


4.根据权利要求3所述的一种基于神经网络的实体关系补全方法,其特征在于,所述检验所述目标句式中的实体对及其关系是否正确包括:
根据所述目标句式中的实体对或其中一个实体及关系,查找到相关的参考文本信息;
从所述参考文本信息中抽取出所述参考文本信息中包含的实体对及其关系;
将所述目标句式与从所述参考文本信息中抽取到的实体对及其关系进行匹配;
当所述目标句式与从所述参考文本信息中抽取到的实体对及其关系匹配成功时,判定所述目标句式中的实体对及其关系正确。


5.根据权利要求4所述的一种基于神经网络的实体关系补全方法,其特征在于,从所述参考文本信息中抽取出所述参考文本信息中包含的实体对及其关系包括:
根据所述目标句式中的实体或关系,在所述参考文本信息中进行查找,获取关联语句;
将查找到的关联语句输入所述实体关系抽取模型,抽取出所述关联语句中包含的实体对及其关系。


6.一种基于神经网络的实体关系补全装置,其特征在于,包括:
语料采集模块,用于采集用户语料;
实体关系抽取模块,用于通过训练好的实体关系抽...

【专利技术属性】
技术研发人员:崔颖
申请(专利权)人:广东小天才科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1