基于知识库的答案生成方法、装置和智能会话系统制造方法及图纸

技术编号:21184650 阅读:81 留言:0更新日期:2019-05-22 15:15
本公开提供了一种基于知识库的答案生成方法,应用于智能会话系统中,该智能会话系统能够对接收到的输入信息进行响应并提供反馈信息。知识库包括多条知识数据,所述知识数据包括知识实体信息以及所述知识实体信息的关联关系信息。该方法包括:获取输入语句数据;将所述输入语句数据分别与候选关系集和候选实体集进行匹配,其中,所述候选关系集由所述知识库中的知识数据的关联关系信息构成,所述候选实体集由所述知识库中的知识数据的知识实体信息构成;以及,根据匹配结果,输出答案数据。本公开还提供了一种基于知识库的答案生成装置和智能会话系统。

Answer Generation Method, Device and Intelligent Conversation System Based on Knowledge Base

The present disclosure provides a knowledge-based answer generation method applied to an intelligent session system that can respond to received input information and provide feedback information. The knowledge base includes multiple knowledge data, which includes the information of knowledge entities and the information of the relationship between knowledge entities. The method includes: acquiring input statement data; matching the input statement data with candidate relation set and candidate entity set respectively, in which the candidate relation set is composed of association information of knowledge data in the knowledge base, and the candidate entity set is composed of knowledge entity information of knowledge data in the knowledge base; and outputting according to the matching result. Answer data. The present disclosure also provides an answer generation device based on a knowledge base and an intelligent conversation system.

【技术实现步骤摘要】
基于知识库的答案生成方法、装置和智能会话系统
本公开涉及一种基于知识库的答案生成方法、装置和智能会话系统。
技术介绍
随着关系抽取,知识表示等知识图谱相关技术的发展,基于开放领域知识库的问答逐渐成为自然语言处理领域中的一个重要课题,其主流解决思路可分为基于语义句法分析和基于信息抽取两种。现有基于知识库的问答系统中,往往将知识库中的知识数据看作一个整体进行语义分析或匹配,在特征提取不充分或训练数据不足时,容易出现失配,表现为尽管知识本身正确,但对用户输入“答非所问”,造成了最终答案选择的偏差。
技术实现思路
本公开的一个方面提供了一种基于知识库的答案生成方法,该方法应用于智能会话系统中,智能会话系统能够对接收到的输入信息进行响应并提供反馈信息。所述知识库包括多条知识数据,所述知识数据包括知识实体信息以及所述知识实体信息的关联关系信息。上述方法包括:获取输入语句数据;将所述输入语句数据分别与候选关系集和候选实体集进行匹配,其中,所述候选关系集由所述知识库中的知识数据的关联关系信息构成,所述候选实体集由所述知识库中的知识数据的知识实体信息构成;以及,根据匹配结果,输出答案数据。可选地,在上述将输入语句数据分别与候选关系集和候选实体集进行匹配之前,上述方法还包括:识别输入语句数据的关键实体信息;从所述知识库中获取包含所述关键实体信息的知识数据;以及,利用所获取的知识数据中的关联关系信息构建候选关系集,利用所获取的知识数据中的除所述关键实体信息之外的知识实体信息构建候选实体集。可选地,上述将所述输入语句数据分别与候选关系集和候选实体集进行匹配包括:将所述输入语句数据与所述候选关系集进行第一匹配,得到与所述候选关系集中的各关联关系信息对应的第一匹配评分;将所述输入语句数据与所述候选实体集进行第二匹配,得到与所述候选实体集中的各知识实体信息对应的第二匹配评分;以及,基于所述第一匹配评分和所述第二匹配评分,确定最优知识数据。则上述根据匹配结果,输出答案数据包括:将所述最优知识数据中的知识实体信息作为与所述输入语句数据对应的答案数据。可选地,上述将所述输入语句数据与所述候选关系集进行第一匹配包括:获取所述输入语句数据的特征向量;获取所述候选关系集中的各关联关系信息的第一向量;以及,对于所述候选关系集中的任一关联关系信息,将该关联关系信息的第一向量与所述输入语句数据的特征向量输入第一匹配模型,基于所述第一匹配模型计算该关联关系信息的第一向量与所述输入语句数据的特征向量之间的第一匹配度。其中,所述第一匹配模型是利用多组由问题样本数据和与该问题样本数据对应的关系样本数据组成的样本对训练得到的。可选地,第一匹配模型包括:基于孪生网络的句子编码模型,或者,引入注意力机制的基于信息交互的匹配模型。可选地,上述将所述输入语句数据与所述候选实体集进行第二匹配包括:获取所述输入语句数据的特征向量;获取所述候选实体集中的各知识实体信息的第二向量;对于所述候选实体集中的任一知识实体信息,将该知识实体信息的封闭词向量与所述输入语句数据的特征向量输入第二匹配模型,基于所述第二匹配模型计算该知识实体信息的封闭词向量与所述输入语句数据的特征向量之间的第二匹配度。其中,第二匹配模型是利用多组由问题样本数据和与该问题样本数据对应的答案样本数据组成的样本对训练得到的。可选地,上述基于所述第一匹配评分和所述第二匹配评分,确定最优知识数据包括:对于任一知识数据,根据与所述知识数据中的关联关系信息对应的第一匹配评分和与所述知识数据中的知识实体信息对应的第二匹配评分计算所述知识数据的综合评分;以及,将综合评分最高的知识数据作为最优知识数据。上述将所述最优知识数据中的知识实体信息作为与所述输入语句数据对应的答案数据包括:将所述最优知识数据中的除所述关键实体信息之外的知识实体信息作为与所述输入语句数据对应的答案数据。本公开的另一方面提供了一种基于知识库的答案生成装置,应用于智能会话系统中,所述智能会话系统能够对接收到的输入信息进行响应并提供反馈信息。所述知识库包括多条知识数据,所述知识数据包括知识实体信息以及所述知识实体信息的关联关系信息。上述装置包括第一获取模块、匹配模块和输出模块。第一获取模块用于获取输入语句数据。匹配模块用于将所述输入语句数据分别与候选关系集和候选实体集进行匹配,其中,所述候选关系集由所述知识库中的知识数据的关联关系信息构成,所述候选实体集由所述知识库中的知识数据的知识实体信息构成。以及,输出模块用于根据匹配结果,输出答案数据。可选地,上述装置还包括:识别模块、第二获取模块和构建模块。识别模块用于在所述匹配模块将所述输入语句数据分别与候选关系集和候选实体集进行匹配之前,识别所述输入语句数据的关键实体信息。第二获取模块用于从所述知识库中获取包含所述关键实体信息的知识数据。以及,构建模块用于利用所获取的知识数据中的关联关系信息构建候选关系集,利用所获取的知识数据中的除所述关键实体信息之外的知识实体信息构建候选实体集。可选地,匹配模块包括第一匹配子模块、第二匹配子模块和确定子模块。第一匹配子模块用于将所述输入语句数据与所述候选关系集进行第一匹配,得到与所述候选关系集中的各关联关系信息对应的第一匹配评分。第二匹配子模块用于将所述输入语句数据与所述候选实体集进行第二匹配,得到与所述候选实体集中的各知识实体信息对应的第二匹配评分。以及,确定子模块用于基于所述第一匹配评分和所述第二匹配评分,确定最优知识数据。输出模块具体用于将所述最优知识数据中的知识实体信息作为与所述输入语句数据对应的答案数据。可选地,第一匹配子模块具体用于获取所述输入语句数据的特征向量;获取所述候选关系集中的各关联关系信息的第一向量;以及,对于所述候选关系集中的任一关联关系信息,将该关联关系信息的第一向量与所述输入语句数据的特征向量输入第一匹配模型,基于所述第一匹配模型计算该关联关系信息的第一向量与所述输入语句数据的特征向量之间的第一匹配度。其中,所述第一匹配模型是利用多组由问题样本数据和与该问题样本数据对应的关系样本数据组成的样本对训练得到的。可选地,第一匹配模型包括:基于孪生网络的句子编码模型,或者,引入注意力机制的基于信息交互的匹配模型。可选地,第二匹配子模块具体用于获取所述输入语句数据的特征向量;获取所述候选实体集中的各知识实体信息的第二向量;对于所述候选实体集中的任一知识实体信息,将该知识实体信息的封闭词向量与所述输入语句数据的特征向量输入第二匹配模型,基于所述第二匹配模型计算该知识实体信息的封闭词向量与所述输入语句数据的特征向量之间的第二匹配度。其中,所述第二匹配模型是利用多组由问题样本数据和与该问题样本数据对应的答案样本数据组成的样本对训练得到的。可选地,确定子模块具体用于对于任一知识数据,根据与所述知识数据中的关联关系信息对应的第一匹配评分和与所述知识数据中的知识实体信息对应的第二匹配评分计算所述知识数据的综合评分;以及,将综合评分最高的知识数据作为最优知识数据。输出模块具体用于将所述最优知识数据中的除所述关键实体信息之外的知识实体信息作为与所述输入语句数据对应的答案数据。本公开的另一方面提供了一种智能会话系统,所述智能会话系统能够对接收到的输入信息进行响应并提供本文档来自技高网...

【技术保护点】
1.一种基于知识库的答案生成方法,应用于智能会话系统中,所述智能会话系统能够对接收到的输入信息进行响应并提供反馈信息,所述知识库包括多条知识数据,所述知识数据包括知识实体信息以及所述知识实体信息的关联关系信息,所述方法包括:获取输入语句数据;将所述输入语句数据分别与候选关系集和候选实体集进行匹配,其中,所述候选关系集由所述知识库中的知识数据的关联关系信息构成,所述候选实体集由所述知识库中的知识数据的知识实体信息构成;以及根据匹配结果,输出答案数据。

【技术特征摘要】
1.一种基于知识库的答案生成方法,应用于智能会话系统中,所述智能会话系统能够对接收到的输入信息进行响应并提供反馈信息,所述知识库包括多条知识数据,所述知识数据包括知识实体信息以及所述知识实体信息的关联关系信息,所述方法包括:获取输入语句数据;将所述输入语句数据分别与候选关系集和候选实体集进行匹配,其中,所述候选关系集由所述知识库中的知识数据的关联关系信息构成,所述候选实体集由所述知识库中的知识数据的知识实体信息构成;以及根据匹配结果,输出答案数据。2.根据权利要求1所述的方法,其中,在所述将所述输入语句数据分别与候选关系集和候选实体集进行匹配之前,所述方法还包括:识别所述输入语句数据的关键实体信息;从所述知识库中获取包含所述关键实体信息的知识数据;以及利用所获取的知识数据中的关联关系信息构建候选关系集,利用所获取的知识数据中的除所述关键实体信息之外的知识实体信息构建候选实体集。3.根据权利要求1或2所述的方法,其中:所述将所述输入语句数据分别与候选关系集和候选实体集进行匹配包括:将所述输入语句数据与所述候选关系集进行第一匹配,得到与所述候选关系集中的各关联关系信息对应的第一匹配评分;将所述输入语句数据与所述候选实体集进行第二匹配,得到与所述候选实体集中的各知识实体信息对应的第二匹配评分;以及基于所述第一匹配评分和所述第二匹配评分,确定最优知识数据;所述根据匹配结果,输出答案数据包括:将所述最优知识数据中的知识实体信息作为与所述输入语句数据对应的答案数据。4.根据权利要求3所述的方法,其中,所述将所述输入语句数据与所述候选关系集进行第一匹配包括:获取所述输入语句数据的特征向量;获取所述候选关系集中的各关联关系信息的第一向量;以及对于所述候选关系集中的任一关联关系信息,将该关联关系信息的第一向量与所述输入语句数据的特征向量输入第一匹配模型,基于所述第一匹配模型计算该关联关系信息的第一向量与所述输入语句数据的特征向量之间的第一匹配度,其中,所述第一匹配模型是利用多组由问题样本数据和与该问题样本数据对应的关系样本数据组成的样本对训练得到的。5.根据权利要求4所述的方法,其中,所述第一匹配模型包括:基于孪生网络的句子编码模型,或者,引入注意力机制的基于信息交互的匹配模型。6.根据权利要求3所述的方法,其中,所述将所述输入语句数据与所述候选实体集进行第二匹配包括:获取所述...

【专利技术属性】
技术研发人员:刘欣然李杨胡长建
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1