问答方法、装置、设备及存储介质制造方法及图纸

技术编号:25948538 阅读:14 留言:0更新日期:2020-10-17 03:40
本申请公开了一种问答方法、装置、设备及存储介质,属于自然语言处理领域。方法包括:调用答案生成模型,根据第一问题信息的第一问题向量和至少一条第二问题向量,获取至少一条答案信息,根据第一问题信息或第一问题向量,在问答数据库中进行检索;调用排序模型,按照与第一问题信息的匹配度从高到低的顺序,对获取到的多条答案信息进行排序,将排在第一位的答案信息确定为目标答案信息。保证了即使在采用检索方式检索不到答案信息的情况下也能生成答案信息,不会出现答案信息缺失的情况,而且也综合考虑了上下文的影响以及答案信息与问题信息的匹配程度,提高了答案信息的准确性。

【技术实现步骤摘要】
问答方法、装置、设备及存储介质
本申请涉及自然语言处理领域,特别涉及一种问答方法、装置、设备及存储介质。
技术介绍
随着互联网的普及和自然语言处理技术的广泛应用,智能问答功能逐渐兴起,用户输入问题信息后,利用智能问答功能可以自动回答用户的问题,从而与用户进行互动。相关技术中,用户输入问题信息后,获取该问题信息中的关键词,基于获取的关键词,在数据库中检索与该关键词匹配的答案信息,以完成对问题信息的回答。但是,无法在数据库中检索到匹配的答案信息时,则无法对该问题信息进行回答,因此上述方法具有局限性。
技术实现思路
本申请实例提供了一种问答方法、装置、设备及存储介质,提高了获取的答案信息的准确性。所述技术方案如下:一方面,提供了一种问答方法,所述方法包括:获取第一问题信息的第一问题向量和至少一条第二问题信息的第二问题向量,所述至少一条第二问题信息为在所述第一问题信息之前获取的问题信息;调用答案生成模型,根据所述第一问题向量和至少一条第二问题向量,获取至少一条答案信息,所述答案生成模型用于根据任一问题向量生成所述任一问题向量匹配的答案信息;根据所述第一问题信息或所述第一问题向量,在问答数据库中进行检索;调用排序模型,按照与所述第一问题信息的匹配度从高到低的顺序,对获取到的多条答案信息进行排序,将排在第一位的答案信息确定为所述目标答案信息。在一种可能实现方式中,所述方法还包括:获取样本问题信息和对应的样本答案信息,以及所述样本问题信息与所述样本答案信息的样本匹配度;根据所述样本问题信息、所述样本答案信息和所述样本匹配度,对所述排序模型进行训练,得到训练后的排序模型。在另一种可能实现方式中,所述根据所述样本问题信息、所述样本答案信息和所述样本匹配度,对所述排序模型进行训练,得到训练后的排序模型,包括:将所述样本问题信息与所述样本答案信息输入至所述排序模型中,获取所述样本问题信息与所述样本答案信息的预测匹配度;根据所述样本匹配度和所述预测匹配度,对所述排序模型进行训练,得到训练后的排序模型。在另一种可能实现方式中,所述排序模型包括多个匹配层、一个融合层和一个排序层,所述调用排序模型,按照与所述第一问题信息的匹配度从高到低的顺序,对获取到的多条答案信息进行排序,将排在第一位的答案信息确定为所述目标答案信息,包括:调用所述多个匹配层,分别获取每条答案信息与所述第一问题信息的匹配度;调用所述融合层,获取所述每条答案信息的多个匹配度的融合匹配度;调用所述排序层,按照融合匹配度由高到低的顺序,对所述多条答案信息进行排序,将排在第一位的答案信息确定为所述目标答案信息。在另一种可能实现方式中,所述获取第一问题信息的第一问题向量,包括:对所述第一问题信息进行分词处理,得到分词后的多个第一词语;获取所述多个第一词语的相似词语;每次将至少一个第一词语替换为对应的相似词语,生成一条相似问题信息;根据所述第一问题信息和所述至少一条相似问题信息,获取所述第一问题向量。在另一种可能实现方式中,所述获取所述多个第一词语的相似词语,包括:从知识数据库中,获取所述多个第一词语中每个第一词语关联的相似词语,所述知识数据库用于存储各个词语与每个词语关联的相似词语;或者,获取所述多个第一词语中每个第一词语与至少一个预设词语的相似度,将与任一第一词语的相似度大于第一预设相似度的预设词语,作为所述任一第一词语的相似词语。在另一种可能实现方式中,所述根据所述第一问题信息和所述至少一条相似问题信息,获取所述第一问题向量,包括:获取所述至少一条相似问题信息的特征向量和所述第一问题信息的特征向量的平均向量,作为所述第一问题向量。在另一种可能实现方式中,所述调用答案生成模型,根据所述第一问题向量和至少一条第二问题向量,获取至少一条答案信息,包括:将所述第一问题向量和所述至少一条第二问题向量进行拼接,得到第三问题向量;调用所述答案生成模型,根据所述第三问题向量,获取所述至少一条答案信息。在另一种可能实现方式中,所述根据所述第一问题信息或所述第一问题向量,在问答数据库中进行检索,包括:将所述第一问题向量和所述至少一条第二问题向量进行拼接,得到第三问题向量;根据所述第三问题向量与所述问答数据库中的每个预设答案信息的特征向量之间的相似度,获取至少一条答案信息,所述至少一条答案信息的特征向量与所述第三问题向量的相似度大于其他预设答案信息的特征向量与所述第三问题向量的相似度。在另一种可能实现方式中,所述至少一条第二问题向量包括多条第二问题向量,所述调用答案生成模型,根据所述第一问题向量和至少一条第二问题向量,获取至少一条答案信息,包括:对所述多条第二问题向量进行加权平均,得到第四问题向量;将所述第一问题向量和所述第四问题向量进行拼接,得到融合问题向量;根据所述融合问题向量,调用所述答案生成模型,获取所述至少一条答案信息。在另一种可能实现方式中,所述根据所述第一问题信息或所述第一问题向量,在问答数据库中进行检索,包括:对所述多个第二问题向量进行加权平均,得到第四问题向量;将所述第一问题向量和所述第四问题向量进行拼接,得到融合问题向量;根据所述融合问题向量与所述问答数据库中的每个预设答案信息的特征向量之间的相似度,获取至少一条答案信息,所述至少一条答案信息的特征向量与所述融合问题向量的相似度大于其他预设答案信息的特征向量与所述融合问题向量的相似度。在另一种可能实现方式中,所述根据所述第一问题信息或所述第一问题向量,在问答数据库中进行检索,包括:根据所述第一问题向量,在所述问答数据库中进行检索,确定至少一条第五问题向量,所述至少一条第五问题向量包括所述第一问题向量相似的问题向量;或者,根据所述第一问题向量和所述至少一条第二问题向量,在所述问答数据库中进行检索,确定至少一条第五问题向量,所述至少一条第五问题向量包括所述第一问题向量相似的问题向量或所述至少一条第二问题向量相似的问题向量中的至少一种;从所述问答数据库中,获取所述至少一条第五问题向量的答案信息,作为所述至少一条答案信息。在另一种可能实现方式中,所述根据所述第一问题信息或所述第一问题向量,在问答数据库中进行检索,包括:根据所述第一问题向量与所述问答数据库中的每个预设答案信息的特征向量之间的相似度,获取所述至少一条答案信息,所述至少一条答案信息的特征向量与所述第一问题向量的相似度大于其他预设答案信息的特征向量与所述第一问题向量的相似度。在另一种可能实现方式中,所述根据所述第一问题信息或所述第一问题向量,在问答数据库中进行检索,包括:对所述第一问题信息进行分词处理,得到所述第一问题信息的关键词或实体;对所述问答数据库中预设答案信息进行分词处理,得到所述预设答案本文档来自技高网...

【技术保护点】
1.一种问答方法,其特征在于,所述方法包括:/n获取第一问题信息的第一问题向量和至少一条第二问题信息的第二问题向量,所述至少一条第二问题信息为在所述第一问题信息之前获取的问题信息;/n调用答案生成模型,根据所述第一问题向量和至少一条第二问题向量,获取至少一条答案信息,所述答案生成模型用于根据任一问题向量生成所述任一问题向量匹配的答案信息;/n根据所述第一问题信息或所述第一问题向量,在问答数据库中进行检索;/n调用排序模型,按照与所述第一问题信息的匹配度从高到低的顺序,对获取到的多条答案信息进行排序,将排在第一位的答案信息确定为所述目标答案信息。/n

【技术特征摘要】
1.一种问答方法,其特征在于,所述方法包括:
获取第一问题信息的第一问题向量和至少一条第二问题信息的第二问题向量,所述至少一条第二问题信息为在所述第一问题信息之前获取的问题信息;
调用答案生成模型,根据所述第一问题向量和至少一条第二问题向量,获取至少一条答案信息,所述答案生成模型用于根据任一问题向量生成所述任一问题向量匹配的答案信息;
根据所述第一问题信息或所述第一问题向量,在问答数据库中进行检索;
调用排序模型,按照与所述第一问题信息的匹配度从高到低的顺序,对获取到的多条答案信息进行排序,将排在第一位的答案信息确定为所述目标答案信息。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取样本问题信息和对应的样本答案信息,以及所述样本问题信息与所述样本答案信息的样本匹配度;
根据所述样本问题信息、所述样本答案信息和所述样本匹配度,对所述排序模型进行训练,得到训练后的排序模型。


3.根据权利要求2所述的方法,其特征在于,所述根据所述样本问题信息、所述样本答案信息和所述样本匹配度,对所述排序模型进行训练,得到训练后的排序模型,包括:
将所述样本问题信息与所述样本答案信息输入至所述排序模型中,获取所述样本问题信息与所述样本答案信息的预测匹配度;
根据所述样本匹配度和所述预测匹配度,对所述排序模型进行训练,得到训练后的排序模型。


4.根据权利要求1所述的方法,其特征在于,所述排序模型包括多个匹配层、一个融合层和一个排序层,所述调用排序模型,按照与所述第一问题信息的匹配度从高到低的顺序,对获取到的多条答案信息进行排序,将排在第一位的答案信息确定为所述目标答案信息,包括:
调用所述多个匹配层,分别获取每条答案信息与所述第一问题信息的匹配度;
调用所述融合层,获取所述每条答案信息的多个匹配度的融合匹配度;
调用所述排序层,按照融合匹配度由高到低的顺序,对所述多条答案信息进行排序,将排在第一位的答案信息确定为所述目标答案信息。


5.根据权利要求1所述的方法,其特征在于,所述获取第一问题信息的第一问题向量,包括:
对所述第一问题信息进行分词处理,得到分词后的多个第一词语;
获取所述多个第一词语的相似词语;
每次将至少一个第一词语替换为对应的相似词语,生成一条相似问题信息;
根据所述第一问题信息和所述至少一条相似问题信息,获取所述第一问题向量。


6.根据权利要求5所述的方法,其特征在于,所述获取所述多个第一词语的相似词语,包括:
从知识数据库中,获取所述多个第一词语中每个第一词语关联的相似词语,所述知识数据库用于存储各个词语与每个词语关联的相似词语;或者,
获取所述多个第一词语中每个第一词语与至少一个预设词语的相似度,将与任一第一词语的相似度大于第一预设相似度的预设词语,作为所述任一第一词语的相似词语。


7.根据权利要求5所述的方法,其特征在于,所述根据所述第一问题信息和所述至少一条相似问题信息,获取所述第一问题向量,包括:
获取所述至少一条相似问题信息的特征向量和所述第一问题信息的特征向量的平均向量,作为所述第一问题向量。


8.根据权利要求1所述的方法,其特征在于,所述调用答案生成模型,根据所述第一问题向量和至少一条第二问题向量,获取至少一条答案信息,包括:
将所述第一问题向量和所述至少一条第二问题向量进行拼接,得到第三问题向量;
调用所述答案生成模型,根据所述第三问题向量,...

【专利技术属性】
技术研发人员:李世杰张子健陈欢
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1