【技术实现步骤摘要】
基于知识库的对话生成方法、装置、终端及存储介质
[0001]本申请涉及人工智能领域,特别是涉及一种基于知识库的对话生成方法、装置、终端及存储介质。
技术介绍
[0002]随着科技的发展,AI(Artificial Intelligence,人工智能)正逐步改变着我们的生活方式,例如智能问答就是其中一种。当客户通过文字或语音在线咨询时,可以由线上的智能客服为客户进行智能应答。智能问答可以有效缓解客户服务的等待状况,提升服务质量,因而有着非常广阔的前景。
[0003]目前,现有的对话系统仍然存在OOV(out of vocabulary)问题,即用户输入的内容超出了对话系统的词库,导致对话系统无法做出准确回复;此外,对话系统中利用的模型,其在进行网络结构压缩时,会导致语义的信息出现损失的情况,导致最终生成的回复结果不够准确,影响用户的体验。
技术实现思路
[0004]本申请提供一种基于知识库的对话生成方法、装置、终端及存储介质,以解决现有的智能对话系统对话时的回复内容不够准确的问题。
[0005] ...
【技术保护点】
【技术特征摘要】
1.一种基于知识库的对话生成方法,其特征在于,包括:获取用户输入数据、预设知识库的三元组数据以及预设的占位符集,利用所述用户输入数据、所述三元组数据和所述占位符集构建所述模型输入数据,并将所述模型输入数据向量化,得到初始语义向量;将所述初始语义向量输入至预先训练好的对话网络模型的编码端,利用所述编码端对所述初始语义向量进行编码,得到隐状态,再利用所述隐状态、所述对话网络模型中的记忆矩阵对所述初始语义向量进行更新,得到最终语义向量;利用所述最终语义向量取出最终关注内容并输出至所述对话网络模型的解码端;利用所述解码端对所述最终关注内容解码得到词分布,通过所述词分布输出初始解码结果;当所述初始解码结果中存在占位符时,通过所述最终语义向量与所述知识库做指针网络,得到局部记忆指针,再通过所述局部记忆指针的分布得到分布最大的目标数据作为输出,利用所述目标数据替换所述占位符,得到最终解码结果;根据所述最终解码结果对所述用户的输入进行回复。2.根据权利要求1所述的方法,其特征在于,所述将所述初始语义向量输入至预先训练好的对话网络模型的编码端,利用所述编码端对所述初始语义向量进行编码,得到隐状态,再利用所述隐状态、所述对话网络模型中的记忆矩阵对所述初始语义向量进行更新,得到最终语义向量,包括:将所述初始语义向量输入至所述编码端进行编码,得到隐状态;将所述隐状态添加至所述记忆矩阵中,得到更新后的记忆矩阵;利用所述更新后的记忆矩阵和所述初始语义向量计算得到从所述初始语义向量中取出的关注内容;利用所述关注内容更新所述初始语义向量,得到更新后的语义向量,并对所述更新后的语义向量再次进行编码;重复执行上述步骤,直至达到预设次数为止,得到所述最终语义向量。3.根据权利要求1所述的方法,其特征在于,所述利用所述最终语义向量取出最终关注内容并输出至所述对话网络模型的解码端之后,还包括:通过所述最终语义向量查询所述知识库,得到记忆分布的全局记忆指针;所述最终语义向量与所述知识库做指针网络,得到局部记忆指针,包括:通过所述全局记忆指针从所述知识库中筛选出目标数据集,再通过所述最终语义向量与所述目标数据集做指针网络,得到所述局部记忆指针。4.根据权利要求3所述的方法,其特征在于,所述通过所述最终语义向量查询所述知识库,得到记忆分布的全局记忆指针,包括:通过所述最终语义向量查询所述知识库中的每一条数据,再利用所述最终语义向量和所述记忆矩阵做内积相似度计算,并对计算结果执行sigmoid函数,得到记忆分布的所述全局记忆指针。5.根据权利要求1所述的方法,其特征在于,所述方法还包括预先训练所述对话网络模型,包括:获取样本训练数据,所述样本训练数据包括样本输入和样本真实结果,将所述样本输
入向量化,得到初始样本语义向量,所述样本输入包括历史对话数据、所述知识库的三元组数据和所述占位符集,所述样本真实结果包括每个词的指向位置;将所述初始样本语义向量输入至待训练的对话网络模型的编码端,利用所述编码端对所述初始样本语义向量进行编码,得到样本隐状态,再利用所述样本隐状态、所述对话网络模型中的记忆矩阵对所述初始样本语义向量进行更新,得到最终样本语义向量;利用所述最终样本语义向量取出最终样本关注内容并输出至所述对话网络模型的解码端;利用所述解码端对所述最终样本关注内容解码得到样本词分布,通过所述样本词分布输出初始样本解码结果,并基于所述初始样本解码结果和预设的第一损失函数计算第一损失函数值;当所述初始样本解码结果中存在所述占位符时,通过所述...
【专利技术属性】
技术研发人员:孙思,
申请(专利权)人:平安国际智慧城市科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。