人机对话方法及系统、计算机设备及介质技术方案

技术编号:26762703 阅读:31 留言:0更新日期:2020-12-18 23:15
本申请实施例公开一种人机对话方法及系统、计算机设备及介质。该方法的一具体实施方式包括:获取用户输入的当前对话语句;将当前对话语句和在当前对话语句之前获取的前序对话语句的目标类型及目标实体作为神经网络系统的第一神经网络模块的输入,通过第一神经网络模块进行特征提取,生成当前对话语句的目标类型及目标实体;将当前对话语句、当前对话语句的目标类型及目标实体和知识库数据作为神经网络系统的第二神经网络模块的输入,通过第二神经网络模块进行特征提取及分类,生成回复语句。该实施方式能够实现主动自然的将人机对话从聊天对话、问答对话、任务型对话等非推荐对话引导到推荐对话,以实现推荐目标。

【技术实现步骤摘要】
人机对话方法及系统、计算机设备及介质
本申请涉及计算机
更具体地,涉及一种人机对话方法及系统、计算机设备及介质。
技术介绍
随着移动互联网和智能终端的快速发展,人机对话的应用越来越广泛。,例如各大互联网公司也推出各自的智能助手AppleSiri、GoogleNow、微软小娜(MicrosoftCortana)、FacebookM、百度度秘和微软小冰等等,都应用了人机对话功能。目前,现有的人机对话方式涉及到多种类型的对话,比如聊天对话、问答对话、任务型对话等,但这些类型的对话彼此之间是孤立的,主动性、扩展性及丰富性不足,且不符合通常的用户交谈习惯。现有的人机对话技术还需要不断发展和改进,朝着更加拟人化、博学化、并且能够完成更加复杂的任务的方向发展。
技术实现思路
本申请的目的在于提供一种人机对话方法及系统、计算机设备及介质,以解决现有技术存在的问题中的至少一个。为达到上述目的,本申请采用下述技术方案:本申请第一方面提供了一种人机对话方法,包括:获取用户输入的当前对话语句;将所述当前对话语句和在当前对话语句之前获取的前序对话语句的目标类型及目标实体作为所述神经网络系统的第一神经网络模块的输入,通过所述第一神经网络模块进行特征提取,生成当前对话语句的目标类型及目标实体;将所述当前对话语句、所述当前对话语句的目标类型及目标实体和知识库数据作为所述神经网络系统的第二神经网络模块的输入,通过所述第二神经网络模块进行特征提取及分类,生成回复语句。在一种可能的实现方式中,所述将所述当前对话语句和在当前对话语句之前获取的前序对话语句的目标类型及目标实体作为所述神经网络系统的第一神经网络模块的输入,通过所述第一神经网络模块进行特征提取,生成当前对话语句的目标类型及目标实体包括:对于当前对话语句为初始对话语句的情况,将所述当前对话语句和预设的目标类型及目标实体作为所述神经网络系统的第一神经网络模块的输入,通过所述第一神经网络模块进行特征提取,生成当前对话语句的目标类型及目标实体。在一种可能的实现方式中,所述将所述当前对话语句和在当前对话语句之前获取的前序对话语句的目标类型及目标实体作为所述神经网络系统的第一神经网络模块的输入,通过所述第一神经网络模块进行特征提取,生成当前对话语句的目标类型及目标实体包括:将所述当前对话语句作为所述第一神经网络模块的第一迭代空洞卷积神经网络模型的输入,通过所述第一迭代空洞卷积神经网络模型进行特征提取,生成表征当前对话目标是否完成的第一向量;将所述第一向量和在当前对话语句之前获取的前序对话语句的目标类型及目标实体作为所述第一神经网络模块的第二迭代空洞卷积神经网络模型的输入,通过所述第二迭代空洞卷积神经网络模型进行特征提取,生成当前对话语句的目标类型及目标实体。在一种可能的实现方式中,所述通过所述第一迭代空洞卷积神经网络模型进行特征提取,生成表征当前对话目标是否完成的第一向量包括:通过所述第一迭代空洞卷积神经网络模型进行特征提取,由所述第一迭代空洞卷积神经网络模型的池化层生成表征当前对话目标是否完成的第一向量;所述通过所述第二迭代空洞卷积神经网络模型进行特征提取,生成当前对话语句的目标类型及目标实体包括:通过所述第二迭代空洞卷积神经网络模型进行特征提取,由所述第二迭代空洞卷积神经网络模型的全连接层生成当前对话语句的目标类型及目标实体。在一种可能的实现方式中,所述将所述当前对话语句、所述当前对话语句的目标类型及目标实体和知识库数据作为所述神经网络系统的第二神经网络模块的输入,通过所述第二神经网络模块进行特征提取及分类,生成回复语句包括:将所述当前对话语句作为所述第二神经网络模块的自然语言处理模型的输入,通过所述自然语言处理模型进行编码以提取语义,生成第二向量;将所述当前对话语句的目标类型及目标实体作为所述第二神经网络模块的第一双向门控循环单元模型的输入,通过所述第一双向门控循环单元模型进行编码,生成第三向量;将所述第二向量与所述第三向量进行合并,得到第四向量;将所述知识库数据作为所述第二神经网络模块的第二双向门控循环单元模型的输入,通过所述第二双向门控循环单元模型进行编码,生成第五向量;对所述第四向量和所述第五向量进行注意力机制运算,得到第六向量;对所述第五向量与所述第六向量进行合并,得到第七向量;将所述第七向量作为所述第二神经网络模块的单层神经网络模型的输入,通过所述单层神经网络模型进行分类,生成回复语句。在一种可能的实现方式中,在所述将所述当前对话语句和知识库数据作为神经网络系统的输入,通过所述神经网络系统进行特征提取及分类,生成回复语句之前,该方法还包括:利用训练数据训练得到神经网络系统,所述训练数据包括对话序列、候选回复语句、知识库数据和目标推荐序列,所述对话序列包括聊天对话、问答对话和推荐对话。本申请第二方面提供了一种人机对话系统,包括:获取模块,用于获取用户输入的当前对话语句;第一神经网络模块,用于将所述当前对话语句和在当前对话语句之前获取的前序对话语句的目标类型及目标实体作为输入,通过特征提取,生成当前对话语句的目标类型及目标实体;第二神经网络模块,用于将所述当前对话语句、所述当前对话语句的目标类型及目标实体和知识库数据作为输入,通过特征提取及分类,生成回复语句。在一种可能的实现方式中,所述第一神经网络模块,用于在当前对话语句为初始对话语句时,将所述当前对话语句和预设的目标类型及目标实体作为输入,通过特征提取,生成当前对话语句的目标类型及目标实体。在一种可能的实现方式中,所述第一神经网络模块包括:第一迭代空洞卷积神经网络模型,用于将所述当前对话语句作为输入,通过特征提取,生成表征当前对话目标是否完成的第一向量;第二迭代空洞卷积神经网络模型,用于将所述第一向量和在当前对话语句之前获取的前序对话语句的目标类型及目标实体作为输入,通过特征提取,生成当前对话语句的目标类型及目标实体。在一种可能的实现方式中,所述第一迭代空洞卷积神经网络模型,用于通过其池化层生成表征当前对话目标是否完成的第一向量;所述第二迭代空洞卷积神经网络模型,用于通过其全连接层生成当前对话语句的目标类型及目标实体。在一种可能的实现方式中,所述第二神经网络模块包括:自然语言处理模型,用于将所述当前对话语句作为输入,通过编码以提取语义,生成第二向量;第一双向门控循环单元模型,用于将所述当前对话语句的目标类型及目标实体作为输入,通过编码,生成第三向量;第一合并模块,用于将所述第二向量与所述第三向量进行合并,得到第四向量;第二双向门控循环单元模型,用于将所述知识库数据作为输入,通过编码,生成第五向量;运算模块,用于对所述第四向量和所述第五向量进行注意力机制运算,得到第六向量;第二合并模块,用于对所述第五向量与所述第六向量本文档来自技高网...

【技术保护点】
1.一种人机对话方法,其特征在于,包括:/n获取用户输入的当前对话语句;/n将所述当前对话语句和在当前对话语句之前获取的前序对话语句的目标类型及目标实体作为所述神经网络系统的第一神经网络模块的输入,通过所述第一神经网络模块进行特征提取,生成当前对话语句的目标类型及目标实体;/n将所述当前对话语句、所述当前对话语句的目标类型及目标实体和知识库数据作为所述神经网络系统的第二神经网络模块的输入,通过所述第二神经网络模块进行特征提取及分类,生成回复语句。/n

【技术特征摘要】
1.一种人机对话方法,其特征在于,包括:
获取用户输入的当前对话语句;
将所述当前对话语句和在当前对话语句之前获取的前序对话语句的目标类型及目标实体作为所述神经网络系统的第一神经网络模块的输入,通过所述第一神经网络模块进行特征提取,生成当前对话语句的目标类型及目标实体;
将所述当前对话语句、所述当前对话语句的目标类型及目标实体和知识库数据作为所述神经网络系统的第二神经网络模块的输入,通过所述第二神经网络模块进行特征提取及分类,生成回复语句。


2.根据权利要求1所述的人机对话方法,其特征在于,所述将所述当前对话语句和在当前对话语句之前获取的前序对话语句的目标类型及目标实体作为所述神经网络系统的第一神经网络模块的输入,通过所述第一神经网络模块进行特征提取,生成当前对话语句的目标类型及目标实体包括:
对于当前对话语句为初始对话语句的情况,将所述当前对话语句和预设的目标类型及目标实体作为所述神经网络系统的第一神经网络模块的输入,通过所述第一神经网络模块进行特征提取,生成当前对话语句的目标类型及目标实体。


3.根据权利要求1所述的人机对话方法,其特征在于,所述将所述当前对话语句和在当前对话语句之前获取的前序对话语句的目标类型及目标实体作为所述神经网络系统的第一神经网络模块的输入,通过所述第一神经网络模块进行特征提取,生成当前对话语句的目标类型及目标实体包括:
将所述当前对话语句作为所述第一神经网络模块的第一迭代空洞卷积神经网络模型的输入,通过所述第一迭代空洞卷积神经网络模型进行特征提取,生成表征当前对话目标是否完成的第一向量;
将所述第一向量和在当前对话语句之前获取的前序对话语句的目标类型及目标实体作为所述第一神经网络模块的第二迭代空洞卷积神经网络模型的输入,通过所述第二迭代空洞卷积神经网络模型进行特征提取,生成当前对话语句的目标类型及目标实体。


4.根据权利要求3所述的人机对话方法,其特征在于,
所述通过所述第一迭代空洞卷积神经网络模型进行特征提取,生成表征当前对话目标是否完成的第一向量包括:通过所述第一迭代空洞卷积神经网络模型进行特征提取,由所述第一迭代空洞卷积神经网络模型的池化层生成表征当前对话目标是否完成的第一向量;
所述通过所述第二迭代空洞卷积神经网络模型进行特征提取,生成当前对话语句的目标类型及目标实体包括:通过所述第二迭代空洞卷积神经网络模型进行特征提取,由所述第二迭代空洞卷积神经网络模型的全连接层生成当前对话语句的目标类型及目标实体。


5.根据权利要求1所述的人机对话方法,其特征在于,所述将所述当前对话语句、所述当前对话语句的目标类型及目标实体和知识库数据作为所述神经网络系统的第二神经网络模块的输入,通过所述第二神经网络模块进行特征提取及分类,生成回复语句包括:
将所述当前对话语句作为所述第二神经网络模块的自然语言处理模型的输入,通过所述自然语言处理模型进行编码以提取语义,生成第二向量;
将所述当前对话语句的目标类型及目标实体作为所述第二神经网络模块的第一双向门控循环单元模型的输入,通过所述第一双向门控循环单元模型进行编码,生成第三向量;
将所述第二向量与所述第三向量进行合并,得到第四向量;
将所述知识库数据作为所述第二神经网络模块的第二双向门控循环单元模型的输入,通过所述第二双向门控循环单元模型进行编码,生成第五向量;
对所述第四向量和所述第...

【专利技术属性】
技术研发人员:梁天新
申请(专利权)人:京东方科技集团股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1