对话生成方法及装置、存储介质、电子设备制造方法及图纸

技术编号:22330147 阅读:47 留言:0更新日期:2019-10-19 12:17
本公开提供一种对话生成方法及装置、电子设备、存储介质;涉及计算机技术领域。所述对话生成方法包括:获取输入的原始对话信息;根据预先训练好的功能分类模型识别所述原始对话信息以确定所述原始对话信息对应的语句功能类型;将所述原始对话信息以及所述语句功能类型输入预先训练好的对话生成模型以生成所述原始对话信息对应的对话回复信息。本公开能够根据输入的语句生成带有语句功能的回复语句,提高了对话系统生成回复的多样性和信息量,提升用户的使用体验。

Dialogue generation method and device, storage medium and electronic equipment

【技术实现步骤摘要】
对话生成方法及装置、存储介质、电子设备
本公开涉及计算机
,具体而言,涉及一种对话生成方法、对话生成装置、电子设备以及计算机可读存储介质。
技术介绍
语句功能(SentenceFunction)是一种重要的语言学特征,按语句功能可以将语句划分为疑问句、陈述句、祈使句等多个类别,该特征在对话中能够体现说话者的目的或者情感。目前,现有的生成式对话系统基本都是基于Sequence-to-Sequence(序列到序列的转换模型,Seq2Seq)框架,其中生成回复的质量是影响用户体验的重要因素。针对对话系统所生成回复质量的问题,已经有大量的方法被提出,例如尝试增强回复的多样性,或者尝试提高回复的信息量。但是这些方法在生成回复的时候只会影响少量的词,例如“微笑”对应开心的情感,“保湿水”对应一个护肤的话题等。这些方法对于提升生成回复的用词多样性和信息量的效果较差,且可控性较低,影响用户的使用体验。因此,提供一种生成回复的信息量较多且具备多样性以及可控性的对话生成方法是非常必要的。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种对话生成方法、对话生成装置、电子设备以及计算机可读存储介质,进而在一定程度上克服由于相关技术的限制和缺陷而导致的,生成式对话模型回复信息量较少且不可控的问题。根据本公开的第一方面,提供一种对话生成方法,包括:获取输入的原始对话信息;根据预先训练好的功能分类模型识别所述原始对话信息以确定所述原始对话信息对应的语句功能类型;将所述原始对话信息以及所述语句功能类型输入预先训练好的对话生成模型以生成所述原始对话信息对应的对话回复信息。在本公开的一种示例性实施例中,所述功能分类模型包括语句编码器,全连接层以及归一化函数层,所述根据预先训练好的功能分类模型识别所述原始对话信息以确定所述原始对话信息对应的语句功能类型,包括:根据所述语句编码器对所述原始对话信息进行编码,生成所述原始对话信息对应的语句向量;获取一随机分布式向量,并根据所述随机分布式向量以及所述语句向量确定所述原始对话信息对应的特征向量;基于所述全连接层以及所述归一化函数层,通过所述特征向量确定所述原始对话信息对应的语句功能类型。在本公开的一种示例性实施例中,在根据预先训练好的功能分类模型识别所述原始对话信息以确定所述原始对话信息对应的语句功能类型之前,所述方法还包括:根据预先构建的语句功能分类数据对预设样本数据库中的样本语句进行标记;通过标记后的所述样本语句对所述功能分类模型进行训练以完成对所述功能分类模型的训练过程。在本公开的一种示例性实施例中,所述对话生成模型包括语句编码网络以及生成网络,所述将所述原始对话信息以及所述语句功能类型输入预先训练好的对话生成模型以生成所述原始对话信息对应的对话回复信息,包括:通过所述语句编码网络对所述原始对话信息以及所述语句功能类型进行编码,生成一对应所述原始对话信息且包含所述语句功能类型的隐变量;根据所述生成网络对所述隐变量进行解码,生成所述原始对话信息对应的对话回复信息。在本公开的一种示例性实施例中,通过所述语句编码网络对所述原始对话信息以及所述语句功能类型进行编码,生成一对应所述原始对话信息且包含所述语句功能类型的隐变量,包括:通过所述语句编码网络对所述原始对话信息以及所述语句功能类型进行编码,生成一对应所述原始对话信息且包含所述语句功能类型的原始对话向量;对所述原始对话向量进行变分推断以及正态分布采样处理得到所述隐变量。在本公开的一种示例性实施例中,所述对话生成模型还包括辨别器网络,所述在将所述原始对话信息以及所述语句功能类型输入预先训练好的对话生成模型以生成所述原始对话信息对应的对话回复信息之前,所述方法,还包括:获取样本数据库中的样本对话,根据所述对话生成模型对所述样本对话进行编码生成目标对话向量;所述样本对话包括样本语句以及所述样本语句关联的回复语句;通过所述生成网络对所述目标对话向量进行解码生成所述样本语句对应的所述回复语句以计算所述生成网络对应的生成损失;通过所述辨别器网络对所述目标对话向量进行识别处理确定所述目标对话向量对应的语句功能类型以计算所述辨别器网络对应的分类损失;对所述分类损失以及所述生成损失进行相加生成所述对话生成模型的总损失以根据所述总损失对所述对话生成模型进行训练。在本公开的一种示例性实施例中,所述对话生成模型还包括训练编码网络,所述训练编码网络包括样本语句编码器以及回复语句编码器;所述获取样本数据库中的样本对话,根据所述对话生成模型对所述样本对话进行编码生成目标对话向量,包括:根据所述样本语句编码器对所述样本语句进行编码生成样本语句向量;根据所述回复语句编码器对所述回复语句进行编码生成回复语句向量;将所述样本语句向量以及所述回复语句向量进行相加生成目标对话向量。在本公开的一种示例性实施例中,通过所述生成网络对所述目标对话向量进行解码生成所述样本语句对应的所述回复语句以计算所述生成网络对应的生成损失,包括:对所述目标对话向量进行变分推断以及正态分布采样处理得到目标隐变量;将所述目标隐变量作为所述生成网络对应的初始隐含状态,并通过所述生成网络对所述目标对话向量进行解码生成所述样本语句对应的所述回复语句以计算所述生成网络对应的生成损失。在本公开的一种示例性实施例中,通过所述辨别器网络对所述目标对话向量进行识别处理确定所述目标对话向量对应的语句功能类型以计算所述辨别器网络对应的分类损失,包括:根据所述辨别器网络对应的最大似然模型确定所述辨别器网络的损失函数;将所述样本语句向量输入到所述辨别器网络,确定所述样本语句向量的语句功能类型以根据所述损失函数计算分类损失。根据本公开的第二方面,提供一种对话生成装置,包括:对话信息获取模块,用于获取输入的原始对话信息;功能分类识别模块,用于根据预先训练好的功能分类模型识别所述原始对话信息以确定所述原始对话信息对应的语句功能类型;对话回复生成模块,用于将所述原始对话信息以及所述语句功能类型输入预先训练好的对话生成模型以生成所述原始对话信息对应的对话回复信息。在本公开的一种示例性实施例中,所述功能分类识别单元2220包括:对话信息编码单元,用于根据所述语句编码器对所述原始对话信息进行编码,生成所述原始对话信息对应的语句向量;特征向量确定单元,用于获取一随机分布式向量,并根据所述随机分布式向量以及所述语句向量确定所述原始对话信息对应的特征向量;语句功能类型确定单元,用于基于所述全连接层以及所述归一化函数层,通过所述特征向量确定所述原始对话信息对应的语句功能类型。在本公开的一种示例性实施例中,所述对话生成装置2200通过下述步骤对功能分类模型进行训练:根据预先构建的语句功能分类数据对预设样本数据库中的样本语句进行标记;通过标记后的所述样本语句对所述功能分类模型进行训练以完成对所述功能分类模型的训练过程。在本公开的一种示例性实施例中,所述对话回复生成模块2230包括:隐变量生成单元,用于通过所述语句编码网络对所述原始对话信息以及所述语句功能类型进行编码,生成一对应所述原始对话信息且包含所述语句功能类型的隐变量;本文档来自技高网...

【技术保护点】
1.一种对话生成方法,其特征在于,包括:获取输入的原始对话信息;根据预先训练好的功能分类模型识别所述原始对话信息以确定所述原始对话信息对应的语句功能类型;将所述原始对话信息以及所述语句功能类型输入预先训练好的对话生成模型以生成所述原始对话信息对应的对话回复信息。

【技术特征摘要】
1.一种对话生成方法,其特征在于,包括:获取输入的原始对话信息;根据预先训练好的功能分类模型识别所述原始对话信息以确定所述原始对话信息对应的语句功能类型;将所述原始对话信息以及所述语句功能类型输入预先训练好的对话生成模型以生成所述原始对话信息对应的对话回复信息。2.根据权利要求1所述的对话生成方法,其特征在于,所述功能分类模型包括语句编码器,全连接层以及归一化函数层,所述根据预先训练好的功能分类模型识别所述原始对话信息以确定所述原始对话信息对应的语句功能类型,包括:根据所述语句编码器对所述原始对话信息进行编码,生成所述原始对话信息对应的语句向量;获取一随机分布式向量,并根据所述随机分布式向量以及所述语句向量确定所述原始对话信息对应的特征向量;基于所述全连接层以及所述归一化函数层,通过所述特征向量确定所述原始对话信息对应的语句功能类型。3.根据权利要求2所述的对话生成方法,其特征在于,在根据预先训练好的功能分类模型识别所述原始对话信息以确定所述原始对话信息对应的语句功能类型之前,所述方法还包括:根据预先构建的语句功能分类数据对预设样本数据库中的样本语句进行标记;通过标记后的所述样本语句对所述功能分类模型进行训练以完成对所述功能分类模型的训练过程。4.根据权利要求1所述的对话生成方法,其特征在于,所述对话生成模型包括语句编码网络、生成网络以及辨别器网络,在将所述原始对话信息以及所述语句功能类型输入预先训练好的对话生成模型以生成所述原始对话信息对应的对话回复信息之前,所述方法还包括:获取样本数据库中的样本对话,根据所述对话生成模型对所述样本对话进行编码生成目标对话向量;所述样本对话包括样本语句以及所述样本语句关联的回复语句;通过所述生成网络对所述目标对话向量进行解码生成所述样本语句对应的所述回复语句以计算所述生成网络对应的生成损失;通过所述辨别器网络对所述目标对话向量进行识别处理确定所述目标对话向量对应的语句功能类型以计算所述辨别器网络对应的分类损失;对所述分类损失以及所述生成损失进行相加生成所述对话生成模型的总损失以根据所述总损失对所述对话生成模型进行训练。5.根据...

【专利技术属性】
技术研发人员:高俊闭玮刘晓江史树明
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1