一种对话处理方法及装置制造方法及图纸

技术编号:30020709 阅读:33 留言:0更新日期:2021-09-11 06:40
本公开涉及人机对话技术领域,具体涉及一种对话处理方法及装置。对话处理方法包括:获取对话问询数据,所述对话问询数据包括问询字符序列;基于所述问询字符序列,以及在当前待生成字符之前生成的回复字符序列,确定所述当前待生成字符的候选字符集合;根据预先确定的目标性格特征,将所述候选字符集合中确定的目标字符作为所述当前待生成字符;基于所述目标字符对所述回复字符序列进行更新,直至所述回复字符序列中所有字符生成完成,得到目标回复数据。本公开方法提高人机对话性能。本公开方法提高人机对话性能。本公开方法提高人机对话性能。

【技术实现步骤摘要】
一种对话处理方法及装置


[0001]本公开涉及人机对话
,具体涉及一种对话处理方法及装置。

技术介绍

[0002]随着智能终端和AI(Artificial Intelligence,人工智能)技术的发展,人机对话系统(Conversational Systems)已经成为新一代的人机交互方式。目前,各种人机对话系统已经被工业界广泛应用到各个类型的产品服务中。
[0003]与此同时,随着AI技术的不断发展,人们也对人机对话系统的性能提出了更高的需求。

技术实现思路

[0004]为提高人机对话系统性能,本公开实施方式提供了一种对话处理方法、装置、电子设备以及存储介质。
[0005]第一方面,本公开实施方式提供了一种对话处理方法,包括:
[0006]获取对话问询数据,所述对话问询数据包括问询字符序列;
[0007]基于所述问询字符序列,以及在当前待生成字符之前生成的回复字符序列,确定所述当前待生成字符的候选字符集合;
[0008]根据预先确定的目标性格特征,将所述候选字符集合中确定的目标字符作为所述当前待生成字符;
[0009]基于所述目标字符对所述回复字符序列进行更新,直至所述回复字符序列中所有字符生成完成,得到目标回复数据。
[0010]在一些实施方式中,所述基于所述问询字符序列,以及在当前待生成字符之前生成的回复字符序列,确定所述当前待生成字符的候选字符集合,包括:
[0011]将所述问询字符序列输入预训练好的对话生成网络,得到所述对话生成网络输出的所述当前待生成字符的各候选字符以及各候选字符对应的第一权值;
[0012]将所述第一权值由高到低排序,确定与前预设数量的所述第一权值对应的候选字符组成的所述候选字符集合。
[0013]在一些实施方式中,所述根据预先确定的目标性格特征,将所述候选字符集合中确定的目标字符作为所述当前待生成字符,包括:
[0014]对于所述候选字符集合中的每个候选字符,将该候选字符与当前待生成字符之前生成的所述回复字符序列组合,得到候选序列;
[0015]将各个所述候选序列输入预训练好的目标性格判别网络,得到所述目标性格判别网络输出的各个候选序列对应的第二权值;其中,所述目标性格判别网络是从多个性格判别网络中预先确定的网络;
[0016]将每个候选字符对应的所述第一权值与所述第二权值融合处理,得到每个候选字符对应的第三权值;
[0017]根据所述第三权值,将所述候选字符集合中确定的目标字符作为所述当前待生成字符。
[0018]在一些实施方式中,所述直至所述回复字符序列中所有字符生成完成,得到目标回复数据,包括:
[0019]响应于检测到当前待生成字符包括终止符,确定所述回复字符序列中所有字符生成完成,得到目标回复数据。
[0020]在一些实施方式中,每个所述性格判别网络的训练过程如下:
[0021]获取第一对话数据,所述第一对话数据包括对话问询数据、对话回复数据以及与所述对话回复数据对应的性格数据;
[0022]将所述第一对话数据的对话回复数据输入所述性格判别网络,得到所述性格判别网络输出的预测性格;
[0023]根据所述预测性格与所述性格数据之间的差异,对所述性格判别网络的网络参数进行调整,直到满足收敛条件。
[0024]在一些实施方式中,每个所述性格判别网络的训练过程,还包括:
[0025]对所述第一对话数据的对话回复数据进行抽样处理,得到包含残缺对话回复数据的残缺对话数据;
[0026]将所述残缺对话数据包含的所述残缺对话回复数据输入所述性格判别网络,得到所述性格判断网络输出的预测性格;
[0027]根据所述预测性格与所述残缺对话数据的性格数据之间的差异,对所述性格判别网络的网络参数进行调整,直到满足收敛条件。
[0028]在一些实施方式中,训练所述对话生成网络和/或所述性格判别网络的训练对话数据,通过如下步骤获得:
[0029]对于每一个性格判别网络,将当前轮次得到的目标回复数据作为下一轮次的对话问询数据,循环迭代执行得到目标回复数据的过程,直至满足收敛条件;
[0030]根据循环迭代过程中所产生的每组所述对话问询数据和所述目标回复数据,得到第一训练对话数据;
[0031]根据循环迭代过程中所产生的每组所述对话问询数据、所述目标回复数据以及性格判别网络对应的性格数据,得到第二训练对话数据。
[0032]第二方面,本公开实施方式提供了一种对话处理装置,包括:
[0033]获取模块,被配置为获取对话问询数据,所述对话问询数据包括问询字符序列;
[0034]第一确定模块,被配置为基于所述问询字符序列,以及在当前待生成字符之前生成的回复字符序列,确定所述当前待生成字符的候选字符集合;
[0035]第二确定模块,被配置为根据预先确定的目标性格特征,将所述候选字符集合中确定的目标字符作为所述当前待生成字符;
[0036]更新模块,被配置为基于所述目标字符对所述回复字符序列进行更新,直至所述回复字符序列中所有字符生成完成,得到目标回复数据。
[0037]在一些实施方式中,所述第一确定模块具体被配置为:
[0038]将所述问询字符序列输入预训练好的对话生成网络,得到所述对话生成网络输出的所述当前待生成字符的各候选字符以及各候选字符对应的第一权值;
[0039]将所述第一权值由高到低排序,确定与前预设数量的所述第一权值对应的候选字符组成的所述候选字符集合。
[0040]在一些实施方式中,所述第二确定模块具体被配置为:
[0041]对于所述候选字符集合中的每个候选字符,将该候选字符与当前待生成字符之前生成的所述回复字符序列组合,得到候选序列;
[0042]将各个所述候选序列输入预训练好的目标性格判别网络,得到所述目标性格判别网络输出的各个候选序列对应的第二权值;其中,所述目标性格判别网络是从多个性格判别网络中预先确定的网络;
[0043]将每个候选字符对应的所述第一权值与所述第二权值融合处理,得到每个候选字符对应的第三权值;
[0044]根据所述第三权值,将所述候选字符集合中确定的目标字符作为所述当前待生成字符。
[0045]在一些实施方式中,本公开所述的装置还包括网络训练模块,所述网络训练模块被配置为:
[0046]获取第一对话数据,所述第一对话数据包括对话问询数据、对话回复数据以及与所述对话回复数据对应的性格数据;
[0047]将所述第一对话数据的对话回复数据输入所述性格判别网络,得到所述性格判别网络输出的预测性格;
[0048]根据所述预测性格与所述性格数据之间的差异,对所述性格判别网络的网络参数进行调整,直到满足收敛条件。
[0049]在一些实施方式中,所述网络训练模块被配置为:
[0050]对所述第一对话数据的对话回复数据进行抽样处理,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对话处理方法,其特征在于,包括:获取对话问询数据,所述对话问询数据包括问询字符序列;基于所述问询字符序列,以及在当前待生成字符之前生成的回复字符序列,确定所述当前待生成字符的候选字符集合;根据预先确定的目标性格特征,将所述候选字符集合中确定的目标字符作为所述当前待生成字符;基于所述目标字符对所述回复字符序列进行更新,直至所述回复字符序列中所有字符生成完成,得到目标回复数据。2.根据权利要求1所述的方法,其特征在于,所述基于所述问询字符序列,以及在当前待生成字符之前生成的回复字符序列,确定所述当前待生成字符的候选字符集合,包括:将所述问询字符序列输入预训练好的对话生成网络,得到所述对话生成网络输出的所述当前待生成字符的各候选字符以及各候选字符对应的第一权值;将所述第一权值由高到低排序,确定与前预设数量的所述第一权值对应的候选字符组成的所述候选字符集合。3.根据权利要求2所述的方法,其特征在于,所述根据预先确定的目标性格特征,将所述候选字符集合中确定的目标字符作为所述当前待生成字符,包括:对于所述候选字符集合中的每个候选字符,将该候选字符与当前待生成字符之前生成的所述回复字符序列组合,得到候选序列;将各个所述候选序列输入预训练好的目标性格判别网络,得到所述目标性格判别网络输出的各个候选序列对应的第二权值;其中,所述目标性格判别网络是从多个性格判别网络中预先确定的网络;将每个候选字符对应的所述第一权值与所述第二权值融合处理,得到每个候选字符对应的第三权值;根据所述第三权值,将所述候选字符集合中确定的目标字符作为所述当前待生成字符。4.根据权利要求1至3任一项所述的方法,其特征在于,所述直至所述回复字符序列中所有字符生成完成,得到目标回复数据,包括:响应于检测到当前待生成字符包括终止符,确定所述回复字符序列中所有字符生成完成,得到目标回复数据。5.根据权利要求3所述的方法,其特征在于,每个所述性格判别网络的训练过程如下:获取第一对话数据,所述第一对话数据包括对话问询数据、对话回复数据以及与所述对话回复数据对应的性格数据;将所述第一对话数据的对话回复数据输入所述性格判别网络,得到所述性格判别网络输出的预测性格;根据所述预测性格与所述性格数据之间的差异,对所述性格判别网络的网络参数进行调整,直到满足收敛条件。6.根据权利要求5所述的方法,其特征在于,每个所述性格判别网络的训练过程,还包括:对所述第一对话数据的对话回复数据进行抽样处理,得到包含残缺对话回复数据的残
缺对话数据;将所述残缺对话数据包含的所述残缺对话回复数据输入所述性格判别网络,得到所述性格判断网络输出的预测性格;根据所述预测性格与所述残缺对话数据的性格数据之间的差异,对所述性格判别网络的网络参数进行调整,直到满足收敛条件。7.根据权利要求3所述的方法,其特征在于,训练所述对话生成网络和/或所述性格判别网络的训练对话数据,通过如下步骤获得:对于每一个性格判别网络,将当前轮次得到的目标回复数据作为下一轮次的对话问询数据,循环迭代执行得到目标回复数据的过程,直至满足收敛条件;根据循环迭代过程中所产生的每组所述对话问询数据和所述目标回复数据,得到第一训练对话数据;根据循环迭代过程中所产生的每组所述对话问询数据、所述目标回复数据以及性格判别网络对应的性格数据,得到第二训练对话数据。8.一...

【专利技术属性】
技术研发人员:张嘉益
申请(专利权)人:北京小米松果电子有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1