基于粗糙语义的回复语句确定方法、装置及电子设备制造方法及图纸

技术编号:33293075 阅读:44 留言:0更新日期:2022-05-01 00:16
本申请公开了一种基于粗糙语义的回复语句确定方法、装置及电子设备,其中,方法包括:根据用户当前时刻的语音信息的发生时间,获取与语音信息相邻的前一轮语音信息;根据前一轮语音信息对语音信息进行粗糙语义提取,得到对应于语音信息的粗糙语义特征;对语音信息进行分词处理,得到关键词组;对关键词组进行多次隐藏特征提取处理,得到初始隐藏层状态特征向量;根据粗糙语义特征和初始隐藏层状态特征向量进行多次回复词生成处理,得到至少一个回复词;将至少一个回复词按照至少一个回复词中每个回复词的生成顺序进行拼接,得到语音信息的回复语句。回复语句。回复语句。

【技术实现步骤摘要】
基于粗糙语义的回复语句确定方法、装置及电子设备


[0001]本专利技术涉及人工智能
,具体涉及一种基于粗糙语义的回复语句确定方法、装置及电子设备。

技术介绍

[0002]目前,在传统对话模型中,通常是将前一轮对话文本进行编码,将得到的编码信息的隐藏层状态特征作为解码器的输入之一,再通过解码器按照时间序列自动生成对话的回复。这种方法中通过将前一轮对话文本编码出的隐藏层状态特征作为本轮对话中回复语句的生成依据之一,使回复语句生成过程包含了前一轮对话的信息特征。
[0003]但是,在传统的方案中,为了使模型可以针对对话中的关键信息进行回复语句的构建,这些特征往往是聚焦于前一轮对话中的关键信息,继而在实际提取过程中,这些关键信息被作为特征提取出来,而对话中的一些粗糙信息往往被丢弃。从而忽略了在某些文本中,一些粗糙信息更能体现了对话真正的关注点,导致回复语句不够精准。

技术实现思路

[0004]为了解决现有技术中存在的上述问题,本申请实施方式提供了一种基于粗糙语义的回复语句确定方法、装置及电子设备,可以同时提取前一轮对话中关键信息和粗糙信息,继而使生成的回复语句更加精准。
[0005]第一方面,本申请的实施方式提供了一种基于粗糙语义的回复语句确定方法,包括:
[0006]根据用户当前时刻的语音信息的发生时间,获取与语音信息相邻的前一轮语音信息,其中,前一轮语音信息的发生时间小于语音信息的发生时间,且前一轮语音信息的发生时间与语音信息的发生时间之间的差值的绝对值最小;
[0007]根据前一轮语音信息对语音信息进行粗糙语义提取,得到对应于语音信息的粗糙语义特征;
[0008]对语音信息进行分词处理,得到关键词组;
[0009]对关键词组进行多次隐藏特征提取处理,得到初始隐藏层状态特征向量;
[0010]根据粗糙语义特征和初始隐藏层状态特征向量进行多次回复词生成处理,得到至少一个回复词;
[0011]将得到至少一个回复词按照至少一个回复词中每个回复词的生成顺序进行拼接,得到语音信息的回复语句。
[0012]第二方面,本申请的实施方式提供了一种基于粗糙语义的回复语句确定装置,包括:
[0013]获取模块,用于根据用户当前时刻的语音信息的发生时间,获取与语音信息相邻的前一轮语音信息,其中,前一轮语音信息的发生时间小于语音信息的发生时间,且前一轮语音信息的发生时间与语音信息的发生时间之间的差值的绝对值最小;
[0014]处理模块,用于根据前一轮语音信息对语音信息进行粗糙语义提取,得到对应于语音信息的粗糙语义特征,对语音信息进行分词处理,得到关键词组,并对关键词组进行多次隐藏特征提取处理,得到初始隐藏层状态特征向量;
[0015]生成模块,用于根据粗糙语义特征和初始隐藏层状态特征向量进行多次回复词生成处理,得到至少一个回复词,并将得到至少一个回复词按照至少一个回复词中每个回复词的生成顺序进行拼接,得到语音信息的回复语句。
[0016]第三方面,本申请实施方式提供一种电子设备,包括:处理器,处理器与存储器相连,存储器用于存储计算机程序,处理器用于执行存储器中存储的计算机程序,以使得电子设备执行如第一方面的方法。
[0017]第四方面,本申请实施方式提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序使得计算机执行如第一方面的方法。
[0018]第五方面,本申请实施方式提供一种计算机程序产品,计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,计算机可操作来使计算机执行如第一方面的方法。
[0019]实施本申请实施方式,具有如下有益效果:
[0020]在本申请实施方式中,通过获取用户当前时刻的语音信息的前一轮语音信息,继而对该前一轮语音信息进行粗糙语义提取,得到可以包含该前一轮语音信息中高层次的抽象信息的语义特征,作为用户当前时刻的语音信息的粗糙语义特征,由此,实现了对前一轮语音信息中关键信息和粗糙信息的同步提取。然后,对用户当前时刻的语音信息进行分词处理,并对得到的多个关键词进行多次隐藏特征提取处理,得到用户当前时刻的语音信息的初始隐藏层状态特征向量。最后,根据粗糙语义特征和初始隐藏层状态特征向量进行多次回复词生成处理,将得到的至少一个回复词按照至少一个回复词中每个回复词的生成顺序进行拼接,得到语音信息的回复语句。基于此,将同时包含前一轮对话中的关键信息和粗糙信息的粗糙语义特征作为本轮对话中回复语句的生成依据之一,使回复语句生成过程包含了前一轮对话的更加全面的信息特征。由此,生成的回复语句的精准度更高,可以与对话的主体更好的契合,提升用户体验。
附图说明
[0021]为了更清楚地说明本申请实施方式中的技术方案,下面将对实施方式描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0022]图1为本申请实施方式提供的一种基于粗糙语义的回复语句确定装置的硬件结构示意图;
[0023]图2为本申请实施方式提供的一种基于粗糙语义的回复语句确定方法的流程示意图;
[0024]图3为本申请实施方式提供的一种根据前一轮语音信息对语音信息进行粗糙语义提取,得到对应于语音信息的粗糙语义特征的方法的流程示意图;
[0025]图4为本申请实施方式提供的一种门控循环单元编码器的结构示意图;
[0026]图5为本申请实施方式提供的一种多层感知器的结构示意图;
[0027]图6为本申请实施方式提供的一种将至少一个粗糙上下文信息至少一个第一隐藏层状态特征向量输入粗糙解码器进行多次解码处理,得到语音信息的粗糙语义特征的方法的流程示意图;
[0028]图7为本申请实施方式提供的一种回复词生成处理的流程框图;
[0029]图8为本申请实施方式提供的一种基于粗糙语义的回复语句确定装置的功能模块组成框图;
[0030]图9为本申请实施方式提供的一种电子设备的结构示意图。
具体实施方式
[0031]下面将结合本申请实施方式中的附图,对本申请实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本申请一部分实施方式,而不是全部的实施方式。基于本申请中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本申请保护的范围。
[0032]本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0033]在本文中提及“本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于粗糙语义的回复语句确定方法,其特征在于,所述方法包括:根据用户当前时刻的语音信息的发生时间,获取与所述语音信息的相邻的前一轮语音信息,其中,所述前一轮语音信息的发生时间小于所述语音信息的发生时间,且所述前一轮语音信息的发生时间与所述语音信息的发生时间之间的差值的绝对值最小;根据所述前一轮语音信息对所述语音信息进行粗糙语义提取,得到对应于所述语音信息的粗糙语义特征;对所述语音信息进行分词处理,得到关键词组;对所述关键词组进行多次隐藏特征提取处理,得到初始隐藏层状态特征向量;根据所述粗糙语义特征和所述初始隐藏层状态特征向量进行多次回复词生成处理,得到至少一个回复词;将所述至少一个回复词按照所述至少一个回复词中每个回复词的生成顺序进行拼接,得到所述语音信息的回复语句。2.根据权利要求1所述的方法,其特征在于,所述根据所述前一轮语音信息对所述语音信息进行粗糙语义提取,得到对应于所述语音信息的粗糙语义特征,包括:对所述前一轮语音信息进行检测,得到所述前一轮语音信息包含的至少一个第一词语,其中,所述至少一个第一词语中的每个第一词语包括词语标签;根据所述至少一个第一词语确定所述前一轮语音信息的时态信息;将所述时态信息添加进所述每个第一词语的词语标签中,得到至少一个第二词语,其中,所述至少一个第二词语与所述至少一个第一词语一一对应;将所述至少一个第二词语输入粗糙编码器进行编码,得到至少一个粗糙上下文信息和至少一个第一隐藏层状态特征向量,其中,所述至少一个粗糙上下文信息与所述至少一个第二词语一一对应,所述至少一个第一隐藏层状态特征向量与所述至少一个第二词语一一对应;将所述至少一个粗糙上下文信息所述至少一个第一隐藏层状态特征向量输入粗糙解码器进行多次解码处理,得到所述语音信息的粗糙语义特征。3.根据权利要求2所述的方法,其特征在于,所述根据所述至少一个第一词语确定所述前一轮语音信息的时态信息,包括:将所述至少一个第一词语输入门控循环单元编码器进行编码,得到第二隐藏层状态特征向量;将所述第二隐藏层状态特征向量输入多层感知器,得到线性输出结果;将所述线性输出结果输入时态分类器,得到所述前一轮语音信息的时态信息。4.根据权利要求2所述的方法,其特征在于,所述将所述至少一个粗糙上下文信息所述至少一个第一隐藏层状态特征向量输入粗糙解码器进行多次解码处理,得到所述语音信息的粗糙语义特征,包括:在第i次解码处理中,将输入特征向量A
i
输入所述粗糙解码器,得到输出特征向量B
i
,其中,i为大于或等于1,且小于或等于j的整数,j为所述至少一个粗糙上下文信息的数量,j为大于或等于1的整数,当i=1时,所述输入特征向量A
i
为所述至少一个粗糙上下文信息中的第1个粗糙上下文信息;计算所述输出特征向量B
i
和所述至少一个第一隐藏层状态特征向量中第i个第一隐藏
层状态特征向量C
i
之间的相似度D
i
;对所述相似度D
i
进行归一化处理,得到所述输入特征向量A
i
的权重E
i
;将所述权重E
i
与所述第i个第一隐藏层状态特征向量C
i
相乘,得到权重特征向量F
i
;将所述权重特征向量F
i
与所述输出特征向量B
i
相加,得到目标输出特征向量G
i
;将所述目标输出特征向量G
i
作为第i+1次解码处理的输入特征向量A
i+1
进行所述第i+1次解码处理,直至进行所述多次解码处理,得到所述语音信息的粗糙语义特征。5.根据权利要求1所述的方法,其特征在于,所述关键词组包括至少一个关键词,且所述至少一个关键词按照所述至少一个关键词中的每个关键词在所述语音信息中的先后位置顺序进行排列;所述对所述关键词组进行多次隐藏特征提取处理,得到初始隐藏层状态特征向量,包括:...

【专利技术属性】
技术研发人员:舒畅陈又新
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1