【技术实现步骤摘要】
基于粗糙语义的回复语句确定方法、装置及电子设备
[0001]本专利技术涉及人工智能
,具体涉及一种基于粗糙语义的回复语句确定方法、装置及电子设备。
技术介绍
[0002]目前,在传统对话模型中,通常是将前一轮对话文本进行编码,将得到的编码信息的隐藏层状态特征作为解码器的输入之一,再通过解码器按照时间序列自动生成对话的回复。这种方法中通过将前一轮对话文本编码出的隐藏层状态特征作为本轮对话中回复语句的生成依据之一,使回复语句生成过程包含了前一轮对话的信息特征。
[0003]但是,在传统的方案中,为了使模型可以针对对话中的关键信息进行回复语句的构建,这些特征往往是聚焦于前一轮对话中的关键信息,继而在实际提取过程中,这些关键信息被作为特征提取出来,而对话中的一些粗糙信息往往被丢弃。从而忽略了在某些文本中,一些粗糙信息更能体现了对话真正的关注点,导致回复语句不够精准。
技术实现思路
[0004]为了解决现有技术中存在的上述问题,本申请实施方式提供了一种基于粗糙语义的回复语句确定方法、装置及电子设备,可以同时提取前一轮对话中关键信息和粗糙信息,继而使生成的回复语句更加精准。
[0005]第一方面,本申请的实施方式提供了一种基于粗糙语义的回复语句确定方法,包括:
[0006]根据用户当前时刻的语音信息的发生时间,获取与语音信息相邻的前一轮语音信息,其中,前一轮语音信息的发生时间小于语音信息的发生时间,且前一轮语音信息的发生时间与语音信息的发生时间之间的差值的绝对值最小;
[00 ...
【技术保护点】
【技术特征摘要】
1.一种基于粗糙语义的回复语句确定方法,其特征在于,所述方法包括:根据用户当前时刻的语音信息的发生时间,获取与所述语音信息的相邻的前一轮语音信息,其中,所述前一轮语音信息的发生时间小于所述语音信息的发生时间,且所述前一轮语音信息的发生时间与所述语音信息的发生时间之间的差值的绝对值最小;根据所述前一轮语音信息对所述语音信息进行粗糙语义提取,得到对应于所述语音信息的粗糙语义特征;对所述语音信息进行分词处理,得到关键词组;对所述关键词组进行多次隐藏特征提取处理,得到初始隐藏层状态特征向量;根据所述粗糙语义特征和所述初始隐藏层状态特征向量进行多次回复词生成处理,得到至少一个回复词;将所述至少一个回复词按照所述至少一个回复词中每个回复词的生成顺序进行拼接,得到所述语音信息的回复语句。2.根据权利要求1所述的方法,其特征在于,所述根据所述前一轮语音信息对所述语音信息进行粗糙语义提取,得到对应于所述语音信息的粗糙语义特征,包括:对所述前一轮语音信息进行检测,得到所述前一轮语音信息包含的至少一个第一词语,其中,所述至少一个第一词语中的每个第一词语包括词语标签;根据所述至少一个第一词语确定所述前一轮语音信息的时态信息;将所述时态信息添加进所述每个第一词语的词语标签中,得到至少一个第二词语,其中,所述至少一个第二词语与所述至少一个第一词语一一对应;将所述至少一个第二词语输入粗糙编码器进行编码,得到至少一个粗糙上下文信息和至少一个第一隐藏层状态特征向量,其中,所述至少一个粗糙上下文信息与所述至少一个第二词语一一对应,所述至少一个第一隐藏层状态特征向量与所述至少一个第二词语一一对应;将所述至少一个粗糙上下文信息所述至少一个第一隐藏层状态特征向量输入粗糙解码器进行多次解码处理,得到所述语音信息的粗糙语义特征。3.根据权利要求2所述的方法,其特征在于,所述根据所述至少一个第一词语确定所述前一轮语音信息的时态信息,包括:将所述至少一个第一词语输入门控循环单元编码器进行编码,得到第二隐藏层状态特征向量;将所述第二隐藏层状态特征向量输入多层感知器,得到线性输出结果;将所述线性输出结果输入时态分类器,得到所述前一轮语音信息的时态信息。4.根据权利要求2所述的方法,其特征在于,所述将所述至少一个粗糙上下文信息所述至少一个第一隐藏层状态特征向量输入粗糙解码器进行多次解码处理,得到所述语音信息的粗糙语义特征,包括:在第i次解码处理中,将输入特征向量A
i
输入所述粗糙解码器,得到输出特征向量B
i
,其中,i为大于或等于1,且小于或等于j的整数,j为所述至少一个粗糙上下文信息的数量,j为大于或等于1的整数,当i=1时,所述输入特征向量A
i
为所述至少一个粗糙上下文信息中的第1个粗糙上下文信息;计算所述输出特征向量B
i
和所述至少一个第一隐藏层状态特征向量中第i个第一隐藏
层状态特征向量C
i
之间的相似度D
i
;对所述相似度D
i
进行归一化处理,得到所述输入特征向量A
i
的权重E
i
;将所述权重E
i
与所述第i个第一隐藏层状态特征向量C
i
相乘,得到权重特征向量F
i
;将所述权重特征向量F
i
与所述输出特征向量B
i
相加,得到目标输出特征向量G
i
;将所述目标输出特征向量G
i
作为第i+1次解码处理的输入特征向量A
i+1
进行所述第i+1次解码处理,直至进行所述多次解码处理,得到所述语音信息的粗糙语义特征。5.根据权利要求1所述的方法,其特征在于,所述关键词组包括至少一个关键词,且所述至少一个关键词按照所述至少一个关键词中的每个关键词在所述语音信息中的先后位置顺序进行排列;所述对所述关键词组进行多次隐藏特征提取处理,得到初始隐藏层状态特征向量,包括:...
【专利技术属性】
技术研发人员:舒畅,陈又新,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。