语音对话方法及装置、电子设备、存储介质制造方法及图纸

技术编号:37149787 阅读:24 留言:0更新日期:2023-04-06 22:04
本发明专利技术公开了一种语音对话方法及装置、电子设备、存储介质,涉及生物识别领域,其中,该方法包括:响应业务办理请求,获取客户发出的声音的声音特征;在声音特征表征的声音类型属于目标语音类型集合的情况下,将客户发出的声音正向转码为普通话字符码,并将由普通话字符码形成的普通话音频输出至客服终端;接收客服终端传输的业务解答语音,并将业务解答语音逆向转码为符合声音类型的待播报音频;将待播报音频播放给客户。本发明专利技术解决了现有技术中在进行对话服务时,客服人员仅仅提供无差别化服务,而对于特殊语言用户无法提供个性化服务的技术问题。技术问题。技术问题。

【技术实现步骤摘要】
语音对话方法及装置、电子设备、存储介质


[0001]本专利技术涉及生物识别领域,具体而言,涉及一种语音对话方法及装置、电子设备、存储介质。

技术介绍

[0002]当前用户通过移动客户终端办理相关业务时,一般是通过文字与客服进行交流,客服在接收到用户需求后提供相应的服务,若文字交流无法满足用户需求,会提示用户点击人工客服按钮进行一对一服务或者拨打客户服务热线咨询。
[0003]随着移动终端APP(例如,各商业银行的APP)等智能终端的广泛应用,相关业务可以在线上进行办理,为迎合市场需求,相关企业通过应用终端提供了非常丰富的服务和功能,版本更新迅速,用户进行业务办理时可能需要提供更多的帮助,线上业务的受众群体广泛,现有技术中,智能终端应用客服仅仅能提供无差别化服务,对于特殊语言人群的服务需求,在进行对话服务时由于专业能力受限,无法为其提供具有针对性、个性化的服务。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种语音对话方法及装置、电子设备、存储介质,以至少解决现有技术中在进行对话服务时,客服人员仅仅提供无差别化服务,而对于特殊语言用户无法提供个性化服务的技术问题。
[0006]根据本专利技术实施例的一个方面,提供了一种语音对话方法,包括:响应业务办理请求,获取客户发出的声音的声音特征;在所述声音特征表征的声音类型属于目标语音类型集合的情况下,将所述客户发出的声音正向转码为普通话字符码,并将由所述普通话字符码形成的普通话音频输出至客服终端;接收所述客服终端传输的业务解答语音,并将所述业务解答语音逆向转码为符合所述声音类型的待播报音频;将所述待播报音频播放给所述客户。
[0007]可选地,在判别所述声音特征表征的声音类型属于目标语音类型集合之后,还包括:在识别判别所述声音特征表征的声音类型属于所述目标语音类型集合的情况下,确认进入语音对话模式,其中,所述语音对话模式用于为所述客户分配对应的对话解答客服。
[0008]可选地,将所述客户发出的声音正向转码为普通话字符码的步骤,包括:判别所述客户发出的声音属于方言声音类型或指定民族声音类型;在所述客户发出的声音属于方言声音类型的情况下,通过方言识别系统将所述客户发出的声音正向转码为所述普通话字符码;在所述客户发出的声音属于指定民族声音类型的情况下,获取所述客户的籍贯和通话地址,并基于所述籍贯和所述通话地址确认所述客户的目标民族名称,并通过与所述目标民族名称对应的预设识别系统将所述客户发出的声音正向转码为所述普通话字符码。
[0009]可选地,在所述客户发出的声音属于方言声音类型的情况下,通过方言识别系统将所述客户发出的声音正向转码为普通话字符码的步骤,包括:在所述客户发出的声音属
于方言声音类型的情况下,获取所述客户的通话终端地址和通话号码;提取所述客户的注册信息表,其中,所述注册信息表中至少包括:所述客户的常驻地址和籍贯;基于所述通话终端地址、所述通话号码和所述注册信息表,确认所述客户发出的声音所属的方言类别;通过所述方言识别系统调取与所述方言类别对应的字符集;基于所述字符集,采用预设进制算法将所述客户发出的声音转码为指定格式的方言字节码,得到字节码集合;将所述字节码集合中的N个方言字节码翻译为所述普通话字符码,其中,N为大于等于1的正整数。
[0010]可选地,通过与所述目标民族名称对应的预设识别系统将所述客户发出的声音正向转码为普通话字符码的步骤,包括:通过所述预设识别系统调取与所述目标民族名称对应的民族语言扩展表;基于所述民族语言扩展表,将所述客户发出的声音转码为指定格式的民族语言字节码,得到字节码集合;将所述字节码集合中的民族语言字节码翻译为所述普通话字符码。
[0011]可选地,接收所述客服终端传输的业务解答语音,并将所述业务解答语音逆向转码为符合所述声音类型的待播报音频的步骤,包括:在所述客户发出的声音属于方言声音类型的情况下,通过所述方言识别系统将所述业务解答语音逆向转码为对应于所述方言声音类型的方言解答音频,得到所述待播报音频;在所述客户发出的声音属于指定民族声音类型的情况下,通过所述预设识别系统将所述业务解答语音逆向转码为与所述客户的目标民族名称对应的解答音频,得到所述待播报音频。
[0012]可选地,在判别所述客户发出的声音属于方言声音类型或指定民族声音类型之后,还包括:在无法判别所述客户发出的声音所属的类型的情况下,确认所述客户发出的声音无对应的识别系统;对所述客户发出的声音进行汉字表音化处理,并记录表音化处理得到的字符码。
[0013]可选地,响应业务办理请求,获取客户发出的声音的声音特征的步骤,包括:响应业务办理请求,接收所述客户发出的声音的原声音频;对所述原声音频进行降噪处理和滤波处理,完成预处理操作;将所述客户发出的声音所对应的波段拆分为M帧,提取所述M帧中每帧的波形特征,得到所述声音特征,其中,M为大于等于1的正整数。
[0014]可选地,提取所述M帧中每帧的波形特征,得到所述声音特征的步骤,包括:将所述M帧中每帧的波形转化为T维向量,其中,T为大于等于1的正整数;将所述T维向量中每一维度向量拆分成语言因素,得到因素集合,其中,所述语言因素的因素类型包括下述至少之一:声母、韵母、音调;将所述因素集合中的语言因素转化为单词,得到所述声音特征。
[0015]根据本专利技术实施例的另一方面,还提供了一种语音对话装置,包括:获取单元,用于响应业务办理请求,获取客户发出的声音的声音特征;正向转码单元,用于在所述声音特征表征的声音类型属于目标语音类型集合的情况下,将所述客户发出的声音正向转码为普通话字符码,并将由所述普通话字符码形成的普通话音频输出至客服终端;逆向转码单元,用于接收所述客服终端传输的业务解答语音,并将所述业务解答语音逆向转码为符合所述声音类型的待播报音频;播放单元,用于将所述待播报音频播放给所述客户。
[0016]可选地,正向转码单元包括:第一确认模块,用于在判别所述声音特征表征的声音类型属于所述目标语音类型集合的情况下,确认进入语音对话模式,其中,所述语音对话模式用于为所述客户分配对应的对话解答客服。
[0017]可选地,正向转码单元还包括:第一判别模块,用于判别所述客户发出的声音属于
方言声音类型或指定民族声音类型;第一转码模块,用于在所述客户发出的声音属于方言声音类型的情况下,通过方言识别系统将所述客户发出的声音正向转码为所述普通话字符码;第二转码模块,用于在所述客户发出的声音属于指定民族声音类型的情况下,获取所述客户的籍贯和通话地址,并基于所述籍贯和所述通话地址确认所述客户的目标民族名称,并通过与所述目标民族名称对应的预设识别系统将所述客户发出的声音正向转码为所述普通话字符码。
[0018]可选地,第一转码模块包括:第一获取子模块,用于在所述客户发出的声音属于方言声音类型的情况下,获取所述客户的通话终端地址和通话号码;第一提取子模块,用于提取所述客户的注册信息表,其中,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音对话方法,其特征在于,包括:响应业务办理请求,获取客户发出的声音的声音特征;在所述声音特征表征的声音类型属于目标语音类型集合的情况下,将所述客户发出的声音正向转码为普通话字符码,并将由所述普通话字符码形成的普通话音频输出至客服终端;接收所述客服终端传输的业务解答语音,并将所述业务解答语音逆向转码为符合所述声音类型的待播报音频;将所述待播报音频播放给所述客户。2.根据权利要求1所述的方法,其特征在于,在判别所述声音特征表征的声音类型属于目标语音类型集合之后,还包括:在判别所述声音特征表征的声音类型属于所述目标语音类型集合的情况下,确认进入语音对话模式,其中,所述语音对话模式用于为所述客户分配对应的对话解答客服。3.根据权利要求1所述的方法,其特征在于,将所述客户发出的声音正向转码为普通话字符码的步骤,包括:判别所述客户发出的声音属于方言声音类型或指定民族声音类型;在所述客户发出的声音属于方言声音类型的情况下,通过方言识别系统将所述客户发出的声音正向转码为所述普通话字符码;在所述客户发出的声音属于指定民族声音类型的情况下,获取所述客户的籍贯和通话地址,并基于所述籍贯和所述通话地址确认所述客户的目标民族名称,并通过与所述目标民族名称对应的预设识别系统将所述客户发出的声音正向转码为所述普通话字符码。4.根据权利要求3所述的方法,其特征在于,在所述客户发出的声音属于方言声音类型的情况下,通过方言识别系统将所述客户发出的声音正向转码为普通话字符码的步骤,包括:在所述客户发出的声音属于方言声音类型的情况下,获取所述客户的通话终端地址和通话号码;提取所述客户的注册信息表,其中,所述注册信息表中至少包括:所述客户的常驻地址和籍贯;基于所述通话终端地址、所述通话号码和所述注册信息表,确认所述客户发出的声音所属的方言类别;通过所述方言识别系统调取与所述方言类别对应的字符集;基于所述字符集,采用预设进制算法将所述客户发出的声音转码为指定格式的方言字节码,得到字节码集合;将所述字节码集合中的N个方言字节码翻译为所述普通话字符码,其中,N为大于等于1的正整数。5.根据权利要求3所述的方法,其特征在于,通过与所述目标民族名称对应的预设识别系统将所述客户发出的声音正向转码为普通话字符码的步骤,包括:通过所述预设识别系统调取与所述目标民族名称对应的民族语言扩展表;基于所述民族语言扩展表,将所述客户发出的声音转码为指定格式的民族语言字节码,得到字节码集合;
将所述字节码集合中的民族语言字节码翻译为所述普通话字符码。6.根据权利要求3所述的方法,其特征在于,接收所述客服终端传输的业务...

【专利技术属性】
技术研发人员:杨晨刘亚军韩金涛唐新伟
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1