语音交互方法、装置和计算机设备制造方法及图纸

技术编号:28323468 阅读:16 留言:0更新日期:2021-05-04 13:04
本申请涉及人工智能领域,揭示了语音交互方法,包括:获取当前用户对应的地域信息;获取当前时刻各地域模型分别对应的模型参量;根据所述地域信息和各地域模型分别对应的模型参量,轮询计算各所述地域模型分别对应的匹配概率;根据所述匹配概率匹配与所述当前用户对应的指定地域模型;将所述当前用户的语音语句输入所述指定地域模型;将所述指定地域模型输出的交互反馈,反馈至所述当前用户。通过用户不同地域的特征区分用户语音数据,分别训练语音深度学习模型,提高语音识别的准确率,支持使用用户熟悉的语言或方言进行语音交互,使沟通更为顺畅,增加用户亲切感,提高用户使用粘性。

【技术实现步骤摘要】
语音交互方法、装置和计算机设备
本申请涉及人工智能领域,特别是涉及到语音交互方法、装置和计算机设备。
技术介绍
目前客服语音对接的AI语音系统的深度学习模型,大多没有根据用户地域进行区分对待,包括用户语音识别和用户语音回答,均未区分地域特征。不同地域具有不同的语音特征,如果不能根据用户所处的不同地域进行用户区分,可能导致某些具有方言特征的语音识别的精准率较低,在方言特征浓郁的地区则不利于语音交互。
技术实现思路
本申请的主要目的为提供语音交互方法,旨在解决现有语音交互不能根据用户所处的不同地域进行用户区分的技术问题。本申请提出一种语音交互方法,包括:获取当前用户对应的地域信息;获取当前时刻各地域模型分别对应的模型参量;根据所述地域信息和各地域模型分别对应的模型参量,轮询计算各所述地域模型分别对应的匹配概率;根据所述匹配概率匹配与所述当前用户对应的指定地域模型;将所述当前用户的语音语句输入所述指定地域模型;将所述指定地域模型输出的交互反馈,反馈至所述当前用户。优选地,所述获取当前时刻各地域模型分别对应的模型参量的步骤,包括:获取指定时间段内第一地域模型的多组模型参量,其中,所述第一地域模型为所有地域模型中的任一个;将多组模型参量通过似然函数求解,得到所述第一地域模型当前对应的指定模型参量;根据所述第一地域模型当前对应的指定模型参量的计算方式,计算各地域模型分别对应的模型参量。优选地,所述根据所述地域信息和各地域模型分别对应的模型参量,轮询计算各所述地域模型分别对应的匹配概率的步骤,包括:将所述第一模型当前对应的指定模型参量和所述地域信息,输入第一计算公式,其中,所述第一计算公式为w和b表示所述指定模型参量,X表示所述地域信息,T表示转置,y表示计算结果;获取所述第一计算公式的计算结果;将所述计算结果作为所述第一模型当前对应的匹配概率;根据所述第一模型当前对应的匹配概率的计算方式,轮询计算各所述地域模型分别对应的匹配概率。优选地,所述根据所述匹配概率匹配与所述当前用户对应的指定地域模型的步骤,包括:各所述地域模型分别对应的匹配概率,由大到小形成降序排序;确定所述降序排序中最大的匹配概率对应的第二地域模型;将所述第二地域模型作为与所述当前用户匹配的指定地域模型。优选地,所述指定地域模型包括高斯混合模型,将所述当前用户的语音语句输入所述指定地域模型的步骤,包括:对所述当前用户的语音语句提取音频数据;将所述音频数据通过所述高斯混合模型进行数据处理,得到所述音频数据对应的预测概率;根据所述预测概率确定所述音频数据中的关键词;根据所述关键词确定与所述当前用户的语音语句对应的反馈信息。优选地,所述对所述当前用户的语音语句提取音频数据的步骤,包括:将所述当前用户的语音语句预处理后进行傅里叶变换,得到音频帧数据;将所述音频帧数据经过滤波器过滤,得到各音频分别对应的频率数据;将各音频分别对应的频率数据,经过离散余弦变换得到各音频分别对应的音频特征;将各音频分别对应的音频特征,按照各音频在所述语音语句中的排布次序,组成所述当前用户的语音语句的音频数据。优选地,所述指定地域模型包括高斯混合模型,所述高斯混合模型包括多个高斯分布函数,将所述当前用户的语音语句输入所述指定地域模型的步骤之前,包括:根据完全数据的联合概率分布,得到所述完全数据对应的似然函数;对所述完全数据对应的似然函数取对数,得到对数式;根据所述对数式计算隐变量属于所述指定高斯分布函数的后验概率,其中,所述指定高斯分布函数属于所述高斯混合模型中的任意一高斯分布函数;根据所述指定高斯分布函数的后验概率以及所述对数式,得到所述隐变量的期望值函数;求导所述期望值函数,得到所述指定高斯分布函数的参量;根据所述指定高斯分布函数的参量的确定过程,确定所述高斯混合模型中所有高斯分布函数分别对应的参量。本申请还提供了一种语音交互装置,包括:第一获取模块,用于获取当前用户对应的地域信息;第二获取模块,用于获取当前时刻各地域模型分别对应的模型参量;第一计算模块,用于根据所述地域信息和各地域模型分别对应的模型参量,轮询计算各所述地域模型分别对应的匹配概率;匹配模块,用于根据所述匹配概率匹配与所述当前用户对应的指定地域模型;输入模块,用于将所述当前用户的语音语句输入所述指定地域模型;反馈模块,用于将所述指定地域模型输出的交互反馈,反馈至所述当前用户。本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。本申请通过用户不同地域的特征区分用户语音数据,分别训练语音深度学习模型,提高语音识别的准确率,支持使用用户熟悉的语言或方言进行语音交互,使沟通更为顺畅,增加用户亲切感,提高用户使用粘性。附图说明图1本申请一实施例的语音交互方法流程示意图;图2本申请一实施例的语音交互系统流程示意图;图3本申请一实施例的计算机设备内部结构示意图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。参照图1,本申请一实施例的语音交互方法,包括:S1:获取当前用户对应的地域信息;S2:获取当前时刻各地域模型分别对应的模型参量;S3:根据所述地域信息和各地域模型分别对应的模型参量,轮询计算各所述地域模型分别对应的匹配概率;S4:根据所述匹配概率匹配与所述当前用户对应的指定地域模型;S5:将所述当前用户的语音语句输入所述指定地域模型;S6:将所述指定地域模型输出的交互反馈,反馈至所述当前用户。本申请实施例中,上述地域信息包括但不限于用户手机号归属地、座机号码归属地、用户身份证号码所属地等信息。通过对用户语音信息数据进行地域打标操作,然后根据不同的地域打标数据分别训练AI语音深度学习模型得到各地域模型。然后将训练好的各地域模型组成语音识别系统,根据当前用户不同的地域特征,针对性的启动与当前地域特征匹配的地域模型进行语音识别。上述各地域模型中嵌入普通话与当地方言用语的字典匹配模型和匹配算法,实现普通话和当地方言用语的灵活转化,可支持机器和用户之间通过方言进行交互,提升了地域使用特性。本申请通过用户不同地域的特征区分用户语音数据,分别训练语音深度学习模型,提高语音识别的准确率,支持使用用户熟悉的语言或方言进行语音交互,使沟通更为顺畅,增本文档来自技高网...

【技术保护点】
1.一种语音交互方法,其特征在于,包括:/n获取当前用户对应的地域信息;/n获取当前时刻各地域模型分别对应的模型参量;/n根据所述地域信息和各地域模型分别对应的模型参量,轮询计算各所述地域模型分别对应的匹配概率;/n根据所述匹配概率匹配与所述当前用户对应的指定地域模型;/n将所述当前用户的语音语句输入所述指定地域模型;/n将所述指定地域模型输出的交互反馈,反馈至所述当前用户。/n

【技术特征摘要】
1.一种语音交互方法,其特征在于,包括:
获取当前用户对应的地域信息;
获取当前时刻各地域模型分别对应的模型参量;
根据所述地域信息和各地域模型分别对应的模型参量,轮询计算各所述地域模型分别对应的匹配概率;
根据所述匹配概率匹配与所述当前用户对应的指定地域模型;
将所述当前用户的语音语句输入所述指定地域模型;
将所述指定地域模型输出的交互反馈,反馈至所述当前用户。


2.根据权利要求1所述的语音交互方法,其特征在于,所述获取当前时刻各地域模型分别对应的模型参量的步骤,包括:
获取指定时间段内第一地域模型的多组模型参量,其中,所述第一地域模型为所有地域模型中的任一个;
将多组模型参量通过似然函数求解,得到所述第一地域模型当前对应的指定模型参量;
根据所述第一地域模型当前对应的指定模型参量的计算方式,计算各地域模型分别对应的模型参量。


3.根据权利要求1所述的语音交互方法,其特征在于,所述根据所述地域信息和各地域模型分别对应的模型参量,轮询计算各所述地域模型分别对应的匹配概率的步骤,包括:
将所述第一模型当前对应的指定模型参量和所述地域信息,输入第一计算公式,其中,所述第一计算公式为w和b表示所述指定模型参量,X表示所述地域信息,T表示转置,y表示计算结果;
获取所述第一计算公式的计算结果;
将所述计算结果作为所述第一模型当前对应的匹配概率;
根据所述第一模型当前对应的匹配概率的计算方式,轮询计算各所述地域模型分别对应的匹配概率。


4.根据权利要求1所述的语音交互方法,其特征在于,所述根据所述匹配概率匹配与所述当前用户对应的指定地域模型的步骤,包括:
各所述地域模型分别对应的匹配概率,由大到小形成降序排序;
确定所述降序排序中最大的匹配概率对应的第二地域模型;
将所述第二地域模型作为与所述当前用户匹配的指定地域模型。


5.根据权利要求1所述的语音交互方法,其特征在于,所述指定地域模型包括高斯混合模型,将所述当前用户的语音语句输入所述指定地域模型的步骤,包括:
对所述当前用户的语音语句提取音频数据;
将所述音频数据通过所述高斯混合模型进行数据处理,得到所述音频数据对应的预测概率;
根据所述预测概率确定所述音频数据中的关键词;
根据所述关键词确定与...

【专利技术属性】
技术研发人员:姚宏志
申请(专利权)人:平安普惠企业管理有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1