一种适用于语音信息的智能交互方法技术

技术编号:32460731 阅读:17 留言:0更新日期:2022-02-26 08:48
本发明专利技术提供了一种适用于语音信息的智能交互方法,属于语音处理技术领域。本发明专利技术包括利用移动智能终端采集语音信息,其次对语音信息进行增强处理,然后对增强处理后的语音信息通过利用双向长短时记忆神经网络搭建的语音识别模型进行识别,从而便于确定对应的业务服务模式,最终在确定好的业务服务模式下办理与业务对应的流程或服务。本发明专利技术通过对语音信息进行增强处理后再利用预先搭建好的语音识别模型对语音信息进行准确识别,提升了语音信息的辨识度,从而便于确定业务内容,方便了工作人员的理解。人员的理解。人员的理解。

【技术实现步骤摘要】
一种适用于语音信息的智能交互方法


[0001]本专利技术属于语音处理
,具体涉及一种适用于语音信息的智能交互方法。

技术介绍

[0002]通过对电力业务客户、电网内部业务人员有关供电所营销业务领域问题的对话进行语音识别,识别客户或业务人员的语音信息,并结合行业特点对声学模型、语言模型进行场景性优化训练,识别出客户、业务人员想要办理的业务内容,针对供电所营业厅现场环境复杂多样,业界通用语音识别模型识别结果易存在歧义的难点,结合供电所营销业务的语言特点,研究适用于供电所营销业务领域的语音识别关键技术,使识别准确性更满足供电所营销领域一线业务需求。
[0003]如授权公告号为CN209762479U的中国专利,其公开了一种智能客服语音交互方法及系统,包括以下步骤:利用热词进行语音唤醒设备,设备内部设置有用于控制的主程序和用于存储、检索与语义分析的云平台;接收用户语音指令;根据接收到的语音指令进入相关模式,相关模式包括自定义唤醒词模式、语言切换模式、业务服务模式、控制物联网设备模式以及第三方语音服务模式。
[0004]上述的这种语音交互方法具有语音交互方法的优点;但是上述的这种语音交互方法依旧存在着一些缺点,如:不方便对语音音质进行处理,难以提高语音的辨识度以及不方便工作人员理解等问题。

技术实现思路

[0005]有鉴于此,本专利技术旨在解决当前语音交互方法不方便对语音音质进行处理,难以提高语音的辨识度,不方便工作人员理解的问题。
[0006]为了解决上述技术问题,本专利技术提供以下技术方案:
[0007]本专利技术提供了一种适用于语音信息的智能交互方法,包括:
[0008]接收移动终端发送的语音信息,移动终端在检测到唤醒词时通过内部设置的麦克风采集语音信息;
[0009]对语音信息进行增强处理;
[0010]利用预先搭建好的语音识别模型对经过增强处理的语音信息进行辨识,切换到对应的业务服务模式,语音识别模型采用双向长短时记忆神经网络作为底层模型进行搭建;
[0011]在当前业务服务模式下确定业务内容,并根据业务内容办理对应的流程或服务。
[0012]进一步地,对语音信息进行增强处理具体包括:
[0013]对语音信息进行回波消除;
[0014]利用波束形成算法增强声源方向的语音信息;
[0015]采用混响消除方法抑制语音信息的混响;
[0016]通过后置滤波消除语音信息的残留噪声;
[0017]通过自动增益算法调节语音信息。
[0018]进一步地,移动终端通过内置的麦克风阵列采集语音信息,麦克风阵列采集语音信息具体为:
[0019]麦克风阵列中的每个麦克风通过矢量协方差矩阵获得被测环境中的混合音频信号的估计值。
[0020]进一步地,矢量协方差矩阵的公式具体为:
[0021][0022]式中,R
xx
表示被测环境中的混合音频信号的矢量协方差矩阵估计值,X(m)表示第m个麦克风采集到的混合音频矩阵,X
H
(m)表示第m个麦克风采集到的混合音频矩阵的转置矩阵。
[0023]进一步地,波束形成算法具体包括:LMS算法和DMI算法。
[0024]进一步地,LMS算法的公式具体为:
[0025]W(n+1)=W(n)+2μe(n)X(n)
[0026]其中,e(n)为期望输出与滤波器实际输出之间的误差,X(n)为输出信号,μ为步长,W为初始加权矢量。
[0027]进一步地,DMI算法的公式具体为:
[0028][0029][0030]式中,是向量X(k)自相关矩阵的估计,是向量X(k)和期望信号估计的互相关向量的估计,N1和N2分别为观察时间的上限和下限。
[0031]进一步地,移动终端具体为:智能手机、笔记本电脑或者平板电脑中的一种。
[0032]综上,本专利技术提供了一种适用于语音信息的智能交互方法,包括利用移动智能终端采集语音信息,其次对语音信息进行增强处理,然后对增强处理后的语音信息通过利用双向长短时记忆神经网络搭建的语音识别模型进行识别,从而便于确定对应的业务服务模式,最终在确定好的业务服务模式下办理与业务对应的流程或服务。本专利技术通过对语音信息进行增强处理后再利用预先搭建好的语音识别模型对语音信息进行准确识别,提升了语音信息的辨识度,从而便于确定业务内容,方便了工作人员的理解。
附图说明
[0033]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
[0034]图1为本专利技术实施例提供的一种适用于语音信息的智能交互方法的流程示意图。
具体实施方式
[0035]为使得本专利技术的目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本专利技术一部分实施例,而非全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0036]通过对电力业务客户、电网内部业务人员有关供电所营销业务领域问题的对话进行语音识别,识别客户或业务人员的语音信息,并结合行业特点对声学模型、语言模型进行场景性优化训练,识别出客户、业务人员想要办理的业务内容,针对供电所营业厅现场环境复杂多样,业界通用语音识别模型识别结果易存在歧义的难点,结合供电所营销业务的语言特点,研究适用于供电所营销业务领域的语音识别关键技术,使识别准确性更满足供电所营销领域一线业务需求。
[0037]如授权公告号为CN209762479U的中国专利,其公开了一种智能客服语音交互方法及系统,包括以下步骤:利用热词进行语音唤醒设备,设备内部设置有用于控制的主程序和用于存储、检索与语义分析的云平台;接收用户语音指令;根据接收到的语音指令进入相关模式,相关模式包括自定义唤醒词模式、语言切换模式、业务服务模式、控制物联网设备模式以及第三方语音服务模式。
[0038]上述的这种语音交互方法具有语音交互方法的优点;但是上述的这种语音交互方法依旧存在着一些缺点,如:不方便对语音音质进行处理,难以提高语音的辨识度以及不方便工作人员理解等问题。
[0039]基于此,本专利技术提供了一种适用于语音信息的智能交互方法,用于解决当前的语音交互方法不方便对语音音质进行处理,难以提高语音的辨识度以及不方便工作人员理解等问题。
[0040]以下是对本专利技术的一种适用于语音信息的智能交互方法的实施例进行的详细介绍。
[0041]请参阅图1,本实施例提供一种适用于语音信息的智能交互方法,包括:
[0042]S101:接收移动终端发送的语音信息,移动终端在检测到唤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种适用于语音信息的智能交互方法,其特征在于,包括:接收移动终端发送的语音信息,所述移动终端在检测到唤醒词时通过内部设置的麦克风采集所述语音信息;对所述语音信息进行增强处理;利用预先搭建好的语音识别模型对经过增强处理的所述语音信息进行辨识,切换到对应的业务服务模式,所述语音识别模型采用双向长短时记忆神经网络作为底层模型进行搭建;在当前业务服务模式下确定业务内容,并根据所述业务内容办理对应的流程或服务。2.根据权利要求1所述的适用于语音信息的智能交互方法,其特征在于,所述对所述语音信息进行增强处理具体包括:对所述语音信息进行回波消除;利用波束形成算法增强声源方向的语音信息;采用混响消除方法抑制所述语音信息的混响;通过后置滤波消除所述语音信息的残留噪声;通过自动增益算法调节所述语音信息。3.根据权利要求1所述的适用于语音信息的智能交互方法,其特征在于,所述移动终端通过内置的麦克风阵列采集所述语音信息,所述麦克风阵列采集所述语音信息具体为:所述麦克风阵列中的每个麦克风通过矢量协方差矩阵获得被测环境中的混合音频信号的估计值。4.根据权利要求3所述的适用于语音信息的智能交互方法,其特征在于...

【专利技术属性】
技术研发人员:黄达文关飞张茵翠黄敏清陈冠胜黎康萍吴浩珊邱俊豪梁柱陈诒钊
申请(专利权)人:广东电网有限责任公司肇庆供电局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1