一种语音处理方法及装置制造方法及图纸

技术编号:18499383 阅读:27 留言:0更新日期:2018-07-21 21:17
本发明专利技术实施例公开了一种语音处理方法,所述方法包括:获得待处理语音信号;基于所述待处理语音信号,获取用于表征用户语音信号的特性参数;通过由所述特性参数生成的用于去噪的滤波函数,对所述待处理语音信号进行处理,获得去噪后的语音信号。本发明专利技术实施例同时公开了一种语音处理装置。

A method and device for speech processing

An embodiment of the invention discloses a speech processing method, which includes: obtaining a speech signal to be processed; obtaining a characteristic parameter for representing a user voice signal based on the speech signal to be processed; a speech signal to be processed by the number of filter functions used for denoising by the characteristic parameters. Processing, the speech signal after noise removal is obtained. The embodiment of the invention discloses a voice processing device at the same time.

【技术实现步骤摘要】
一种语音处理方法及装置
本专利技术涉及语音识别领域,尤其涉及一种语音处理方法及装置。
技术介绍
智能语音交互是基于语音输入的新一代交互模式,通过说话就可以得到反馈结果。衡量语音交互的最重要的一个性能指标,就是语音识别的准确率。在现有技术中,移动终端会直接将所获得的用户语音信号送入语音识别模块进行识别,但是,由于移动终端所获得的用户语音信号的质量往往比较差,如果直接对该用户语音信号进行语音识别,容易出现识别不准确,甚至识别失败的问题。所以,现有技术中存在语音信号的质量较差所导致的语音识别准确率较低的技术问题。
技术实现思路
有鉴于此,本专利技术实施例期望提供一种语音处理方法及装置,以在语音识别过程中,实现改善语音信号的质量,提高语音识别准确率,提供良好的用户体验。为达到上述目的,本专利技术的技术方案是这样实现的:第一方面,本专利技术实施例提供一种语音处理方法,包括:获得待处理语音信号;基于所述待处理语音信号,获取用于表征用户语音信号的特性参数;通过由所述特性参数生成的用于去噪的滤波函数,对所述待处理语音信号进行处理,获得去噪后的语音信号。第二方面,本专利技术实施例提供一种语音处理装置,包括:获得模块、获取模块以及处理模块,其中,所述获得模块,用于获得待处理语音信号;所述获取模块,用于基于所述待处理语音信号,获取用于表征用户语音信号的特性参数;所述处理模块,用于通过由所述特性参数生成的用于去噪的滤波函数,对所述待处理语音信号进行处理,获得去噪后的语音信号。本专利技术实施例提供了一种语音处理方法及装置,在获得待处理语音信号之后,会基于待处理语音信号,获取用于表征用户语音信号的特性参数,然后通过由特性参数生成的用于去噪的滤波函数,对待处理语音信号进行处理,获得去噪后的语音信号。这样,通过本专利技术实施例提供的语音处理方法,就可以过滤掉语音信号中的噪声信号,改善语音信号的质量。从而,可以实现提高语音识别的准确率,进而提供了良好的用户体验。附图说明图1为本专利技术实施例一中的语音处理方法的流程示意图;图2为本专利技术实施例二中的语音处理方法应用于语音识别过程的方法流程示意图;图3为本专利技术实施例三中的语音处理装置的一种结构示意图;图4为本专利技术实施例三中的语音处理装置的另一种结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。实施例一本实施例提供一种语音处理方法,在实际应用中,该方法可以应用于终端语音业务应用中的各种需要语音处理的场合,如移动终端中的语音助手类产品、社交类产品、智能家居类产品等。示例性地,用户可以通过语音助手软件来使用语音控制终端进行各种操作,如播放音乐、拨打电话等,用户也可以在社交软件中将语音转化为文本文字,用户还可以通过智能家居软件使用语音转换家居用品的功能,如打开照明用品、关闭音响设备等,当然,还可以有其他的应用场景,这里,本专利技术实施例不做具体限定。那么,图1为本专利技术实施例一中的语音处理方法的流程示意图,参见图1所示,该语音处理方法包括:S101:获得待处理语音信号;具体地,当用户在使用移动终端上的语音业务应用时,移动终端会通过音频设备或录音设备,如麦克风等,来获取用户的语音内容,生成待处理语音信号。这样,就获得了待处理语音信号。这里,待处理语音信号可能是用户语音信号与各种噪声信号叠加形成的混合语音信号,也可能是不含有噪声的用户语音信号。S102:基于待处理语音信号,获取用于表征用户语音信号的特性参数;这里,该特性参数为用户语音信号所独有的物理特性,能够使得待处理语音信号中用户语音信号可以区别于干扰噪声信号,可以用来生成用于去噪的滤波函数。那么,为了过滤待处理语音信号中的噪声,移动终端可以在获得了待处理语音信号后,获取能够表征用户语音信号的特性参数,以便进一步地对待处理语音信号进行滤波处理,获得最终所需的去噪后的语音信号。在具体实施过程中,S102可以包括:按照预设策略对待处理语音信号进行预处理,获得处理后的语音信号;对处理后的语音信号进行时域到频域的转换,获得处理后的语音信号对应的频域信号;计算频域信号的中心频率。具体地,为了获取表征用户语音信号的特性参数,移动终端在获得了待处理语音信号后,就可以先按照预设策略对该待处理语音信号进行预处理,获得了处理后的语音信号。然后,移动终端可以采用时频域转换方法,来将处理后的语音信号从时域转换到频域,从而,获得该处理后的语音信号对应的频域信号,最后,可以计算该频域信号的中心频率,进而,使用中心频率作为特性参数。这里,中心频率是使得待处理语音信号中的真实的用户语音信号有别于待处理语音信号中的噪声信号的一个特性参数,可以用来生成滤波函数。当然,本领域技术人员在具体实施时,还可以使用其他频域特征作为特性参数,这里,本专利技术实施例不做具体限定。需要说明的是,将语音信号从时域转换频域的方法,可以由本领域技术人员在具体实施时,根据语音信号的不同类型来进行选取,这里,本专利技术实施例不做具体限定。示例性地,当语音信号为非周期性连续信号时,可以采用傅里叶变换(FourierTransform)的方法;当语音信号为非周期性离散信号时,可以采用离散时域傅里叶变换(DiscreteTimeFourierTransform)的方法;当语音信号为周期性离散信号时,可以采用离散傅里叶变换(DiscreteFourierTransform)的方法等。在实际应用中,由于移动终端在获取待处理语音信号时,用户的发声器(通常为嘴巴)往往与音频设备或者录音设备相距较近,从而,待处理语音信号中包含的真实的用户语音信号的幅度就会大于待处理语音信号中包含的各种噪声形成的干扰信号的幅度。也就是说,待处理语音信号中的高幅语音信号中包含着真实的用户语音信号所特有的特性参数。这样,为了获取用户真实的语音,可以先提取待处理语音信息号中的高幅部分,然后基于高幅部分来获取用户语音信号的特性参数,以便去除待处理语音信号中夹杂的噪声。这样,上述预设策略可以为设置预设幅度门限值的方式来对待处理语音信号进行预处理,提取待处理语音信号中的高幅部分,当然,上述预设策略还可以通过其他方式,如采用信号处理算法提取高幅部分,这里,本专利技术实施例不做具体限定。那么,在具体实施过程中,按照预设策略对待处理语音信号进行预处理,获得处理后的语音信号,就可以包括:获取待处理语音信号的幅度;将待处理语音信号的幅度与预设幅度门限值进行比较,获取待处理语音信号中幅度大于预设幅度门限值的高幅信号。具体地,预设幅度门限值可以是按照一定的策略计算获得,也可以是根据经验进行选取,当然,还可以是通过其他方式来确定。由本领域技术人员在具体实施时根据实际情况来确定,本专利技术实施例不做具体限定。示例性地,移动终端可以先通过检测待处理语音信号的幅度包络的方法,来获得待处理语音信号的幅度;然后可以选取一定时间间隔内的待处理语音信号来计算幅度的均值,并将该均值作为预设幅度门限值;最后,将待处理语音信号的幅度与此预设幅度门限值进行比较,根据比较结果,过滤掉待处理语音信号中幅度不大于该预设幅度门限值的那部分低幅语音信号,获取待处理语音信号中幅度大于预设幅度门限值的那部分高幅语音信号。这样,移动终端就可以获得高幅信号。在本专利技术的另一实施例中,为了有效利用系统资本文档来自技高网...

【技术保护点】
1.一种语音处理方法,其特征在于,所述方法包括:获得待处理语音信号;基于所述待处理语音信号,获取用于表征用户语音信号的特性参数;通过由所述特性参数生成的用于去噪的滤波函数,对所述待处理语音信号进行处理,获得去噪后的语音信号。

【技术特征摘要】
1.一种语音处理方法,其特征在于,所述方法包括:获得待处理语音信号;基于所述待处理语音信号,获取用于表征用户语音信号的特性参数;通过由所述特性参数生成的用于去噪的滤波函数,对所述待处理语音信号进行处理,获得去噪后的语音信号。2.根据权利要求1所述的方法,其特征在于,所述基于所述待处理语音信号,获取用于表征用户语音信号的特性参数,包括:按照预设策略对所述待处理语音信号进行预处理,获得处理后的语音信号;对所述处理后的语音信号进行时域到频域的转换,获得所述处理后的语音信号对应的频域信号;计算所述频域信号的中心频率。3.根据权利要求2所述的方法,其特征在于,所述按照预设策略对所述待处理语音信号进行预处理,获得处理后的语音信号,包括:获取所述待处理语音信号的幅度;将所述待处理语音信号的幅度与预设幅度门限值进行比较,获取所述待处理语音信号中幅度大于所述预设幅度门限值的高幅信号。4.根据权利要求3所述的方法,其特征在于,所述获取所述待处理语音信号的幅度,包括:检测所述待处理语音信号的幅度包络,获得所述待处理语音信号的幅度。5.根据权利要求2所述的方法,其特征在于,所述通过由所述特性参数生成的用于去噪的滤波函数,对所述待处理语音信号进行处理,获得去噪后的语音信号,包括:根据所述中心频率生成带通滤波函数;通过所述带通滤波函数对所述待处理语音信号进行滤波,获得去噪后的语音信号。6.根据权利要求1所述的方法,其特征在于,所述基于所述待处理语音信号,获取用于表征用户语音信号的特性参数,包括:确定所述待处理语音信号的信噪比是否小于预设阈...

【专利技术属性】
技术研发人员:李向阳陈健谢志华
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1