语音信号处理方法、装置和系统制造方法及图纸

技术编号:14565345 阅读:44 留言:0更新日期:2017-02-05 22:43
本申请提出一种语音信号处理方法、装置和系统,其中,该方法包括:根据预设的分割点将预设的信号调整区间分割为多段放大区间;以控制坐标的对角线为参考坐标,在所述对角线上方区域,根据预设的目标增益生成与所述多段放大区间对应的单调递增的动态范围控制曲线。通过本发明专利技术提供的语音信号处理方法、装置和系统,实现了对语音信号幅度的动态差异性控制,提高了语音信号识别率,以及语音系统识别的稳健性。

【技术实现步骤摘要】

本申请涉及语音识别处理
,尤其涉及一种语音信号处理方法、装置和系统
技术介绍
随着语音识别技术的发展,语音识别系统的应用领域越来越广,例如:车载语音识别系统、远场语音识别系统,语音输入法系统以及智能家居系统。由于麦克风距离说话人可近可远,近距离时录到的语音能量足够大,随着距离的增加,语音能量的衰减会造成语音识别器的识别率急剧下降。动态范围控制(DRC)是语音通信中一种必不可少的技术,即根据DRC曲线对输入信号进行增益处理。然而,目前的DRC曲线是一条固定曲线,限制了不同信号处理的差异性,影响后端语音识别系统的正常工作。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请的第一个目的在于提出一种语音信号处理方法,该方法实现了对语音信号幅度的动态差异性控制,提高了语音信号识别率,以及语音系统识别的稳健性。本申请的第二个目的在于提出一种语音信号处理装置。本申请的第三个目的在于提出一种语音信号处理系统。为达上述目的,本申请第一方面实施例提出了一种语音信号处理方法,包括:根据预设的分割点将预设的信号调整区间分割为多段放大区间;以控制坐标的对角线为参考坐标,在所述对角线上方区域,根据预设的目标增益生成与所述多段放大区间对应的单调递增的动态范围控制曲线。本申请实施例的语音信号处理方法,根据预设的分割点将预设的信号调整区间分割为多段放大区间;以控制坐标的对角线为参考坐标,在所述对角线上方区域,根据预设的目标增益生成与所述多段放大区间对应的单调递增的动态范围控制曲线。由此,实现了对语音信号幅度的动态差异性控制,提高了语音信号识别率,以及语音系统识别的稳健性。为达上述目的,本申请第二方面实施例提出了一种语音信号处理装置,包括:分割模块,用于根据预设的分割点将预设的信号调整区间分割为多段放大区间;处理模块,用于以控制坐标的对角线为参考坐标,在所述对角线上方区域,根据预设的目标增益生成与所述多段放大区间对应的单调递增的动态范围控制曲线。本申请实施例的语音信号处理装置,通过分割模块根据预设的分割点将预设的信号调整区间分割为多段放大区间;通过处理模块以控制坐标的对角线为参考坐标,在所述对角线上方区域,根据预设的目标增益生成与所述多段放大区间对应的单调递增的动态范围控制曲线。由此,实现了对语音信号幅度的动态差异性控制,提高了语音信号识别率,以及语音系统识别的稳健性。为达上述目的,本申请第三方面实施例提出了一种语音信号处理系统,包括:语音信号识别装置,以及如上所述的语音信号处理装置。本申请实施例的语音信号处理系统,根据预设的分割点将预设的信号调整区间分割为多段放大区间;以控制坐标的对角线为参考坐标,在所述对角线上方区域,根据预设的目标增益生成与所述多段放大区间对应的单调递增的动态范围控制曲线。由此,实现了对语音信号幅度的动态差异性控制,提高了语音信号识别率,以及语音系统识别的稳健性。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是本申请一个实施例的语音信号处理方法的流程图;图2为动态DRC曲线示意图;图3为输入信号经DRC处理前后对比示意图;图4是本申请另一个实施例的语音信号处理方法的流程图;图5为通过噪音水平跟踪预估的噪音信号门限动态调整示意图;图6为通过语音活动检测前后DRC处理效果的对比示意图;图7为通过噪声抑制处理前后DRC处理效果的对比示意图;图8是本申请另一个实施例的语音信号处理方法的流程图;图9是本申请另一个实施例的语音信号处理方法的流程图;图10为对输入信号的两遍级联DRC处理放大示意图;图11是本申请一个实施例的语音信号处理装置的结构示意图;图12是本申请另一个实施例的语音信号处理装置的结构示意图;图13是本申请另一个实施例的语音信号处理装置的结构示意图;图14是本申请另一个实施例的语音信号处理装置的结构示意图;图15是本申请一个实施例的语音信号处理系统的结构示意图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。下面参考附图描述本申请实施例的语音信号处理方法、装置和系统。图1是本申请一个实施例的语音信号处理方法的流程图。如图1所示,该语音信号处理方法包括:步骤101,根据预设的分割点将预设的信号调整区间分割为多段放大区间。由于目前的DRC是一条曲线固定,造成了门限值和放大区间固定,无法对不同的语音信号进行差异性的增益处理,例如:针对信号幅度很小和信号幅度很大的录音,一条限定的DRC曲线不能同时实现对两批数据的放大作用。因此,本实施例生成新的动态范围控制曲线进行语音信号的动态范围控制。首先,根据预设的分割点将预设的信号调整区间分割为多段放大区间。其中,预设的信号调整区间的两个端点分别为噪音信号门限和语音信号门限,其中,噪音信号门限小于语音信号门限。需要注意的是,分割后的多段放大区间的数量可以根据具体应用场景进行设置,例如:可以采用一个分割点将预设的信号调整区间分割为两段放大区间;或者,可以采用两个分割点将预设的信号调整区间分割为三段放大区间。步骤102,以控制坐标的对角线为参考坐标,在所述对角线上方区域,根据预设的目标增益生成与所述多段放大区间对应的单调递增的动态范围控制曲线。预先设置有目标增益,本领域技术人员可以理解的是,目标增益的表现形式有很多,可以根据应用需要进行选择,例如:放大区间的斜率,或者,放大区间中的多个坐标点。需要注意的是,由于预先分割的放大区间数量不同,因此,需要预先设置的放大区间的斜率数量,或者,放大区间中的多个坐标点也不同,以放大区间的斜率为例说明如下:如果预先采用一个分割点将预设的信号调整区间分割为两段放大区间,则需要预先设置至少一个放大区间的斜率;如果预先采用两个分割点将预设的信号调整区间分割为三段放大区间,则需要预先设置至少两个放大区间的斜率。以控制坐标的对角线为参考坐标,在对角线上方区域,根据预设的目标增益生成与预先分割的多段放大区间对应的单调递增的动态范围控制曲线。本领域技术人员可以理解的是,动态范围控制曲线的单调递增特性是指后一段放大区间对应的输出信号大于前一段放大区间对应的输出信号,其中处在后一段本文档来自技高网...

【技术保护点】
一种语音信号处理方法,其特征在于,包括以下步骤:根据预设的分割点将预设的信号调整区间分割为多段放大区间;以控制坐标的对角线为参考坐标,在所述对角线上方区域,根据预设的目标增益生成与所述多段放大区间对应的单调递增的动态范围控制曲线。

【技术特征摘要】
1.一种语音信号处理方法,其特征在于,包括以下步骤:
根据预设的分割点将预设的信号调整区间分割为多段放大区间;
以控制坐标的对角线为参考坐标,在所述对角线上方区域,根据预设的目标增益生成
与所述多段放大区间对应的单调递增的动态范围控制曲线。
2.如权利要求1所述的方法,其特征在于,还包括:
预估噪音信号门限;
根据所述噪音信号门限和预设的语音信号门限确定信号调整区间。
3.如权利要求2所述的方法,其特征在于,所述预估噪音信号门限包括:
通过噪音水平跟踪预估所述噪音信号门限。
4.如权利要求2所述的方法,其特征在于,所述预估噪音信号门限包括:
通过语音活动检测预估所述噪音信号门限。
5.如权利要求2所述的方法,其特征在于,所述预估噪音信号门限包括:
通过噪声抑制处理提高语音信号的信噪比,降低预估所述噪音信号门限值。
6.如权利要求1所述的方法,其特征在于,所述预设的目标增益包括:
放大区间的斜率、或者,放大区间中的多个坐标点。
7.如权利要求1-6任一所述的方法,其特征在于,还包括:
接收语音信号;
检测所述语音信号是否属于所述信号调整区间;
若所述语音信号属于所述信号调整区间,则根据所述动态范围控制曲线进行增益处理。
8.如权利要求7所述的方法,其特征在于,所述根据所述动态范围控制曲线进行增益
处理之后,还包括:
检测所述语音信号的输出信号是否达到预设的目标幅值;
若所述输出信号没有达到所述目标幅值,则根据所述动态范围控制曲线对所述输出信
号继续进行增益处理。
9.一种语音信号处理装置,其特征在于,包括:
分割模块,用于根据预设的分割点将预设的信号调整区间分割...

【专利技术属性】
技术研发人员:崔玮玮魏建强徐杨飞
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1