语音信号处理方法、装置和系统制造方法及图纸

技术编号：14565345 阅读：44 留言：0更新日期：2017-02-05 22:43

本申请提出一种语音信号处理方法、装置和系统，其中，该方法包括：根据预设的分割点将预设的信号调整区间分割为多段放大区间；以控制坐标的对角线为参考坐标，在所述对角线上方区域，根据预设的目标增益生成与所述多段放大区间对应的单调递增的动态范围控制曲线。通过本发明专利技术提供的语音信号处理方法、装置和系统，实现了对语音信号幅度的动态差异性控制，提高了语音信号识别率，以及语音系统识别的稳健性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及语音识别处理
，尤其涉及一种语音信号处理方法、装置和系统。
技术介绍
随着语音识别技术的发展，语音识别系统的应用领域越来越广，例如：车载语音识别系统、远场语音识别系统，语音输入法系统以及智能家居系统。由于麦克风距离说话人可近可远，近距离时录到的语音能量足够大，随着距离的增加，语音能量的衰减会造成语音识别器的识别率急剧下降。动态范围控制(DRC)是语音通信中一种必不可少的技术，即根据DRC曲线对输入信号进行增益处理。然而，目前的DRC曲线是一条固定曲线，限制了不同信号处理的差异性，影响后端语音识别系统的正常工作。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本申请的第一个目的在于提出一种语音信号处理方法，该方法实现了对语音信号幅度的动态差异性控制，提高了语音信号识别率，以及语音系统识别的稳健性。本申请的第二个目的在于提出一种语音信号处理装置。本申请的第三个目的在于提出一种语音信号处理系统。为达上述目的，本申请第一方面实施例提出了一种语音信号处理方法，包括：根据预设的分割点将预设的信号调整区间分割为多段放大区间；以控制坐标的对角线为参考坐标，在所述对角线上方区域，根据预设的目标增益生成与所述多段放大区间对应的单调递增的动态范围控制曲线。本申请实施例的语音信号处理方法，根据预设的分割点将预设的信号调整区间分割为多段放大区间；以控制坐标的对角线为参考坐标...

【技术保护点】
一种语音信号处理方法，其特征在于，包括以下步骤：根据预设的分割点将预设的信号调整区间分割为多段放大区间；以控制坐标的对角线为参考坐标，在所述对角线上方区域，根据预设的目标增益生成与所述多段放大区间对应的单调递增的动态范围控制曲线。

【技术特征摘要】
1.一种语音信号处理方法，其特征在于，包括以下步骤：
根据预设的分割点将预设的信号调整区间分割为多段放大区间；
以控制坐标的对角线为参考坐标，在所述对角线上方区域，根据预设的目标增益生成
与所述多段放大区间对应的单调递增的动态范围控制曲线。
2.如权利要求1所述的方法，其特征在于，还包括：
预估噪音信号门限；
根据所述噪音信号门限和预设的语音信号门限确定信号调整区间。
3.如权利要求2所述的方法，其特征在于，所述预估噪音信号门限包括：
通过噪音水平跟踪预估所述噪音信号门限。
4.如权利要求2所述的方法，其特征在于，所述预估噪音信号门限包括：
通过语音活动检测预估所述噪音信号门限。
5.如权利要求2所述的方法，其特征在于，所述预估噪音信号门限包括：
通过噪声抑制处理提高语音信号的信噪比，降低预估所述噪音信号门限值。
6.如权利要求1所述的方法，其特征在于，所述预设的目标增益包括：
放大区间的斜率、或者，放大区间中的多个坐标点。
7.如权利要求1-6任一所述的方法，其特征在于，还包括：
接收语音信号；
检测所述语音信号是否属于所述信号调整区间；
若所述语音信号属于所述信号调整区间，则根据所述动态范围控制曲线进行增益处理。
8.如权利要求7所述的方法，其特征在于，所述根据所述动态范围控制曲线进行增益
处理之后，还包括：
检测所述语音信号的输出信号是否达到预设的目标幅值；
若所述输出信号没有达到所述目标幅值，则根据所述动态范围控制曲线对所述输出信
号继续进行增益处理。
9.一种语音信号处理装置，其特征在于，包括：
分割模块，用于根据预设的分割点将预设的信号调整区间分割...

【专利技术属性】
技术研发人员：崔玮玮，魏建强，徐杨飞，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人