音频信号中背景噪声的估计制造技术

技术编号：15187924 阅读：102 留言：0更新日期：2017-04-19 11:43

本发明专利技术涉及用于估计音频信号中的背景噪声的背景噪声估计器及其中的方法。所述方法包括基于以下各项获得与音频信号段(例如帧或帧的一部分)相关联的至少一个参数：第一线性预测增益，被计算为：针对所述音频信号段，来自0阶线性预测的残余信号与来自2阶线性预测的残余信号之间的商；以及，第二线性预测增益，被计算为：针对所述音频信号段，来自2阶线性预测的残余信号与来自16阶线性预测的残余信号之间的商。该方法还包括：至少基于所获得的至少一个参数，确定音频信号段是否包括停顿；以及，当所述音频信号段包括停顿时，基于所述音频信号段更新背景噪声估计。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术的实施例涉及音频信号处理，并具体涉及背景噪声的估计，例如以支持声音活跃性判断。
技术介绍
在利用不连续传输(DTX)的通信系统中，找到效率和不降低质量之间的平衡是重要的。在这种系统中，活跃性检测器用于指示要被主动编码的活跃信号(例如语音或音乐)以及具有背景信号的段，可由在接收机侧产生的舒适噪声来替换该具有背景信号的段。如果活跃性检测器在检测不活跃中过于有效，则它将在活跃信号中引入削波，然后当被削波的活跃段被舒适噪声替换时，该活跃信号被感知为主观质量劣化。同时，如果活跃性检测器不够有效并将背景噪声段分类为活跃的，且然后主动对背景噪声进行编码，而不是进入具有舒适噪声的DTX模式，则DTX的效率降低。在多数情况下，削波问题被视为更严重。图1示出了广义声音活跃性检测器(SAD)或话音活跃性检测器(VAD)的概述框图，其将音频信号作为输入并产生活跃判断来作为输出。将输入信号划分为数据帧，即例如5-30ms(取决于实现)的音频信号段，并且针对每帧产生一个活跃性判断来作为输出。由图1中示出的主检测器做出主判断“prim”。主判断基本上只是当前帧的特征与根据先前输入帧估计的背景特征的比较。当前帧的特征与背景特征之间大于阈值的差导致活跃主判断。延迟(hangover)加法块用于基于过去的主判断扩展主判断以形成最终判断：“标志”。使用延迟的原因主要是为了减小/去除在活跃突发的中间和后端削波的风险。如图所示，操作控制器可以根据输入信号的特性调整主检测器的阈值和延迟加法的长度。使用背景估计器块来估计输入信号中的背景噪声。在本文中，背景噪声还可以被称为“背景”或者“背景...
音频信号中背景噪声的估计

【技术保护点】
一种用于背景噪声估计器的方法，用于估计音频信号中的背景噪声，其中，所述音频信号包括多个音频信号段，所述方法包括：‑基于以下各项获得(201)与一个音频信号段相关联的至少一个参数：‑第一线性预测增益，被计算为：针对所述音频信号段，来自0阶线性预测的残余信号(E(0))与来自2阶线性预测的残余信号(E(2))之间的商；以及‑第二线性预测增益，被计算为：针对所述音频信号段，来自2阶线性预测的残余信号(E(2))与来自16阶线性预测的残余信号(E(16))之间的商；‑至少基于所获得的至少一个参数，确定(202)所述音频信号段是否包括停顿，即没有诸如语音和音乐的活跃内容；以及：当所述音频信号段包括停顿时：‑基于所述音频信号段更新(203)背景噪声估计。

【技术特征摘要】
【国外来华专利技术】2014.07.29 US 62/030,1211.一种用于背景噪声估计器的方法，用于估计音频信号中的背景噪声，其中，所述音频信号包括多个音频信号段，所述方法包括：-基于以下各项获得(201)与一个音频信号段相关联的至少一个参数：-第一线性预测增益，被计算为：针对所述音频信号段，来自0阶线性预测的残余信号(E(0))与来自2阶线性预测的残余信号(E(2))之间的商；以及-第二线性预测增益，被计算为：针对所述音频信号段，来自2阶线性预测的残余信号(E(2))与来自16阶线性预测的残余信号(E(16))之间的商；-至少基于所获得的至少一个参数，确定(202)所述音频信号段是否包括停顿，即没有诸如语音和音乐的活跃内容；以及：当所述音频信号段包括停顿时：-基于所述音频信号段更新(203)背景噪声估计。2.根据权利要求1所述的方法，其中，获得所述至少一个参数包括：-将所述第一线性预测增益和所述第二线性预测增益限制为在预定义区间内取值。3.根据权利要求1-2中任一项所述的方法，其中，获得所述至少一个参数包括：-例如通过低通滤波的方式创建所述第一线性预测增益和所述第二线性预测增益中的每一个的至少一个长期估计，其中，所述长期估计还基于与至少一个在先音频信号段相关联的对应线性预测增益。4.根据权利要求1-3中任一项所述的方法，其中，获得所述至少一个参数包括：-确定与所述音频信号段相关联的线性预测增益之一与所述线性预测增益的长期估计之间的差和/或与线性预测增益相关联的两个不同长期估计之间的差。5.根据前述权利要求中任一项所述的方法，其中，获得所述至少一个参数包括对所述第一线性预测增益和所述第二线性预测增益进行低通滤波。6.根据权利要求5所述的方法，其中，至少一个低通滤波器的滤波系数取决于以下二者之间的关系：与所述音频信号段相关联的线性预测增益，以及基于多个在先音频信号段获得的对应线性预测增益的平均值。7.根据前述权利要求中任一项所述的方法，其中，确定所述音频信号段是否包括停顿还基于：与所述音频信号段相关联的谱接近度测量。8.根据权利要求7所述的方法，还包括：基于针对所述音频信号段的频带集合和与所述频带集合相对应的背景噪声估计的能量来获得所述谱接近度测量。9.根据权利要求8所述的方法，其中，在初始化周期期间，使用初始值Emin作为基于其来获得所述谱接近度测量的所述背景噪声估计。10.一种背景噪声估计器(1100)，用于估计包括多个音频信号段的音频信号中的背景噪声，所述背景噪声估计器被配置为：-基于以下各项获得至少一个参数：-第一线性预测增益，被计算为：针对所述音频信号段，来自0阶线性预测的残余信号与来自2阶线性预测的残余信号之...

【专利技术属性】
技术研发人员：马丁·绍尔斯戴德，
申请(专利权)人：瑞典爱立信有限公司，
类型：发明
国别省市：瑞典;SE

全部详细技术资料下载我是这个专利的主人