估计音频信号中的背景噪声制造技术

技术编号：22170746 阅读：40 留言：0更新日期：2019-09-21 12:13

本发明专利技术涉及一种背景噪声估计器及其中的方法，用于支持在音频信号分段中进行声音活动检测。所述方法包括：当确定音频信号分段包括音乐并且当前背景噪声估计超过最小值时，减小当前背景噪声估计。以上操作在以下情况下执行：当音频信号分段的能量水平与长期最小能量水平lt_min的差大于阈值时，或者当音频信号分段的能量水平与lt_min的差小于阈值，但是在音频信号分段中没有检测到停顿时，其中，所述lt_min是多个在先音频信号分段所确定的。执行所述方法与现有技术相比实现基于背景噪声估计的更准确的声音活动检测。

Estimation of Background Noise in Audio Signals

全部详细技术资料下载

【技术实现步骤摘要】
估计音频信号中的背景噪声本申请是2016年6月13日向中国专利局递交并进入中国国家阶段的题为“估计音频信号中的背景噪声”的专利技术专利申请No.201480067985.8(PCT国际申请No.PCT/SE2014/051427，国际申请日：2014年12月01日)的分案申请。
本专利技术的实施例涉及音频编码，具体地，涉及估计背景噪声以用于支持声音活动判断。
技术介绍
在利用不连续传输(DTX)的通信系统中，找到效率和不降低质量之间的平衡是重要的。在这种系统中，活动检测器用于指示要被活动编码的活动信号(例如语音或音乐)、以及具有可以用在接收机侧产生的舒适噪声所替代的背景信号的分段。如果活动检测器在检测非活动时效率太高，则它将会在活动信号中引入削波(clipping)，当削波后的活动分段被舒适噪声替代时其将被感知为主观上的质量劣化。同时，如果活动检测器的效率不够并且将背景噪声分段分类为活动并对背景噪声进行活动编码而不是利用舒适噪声进入DTX模式，则DTX的效率降低。在多数情况下，削波问题被视为更严重。图1示出了总体的声音活动检测器(SAD)或语音活动检测器(VAD)的框图，其采用音频信号作为输入并且产生活动判断作为输出。取决于实施方式，输出信号被划分为数据帧(即，例如5-30ms的音频信号分段)，并且每帧产生一个活动判断作为输出。由图1中示出的主检测器进行主判断“prim”。主判断基本上只是当前帧的特征与从先前输入帧估计的背景特征之间的比较。当前帧的特征与背景特征之间的差异比阈值大导致活动主判断。延迟(hangover)加法块用于基于过去的主判断扩展主判断以...

【技术保护点】
1.一种用于支持在音频信号分段中进行声音活动检测的背景噪声估计方法，所述方法包括：计算音频信号分段的可能的新背景噪声估计，并且如果新值比当前值低，则用新背景噪声估计更新当前背景噪声估计；以及当音频信号分段的能量水平与长期最小能力水平lt_min之间的差小于阈值(202:2)，但是在音频信号分段中没有检测到停顿(204:1)时：‑当确定音频信号分段包括音乐(203:2)并且当前背景噪声估计超过最小值(205:1)时，减小(206)当前背景噪声估计，其中，所述长期最小能力水平lt_min是对多个在先音频信号分段所确定的。

【技术特征摘要】
2013.12.19 US 61/918,2581.一种用于支持在音频信号分段中进行声音活动检测的背景噪声估计方法，所述方法包括：计算音频信号分段的可能的新背景噪声估计，并且如果新值比当前值低，则用新背景噪声估计更新当前背景噪声估计；以及当音频信号分段的能量水平与长期最小能力水平lt_min之间的差小于阈值(202:2)，但是在音频信号分段中没有检测到停顿(204:1)时：-当确定音频信号分段包括音乐(203:2)并且当前背景噪声估计超过最小值(205:1)时，减小(206)当前背景噪声估计，其中，所述长期最小能力水平lt_min是对多个在先音频信号分段所确定的。2.根据权利要求1所述的方法，其中，仅基于从输入音频信号得到的信息来判断音频信号分段的能量水平与lt_min之间的差是否大于阈值。3.根据权利要求1或2所述的方法，其中，除了音频信号分段的能量水平与lt_min之间的差小于阈值之外，当还满足以下条件之一或两者时认为检测到停顿：-已经确定预定义数目的连续在先音频信号分段不包括活动信号；-音频信号的动态特性超过阈值。4.一种背景噪声估计器(500)，用于支持在音频信号分段中进行声音检测，所述背景噪声估计器被配置为：计算音频信号分段的可能的新背景噪声估计，并且如果新值比当前值低，则用新背景噪声估计更新当前背景噪声估计；以及当...

【专利技术属性】
技术研发人员：马丁·绍尔斯戴德，
申请(专利权)人：瑞典爱立信有限公司，
类型：发明
国别省市：瑞典,SE

全部详细技术资料下载我是这个专利的主人