【技术实现步骤摘要】
【国外来华专利技术】执行动态范围控制的方法和单元
[0001]相关申请的交叉引用
[0002]本申请要求以下优先申请的优先权:于2020年5月20日提交的美国临时申请63/027,517(参考号:D17089USP1)和于2020年5月20日提交的欧洲申请20175651.7(参考号:D17089EP),这些申请通过引入并入本文。
[0003]本文档涉及一种用于将动态范围控制(DRC)应用于音频信号、尤其是多通道音频信号的方法和对应的设备或单元。
技术介绍
[0004]动态范围控制或动态范围压缩(DRC)可以用于各种应用,例如,以允许在嘈杂的环境中以高感知质量呈现音频内容。特别地,音频信号将以使得(压缩)音频信号对周围的噪声是稳健的(并且因此是可理解的和/或可听到的)方式被修改。DRC可以通过在动态方面增大音频信号密度来实现这一点。可以应用DRC使得音频信号的平均功率提高并且音频信号的峰值水平不提高。通过这样做,可以实现增大的信噪比(SNR)。
[0005]将DRC应用于多通道音频信号可能与高计算复杂度相关联。此外,将D ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种动态范围控制(被称为DRC)单元(210),被配置为将DRC应用于音频信号(211);其中,所述DRC单元(210)被配置为
‑
对从所述音频信号(211)得到的子带信号(212)进行下采样,以提供下采样子带信号(321);
‑
基于所述下采样子带信号(321),确定DRC增益(329);以及
‑
将所述DRC增益(329)应用于所述子带信号(212),以提供压缩音频信号(214)的压缩子带信号(213)。2.如权利要求1所述的DRC单元(210),其中,
‑
所述子带信号(212)的帧包括N个时隙,并且所述下采样子带信号(321)的对应帧包括N/M个时隙;并且
‑
M>1是下采样因子。3.如权利要求2所述的DRC单元(210),其中,所述DRC单元(210)被配置为:
‑
基于所述下采样子带信号(321),确定所述下采样子带信号(321)的对应N/M个时隙的N/M个DRC增益(329);以及
‑
对所述N/M个DRC增益(329)进行到所述子带信号(212)的对应N个时隙的N个DRC增益(329)的上采样。4.如权利要求3所述的DRC单元(210),其中,上采样包括
‑
对M个后续时隙重复使用相同的DRC增益(329);或者
‑
在来自所述N/M个DRC增益(329)的两个连续DRC增益(329)之间进行插值,以确定来自所述N/M个DRC增益(329)的两个连续DRC增益(329)之间的M
‑
1个后续时隙的M
‑
1个DRC增益(329)。5.如权利要求3或4所述的DRC单元(210),其中,所述DRC单元(210)被配置为:将所述子带信号(212)的对应N个时隙的N个样本与对应的N个DRC增益(329)相乘,以确定所述压缩子带信号(213)。6.如前述权利要求中任一项所述的DRC单元(210),其中,所述DRC单元(210)被配置为:
‑
在不使用低通滤波器的情况下,对所述子带信号(212)进行下采样;和/或
‑
通过选择所述子带信号(212)的每第M个样本作为所述下采样子带信号(321)的样本,确定所述下采样子带信号(321)。7.如前述权利要求中任一项所述的DRC单元(210),其中,
‑
所述音频信号(211)使用K个不同频率仓的K个子带信号(212)来表示,其中,K>1;并且
‑
所述DRC单元(210)被配置为:
‑
将所述K个不同频率仓中的至少一些分组为Q个DRC频带,其中,Q<K;以及
‑
分别基于分派给所述Q个DRC频带中至少一个DRC频带的子带信号(212),确定所述Q个DRC频带中的至少一个DRC频带的DRC增益(329)。8.如权利要求7所述的DRC单元(210),其中,所述DRC单元(210)被配置为在确定所述Q个DRC频带的DRC增益(329)时,忽略所述K个频率仓中的一个或多个。9.如权利要求8所述的DRC单元(210),其中,所述一个或多个被忽略的频率仓对应于所述K个频率仓中的最高频率。10.如前述权利要求中任一项所述的DRC单元(210),其中,所述DRC单元(210)被配置
为:
‑
确定所述下采样子带信号(321)的样本的响度估计(323);以及
‑
使用压缩曲线,基于所述响度估计(323)来确定所述增益值(329)。11.如权利要求10所述的DRC单元(210),其中,所述DRC单元(210)被配置为:
‑
确定所述下采样子带信号(321)的样本的幅度;以及
‑
将斯蒂文思幂定律和从线性域到对数域的转换应用于所述下采样子带信号(321)的样本的幅度,以确定所述下采样子带信号(321)的样本的所述响度估计(323)。12.如权利要求10至11中任一项所述的DRC单元(210),其中,
‑
所述压缩曲线被配置为:根据所述响度估计(323)与操作点(331)的偏差来提供映射增益值(324);并且
‑
所述操作点(331)取决于对白归一参数或所述音频信号(211)内的对话内容的平均对话水平或所述音频信号(211)的平均功率水平。13.如权利要求12所述的DRC单元(210),其中,所述DRC单元(210)被配置为:
‑
基于所述下采样子带信号(321)的样本块的功率值,确定平均块功率值;以及
‑
还基于所述平均...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。