使用高级频谱延拓降低量化噪声的压扩装置和方法制造方法及图纸

技术编号：12222520 阅读：93 留言：0更新日期：2015-10-22 00:53

实施例针对用于降低音频编解码器中的编码噪声的压扩方法和系统。压缩过程通过如下压缩过程来减小初始音频信号的原始动态范围：使用定义的窗形状将初始音频信号分成多个片段，使用初始音频信号的频域样本的基于非能量的平均在频域中计算宽带增益，以及施加个体增益值以放大相对低强度的片段和衰减相对高强度的片段。被压缩的音频信号然后通过施加逆增益值以放大相对高强度的片段和衰减相对低强度的片段，而被扩展回基本上原始动态范围。使用QMF滤波器组来分析初始音频信号以获得频域表示。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】相关申请的交叉引用本申请要求在2013年4月5日提交的美国临时专利申请No. 61/809028以及在 2013年9月12日提交的No. 61/877167的优先权，其全文内容通过引用并入于此。
-个或更多个实施例一般涉及音频信号处理，更具体地说，涉及使用压缩/扩展 (压扩（companding))技术降低音频编解码器中的编码噪声。
技术介绍
许多流行的数字声音格式利用丢弃数据中的一些来降低存储或数据速率要求的有损数据压缩技术。有损数据压缩的应用不仅降低源内容（例如，音频内容）的保真度，而且它也可能引入压缩伪影（artifact)形式的可察觉失真。在音频编码系统的背景下，这些声音伪影被称为编码噪声或量化噪声。数字音频系统根据定义的音频文件格式或流媒体音频格式，利用编解码器（编码器-解码器组件）来压缩和解压缩音频数据。编解码器实现试图以最小的比特数表示音频信号同时保持尽可能高的保真度的算法。在音频编解码器中典型地使用的有损压缩技术在人类听觉感知的心理声学模型上工作。音频格式通常涉及时/频域变换（例如，修正离散余弦变换-MDCT)的使用，并且使用诸如频率掩蔽或时间掩蔽之类的掩蔽效应，使得包括任何明显的量化噪声的某些声音被实际内容隐藏或掩蔽。大多数音频编码系统是基于帧的。在帧内，音频编解码器通常在频域中对编码噪声进行整形，使得它变得最难听得见。几种目前的数字音频格式利用这种长持续时间的帧，使得帧可以包含几个不同级别或强度的声音。因为编码噪声随着帧的演变在级别上通常是平稳的，所以编码噪声在帧的低强度部分期间可能是最...
<a href="http://www.xjishu.com/zhuanli/21/CN104995680.html" title="使用高级频谱延拓降低量化噪声的压扩装置和方法原文来自X技术">使用高级频谱延拓降低量化噪声的压扩装置和方法</a>

【技术保护点】
一种扩展音频信号的方法，包括：接收音频信号；以及通过扩展过程将音频信号扩展到扩展的动态范围，所述扩展过程包括：使用定义的窗形状将接收到的音频信号分成多个时间片段，使用音频信号的频域表示的基于非能量的平均来在频域中计算用于每个时间片段的宽带增益，以及向每个时间片段施加个体增益值以获得扩展的动态范围音频信号，其中个体增益值的施加放大相对高强度的片段并且衰减相对低强度的片段。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：P·何德林，A·比斯沃斯，M·舒格，V·迈勒考特，
申请(专利权)人：杜比实验室特许公司，杜比国际公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人