高级量化器制造技术

技术编号：12466631 阅读：56 留言：0更新日期：2015-12-09 16:34

本文献涉及一种音频编码和解码系统，称为音频编解码器系统。具体地说，本文献涉及一种尤其良好地适于语音编码/解码的基于变换的音频编解码器系统。描述了被配置为对系数块(141)中的第一系数进行量化的量化单元(112)。系数块(141)包括用于多个对应频率窗(301)的多个系数。量化单元(112)被配置为提供量化器集合(326、327)。量化器集合(326、327)包括分别与多个不同信噪比SNR关联的多个不同量化器(321、322、323)。所述多个不同量化器(321、322、323)包括噪声填充量化器(321)；一个或多个抖动量化器(322)；及一个或多个无抖动量化器(323)。量化单元(112)还被配置为：确定指示属于第一系数的SNR的SNR指示，并且基于SNR指示从量化器集合(326、327)选择第一量化器。此外，量化单元(112)被配置为使用第一量化器对第一系数进行量化。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】高级量化器相关申请的交叉引用本专利技术要求2013年4月5日提交的美国临时专利申请No.61/808,673以及2013年9月10日提交的美国临时专利申请No.61/875,817的优先权，其中的每一个通过其引用而整体合并到此。
本文献涉及一种音频编码和解码系统(称为音频编解码器系统)。具体地说，本文献涉及一种尤其良好地适合于语音编码/解码的基于变换的音频编解码器系统。
技术介绍
通用感知音频编码器通过使用关于覆盖几十毫秒(例如20ms)的样本的块大小的变换(如修正离散余弦变换(MDCT))来实现相对高的编码增益。用于这种基于变换的音频编解码器系统的示例是高级音频编码(AAC)或高效(HE)-AAC。然而，当关于语音信号使用这些基于变换的音频编解码器系统时，语音信号的质量朝着较低码速率而降级得比音乐信号更快，尤其是在干燥(无混响)话音信号的情况下。本文献描述一种特别良好地适合于话音信号的编码的基于变换的音频编解码器系统。此外，本文献描述一种可以用在这种基于变换的音频编解码器系统中的量化方案。可以结合基于变换的音频编解码器系统来使用各种不同的量化方案。示例是矢量量化(例如孪生矢量量化)、分布保留量化、抖动量化、具有随机偏移的标量量化以及与噪声填充组合的标量量化(例如US7447631中所描述的量化器)。这些不同的量化方案关于以下属性中的一个或多个具有各种优点和缺点。运算(编码器)复杂度，其典型地包括比特流的量化和生成的计算复杂度(例如可变长度编码)；感知性能，其可以基于理论考虑(...

【技术保护点】
一种量化单元(112)，被配置为对系数块(141)的第一系数进行量化，其中，所述系数块(141)包括用于多个对应频率窗(301)的多个系数，其中，所述量化单元(112)被配置为：‑提供量化器集合(326、327)；其中，所述量化器集合(326、327)分别包括与不同信噪比SNR相关联的有限数量的不同量化器(321、322、323)；其中，所述量化器集合中的不同量化器根据它们的SNR而排序；所述量化器(321、322、323)的集合(326、327)包括：‑噪声填充量化器(321)；‑一个或更多个抖动量化器(322)；以及‑一个或更多个无抖动量化器(323)；‑确定指示属于所述第一系数的SNR的SNR指示；‑基于所述SNR指示从所述量化器集合(326、327)选择第一量化器；以及‑使用所述第一量化器来量化所述第一系数。

【技术特征摘要】
【国外来华专利技术】2013.04.05 US 61/808,673;2013.09.10 US 61/875,8171.一种量化单元(112)，被配置为对系数块(141)的第一系数进行量化，其中，所述系数块(141)包括用于多个对应频率窗(301)的多个系数，其中，所述量化单元(112)被配置为：
-提供量化器集合(326、327)；其中，所述量化器集合(326、327)分别包括与不同信噪比SNR相关联的有限数量的不同量化器(321、322、323)；其中，所述量化器集合中的不同量化器根据它们的SNR而排序；所述量化器(321、322、323)的集合(326、327)包括：
-噪声填充量化器(321)，其中噪声填充量化器(321)被配置为通过用根据预定统计模型生成的随机值替换第一系数的值来量化第一系数；
-一个或更多个抖动量化器(322)；以及
-一个或更多个无抖动确定性量化器(323)；
-确定指示属于所述第一系数的SNR的SNR指示；
-基于所述SNR指示从所述量化器集合(326、327)选择第一量化器；以及
-使用所述第一量化器来量化所述第一系数。

2.如权利要求1所述的量化单元(112)，其中，
-所述噪声填充量化器(321)与不同SNR中的相对最低SNR相关联；
-所述一个或更多个无抖动确定性量化器(323)与不同SNR中的一个或更多个相对最高SNR相关联；以及
-所述一个或更多个抖动量化器(322)与比不同SNR中的所述相对最低SNR更高且比所述一个或更多个相对最高SNR更低的一个或更多个中等SNR相关联。

3.如权利要求1或2所述的量化单元(112)，其中，所述量化器集合根据与所述不同量化器相关联的增加SNR来排序。

4.如权利要求3所述的量化单元(112)，其中，
-SNR差值由与来自排序的量化器集合的一对相邻量化器相关联的SNR的差值给定；以及
-用于来自不同量化器的所有成对的相邻量化器的SNR差值落入以预定SNR目标差值为中央的预定SNR差值区间内。

5.如权利要求4所述的量化单元(112)，其中，所述预定SNR差值区间的宽度小于所述预定SNR目标差值的预定百分比。

6.如权利要求4所述的量化单元(112)，其中，所述预定SNR目标差值是1.5dB。

7.如权利要求1或2所述的量化单元(112)，其中，所述噪声填充量化器(321)
-包括随机数发生器，被配置为根据预定统计模型来生成随机数；和/或
-与基本上小于或等于0dB的SNR相关联。

8.如权利要求1或2所述的量化单元(112)，其中，所述一个或多个抖动量化器(322)中的特定抖动量化器(322)包括：
-抖动应用单元(611)，被配置为通过将抖动值应用于所述第一系数来确定第一抖动系数；以及
-标量量化器(612)，被配置为通过将所述第一抖动系数分配给所述标量量化器(612)的区间来确定第一量化指数。

9.如权利要求8所述的量化单元(112)，其中，所述一个或更多个抖动量化器(322)中的特定抖动量化器(322)还包括：
-逆标量量化器，被配置为将第一重构值分配给所述第一量化指数；
-抖动移除单元(613)，被配置为通过从所述第一重构值移除所述抖动值来确定第一解抖动系数。

10.如权利要求9所述的量化单元(112)，其中，
-所述抖动应用单元(611)被配置为从所述第一系数减去所述抖动值，并且其中，所述抖动移除单元(613)被配置为将所述抖动值与所述第一重构值相加；或
-所述抖动应用单元(611)被配置为将所述抖动值与所述第一系数相加，并且其中，所述抖动移除单元(613)被配置为从所述第一重构值减去所述抖动值。

11.如权利要求9所述的量化单元(112)，其中，所述一个或更多个抖动量化器(322)中的所述特定抖动量化器(322)还包括：
-后增益应用单元(614)，被配置为通过将量化器后增益γ应用于所述第一解抖动系数来确定第一量化系数。

12.如权利要求11所述的量化单元(112)，其中，所述量化器后增益γ由下式给出：

其中，是所述系数块(141)中的系数中的一个或更多个的方差，并且其中，Δ是所述特定抖动量化器的所述标量量化器(612)的量化器步长大小。

13.如权利要求8所述的量化单元(112)，还包括：抖动发生器(601)，被配置为生成抖动值块(602)，其中，所述抖动值块(602)包括分别用于所述多个对应频率窗(301)的多个抖动值。

14.如权利要求13所述的量化单元(112)，其中，所述抖动发生器(601)被配置为：
-选择M个预定抖动实现之一，其中M是整数；以及
-基于所选择的抖动实现来生成所述抖动值块(602)。

15.如权利要求14所述的量化单元(112)，其中，所述预定抖动实现的数量M是10、5、4或更少。

16.如权利要求8所述的量化单元(112)，其中，所述抖动值是伪随机数。

17.如权利要求8所述的量化单元(112)，其中，
-所述标量量化器(612)具有预定量化器步长大小Δ；
-所述抖动值从预定抖动区间取值；以及
-所述预定抖动区间具有等于或小于所述预定量化器步长大小Δ的宽度。

18.如权利要求13所述的量化单元(112)，其中
-所述标量量化器(612)具有预定量化器步长大小Δ；
-所述抖动值从预定抖动区间取值；以及
-所述预定抖动区间具有等于或小于所述预定量化器步长大小Δ的宽度；以及
其中，所述抖动值块(602)均匀地分布在所述预定抖动区间内。

19.如权利要求1或2所述的量化单元(112)，其中，所述一个或更多个抖动量化器(322)是减法抖动量化器。

20.如权利要求1或2所述的量化单元(112)，其中，所述一个或更多个无抖动量化器(323)中的无抖动确定性量化器(323)是具有预定均匀量化器步长大小的标量量化器。

21.如权利要求1或2所述的量化单元(112)，其中，
-所述系数块(141)与谱块包络(136)关联；
-所述谱块包络(136)指示用于所述多个对应频率窗(301)的多个谱能量值(303)；以及
-所述SNR指示取决于所述谱块包络(136)。

22.如权利要求21所述的量化单元(112)，其中，
-所述SNR指示还取决于用于偏移所述谱块包络(136)的偏移参数；以及
-所述偏移参数取决于能用于对所述系数块(141)进行编码的比特的预定数量(143)。

23.如权利要求22所述的量化单元(112)，其中，通过使用所述偏移参数来偏移从与第一系数的所述频率窗(301)相关联的谱块包络(136)推导的值而确定指示属于第一系数的SNR的SNR指示。

24.如权利要求21所述的量化单元(112)，其中，
-SNR差值由与来自排序的量化器集合的一对相邻量化器相关联的SNR的差值给定；以及
-用于来自不同量化器的所有成对的相邻量化器的SNR差值落入以预定SNR目标差值为中央的预定SNR差值区间内；以及其中
-所述SNR指示取决于从所述谱块包络(136)推导出的分配包络(138)；
-所述分配包络(138)具有分配分辨率；
-所述分配分辨率取决于来自所述量化器集合(326、327)的各相邻量化器之间的SNR差值。

25.如权利要求1或2所述的量化单元(112)，其中，
-所述系数块(141)中的多个系数被分配给多个频率带(302)；
-频率带(302)包括一个或更多个频率窗(301)；以及
-所述量化单元(112)被配置为对于所述多个频率带(302)中的每一个从所述量化器集合(326、327)中选择量化器，以使得使用同一量化器来量化分配给相同频率带(302)的系数。

26.如权利要求25所述的量化单元(112)，其中，每频率带(302)的多个频率窗(301)随着增加频率而增加。

27.如权利要求9所述的量化单元(112)，其中，所述量化单元(112)被配置为：
-确定(701)指示所述系数块(141)的性质的辅助信息(721)；以及
-取决于所述辅助信息(721)来生成(702)所述量化器集合(326、327)。

28.如权利要求27所述的量化单元(112)，其中，所述噪声填充量化器(321)
-包括随机数发生器，被配置为根据预定统计模型来生成随机数；和/或
-与基本上小于或等于0dB的SNR相关联；以及
其中，所述噪声填充量化器(321)的所述随机数发生器的所述预定统计模型取决于所述辅助信息(721)。

29.如权利要求27所述的量化单元(112)，其中，所述量化器集合(326、327)内的抖动量化器(322)的数量取决于所述辅助信息(721)。

30.如权利要求27所述的量化单元(112)，其中，所述量化单元(112)被配置为从在包括所述量化单元(112)的编码器(100、170)处以及在包括对应逆量化单元(552)的对应解码器(500)处能获得的数据提取(701)所述辅助信息(721)。

31.如权利要求30所述的量化单元(112)，其中，所述辅助信息(721)包括以下信息中的至少一个：
-由所述编码器(100、170)内所包括的预测器(117)确定的预测器增益；其中，所述预测器增益指示所述系数块(141)的声调内容；和/或
-基于所述系数块(141)推导出的谱反射系数；其中，所述谱反射系数指示所述系数块(141)的摩擦音内容。

32.如权利要求31所述的量化单元(112)，其中，所述量化器集合(326、327)内所包括的抖动量化器的数量随着增大的预测器增益而减少，以及随着减小的预测器增益而增加。

33.如权利要求27所述的量化单元(112)，其中，
-所述辅助信息包括方差保留标志；
-所述方差保留标志指示如何调整所述系数块(141)的方差；以及
-取决于所述方差保留标志来确定所述量化器集合(326、327)。

34.如权利要求33所述的量化单元(112)，其中，所述噪声填充量化器(321)的噪声增益取决于所述方差保留标志。

35.如权利要求33所述的量化单元(112)，其中，取决于所述方差保留标志来确定由所述一个或更多个抖动量化器(322)所覆盖的SNR范围(324、325)。

36.如权利要求33所述的量化单元(112)，其中，所述一个或更多个抖动量化器(322)中的所述特定抖动量化器(322)还包括：
-后增益应用单元(614)，被配置为通过将量化器后增益γ应用于所述第一解抖动系数来确定第一量化系数；以及
其中，所述量化器后增益γ取决于所述方差保留标志。

37.一种逆量化单元(552)，被配置为对量化指数进行解量化；其中，所述量化指数与包括用于多个对应频率窗(301)的多个系数的系数块相关联；
其中，所述逆量化单元(552)被配置为：
-提供量化器集合(326、327)；其中，所述量化器集合(326、327)分别包括与不同信噪比SNR关联的有限数量的不同量化器(321、322、323)；其中，所述量化器集合(326、327)中的不同量化器根据它们的SNR来排序；所述量化器(321、322、323)的集合(326、327)包括：
-噪声填充量化器(321)，其中噪声填充量化器(321)被配置为通过用根据预定统计模型生成的随机值替换系数的值来量化系数；
-一个或更多个抖动量化器(322)；以及
-一个或更多个无抖动确定性量化器(323)；
-确定指示属于来自所述系数块的第一系数的SNR的SNR指示；
-基于所述SNR指示从所述量化器集合(326、327)选择第一量化器；以及
-使用所述第一量化器来确定用于所述第一系数的第一量化系数。

38.一种基于变换的话音编码器(100、170)，被配置为将音频信号编码为比特流；所述编码器(100、170)包括：
-量化单元(112)，被配置为通过使用抖动量化器(322)对来自系数块(141)的多个系数进行量化来确定多个量化指数；其中，所述多个系数与多个对应频率窗(301)相关联；其中，从所述音频信号推导所述系数块(141)；
-抖动发生器(601)，被配置为选择M个预定抖动实现之一，并且被配置为基于所选择的抖动实现来生成用于量化所述多个系数的多个抖动值(602)；其中，M是大于1的整数；以及
-熵编码器，被配置为从M个预定码书中选择码书，并且被配置为使用所选择的码书来对所述多个量化指数进行熵编码；其中，所述M个预定码书分别与所述M个预定抖动实现相关联；其中M个预定码书已经分别被使用所述M个预定抖动实现来训练；...

【专利技术属性】
技术研发人员：J·克里萨，L·维尔莫斯，P·何德林，
申请(专利权)人：杜比国际公司，
类型：发明
国别省市：荷兰;NL

全部详细技术资料下载我是这个专利的主人