数字音频编码中码率分配的方法和装置制造方法及图纸

技术编号:15331944 阅读:78 留言:0更新日期:2017-05-16 15:06
本发明专利技术涉及数字音频编码中码率分配的方法和装置。所述方法选择一组特定的调整系数对一个声道内从低频到高频各子带的掩蔽门限进行自适应调整以实现声道内的自适应码率分配,所述方法根据各个声道的特性进行声道间的自适应码率分配,所述方法选择一特定的权重系数对混合的高频信号部分的掩蔽门限进行自适应调整以实现强度立体声编码时的自适应码率分配。通过这些自适应码率分配方法,本发明专利技术可以获得更好的主观声音质量。

Method and apparatus for bit rate allocation in digital audio coding

The invention relates to a method and a device for allocating bit rates in digital audio coding. The method selects a specific set of adjustment coefficient to adjust the masking threshold from low frequency to high frequency sub bands of a channel to realize adaptive bit allocation in the channel, the method of adaptive bit allocation between channels according to the characteristics of each channel, the method selects a specific adaptive rate coefficient the distribution of high-frequency signal masking threshold mixed are adaptively adjusted to achieve the strength of stereo encoding. Through the adaptive rate allocation method, the invention can obtain better subjective sound quality.

【技术实现步骤摘要】
数字音频编码中码率分配的方法和装置
本专利技术涉及数字音频编码技术,更具体地说,涉及一种数字音频编码中码率分配的方法和装置。
技术介绍
随着超高清电视等应用的发展,对于音频的要求也进一步提高,以便获得身临其境的沉浸式听觉效果。为此,输入音频信号的声道数明显增多(例如5.1.4、7.1.4和22.2等),甚至还有多个独立的目标音频信号。在给定编码总码率条件下,如何处理各声道(包含目标信号)的码率分配以及每个声道内的码率分配将会影响总的编码质量。当前的多声道数字音频编码,如DRA5.1、AAC5.1、DD(DD+)、DTS等,都是属于感知音频编码技术,在变换域或子带域通过心理声学模型计算出的掩蔽门限对频率谱系数进行量化和熵编码,通常在码率分配时没有考虑声道的特点,所有声道同样对待。以DRA多声道编码技术为例(其他编码算法类似),对于输入的多声道PCM信号,首先通过心理声学模型,以人类听觉的临界频带为单位进行掩蔽门限计算,同时,将输入的多声道PCM信号通过滤波器组采用改进离散余弦变换(MDCT)从时域变换到频域,得到多个声道的MDCT系数。根据设定的比特率,比如立体声128kbps或者5.1环绕声384kbps,一般有两种码率分配方式:第一种:多个声道平均分配码率,这是一种简单的分配方法,每个声道内再采用自由竞争的方式(具体参考以下第二种方式)分配比特。对于立体声128kbps时,每个声道64kbps;对于5.1环绕声时,低频效果声道一般仅仅编码120Hz以下的低频部分,可以分配较少的码率,比如24kbps,其它5个全频带声道每个声道分配72kbps。第二种:自由竞争模式。首先计算每帧总比特数,对于DRA编码,立体声每帧为128*1024/48比特,即约为2731比特;5.1环绕声384kbs,每帧为8192比特。然后,根据每个声道的每个比例因子带(或称为量化单元)的掩蔽门限值,首先对量化噪声最大(即最不容易掩蔽掉量化噪声)的子带中的系数增加量化精度,从总比特中分出一部分比特,之后再分析所有声道所有子带中哪一个子带内的MDCT系数最需要提高量化精度,则进一步从总比特数中分配出一部分比特来增加其量化精度,以此类推,直到最后消耗掉所有比特数为止,则码率(比特)分配完毕。第二种分配方式在实现时比较复杂,较少采用。一般都采用第一种的平均分配方法。从以上两种分配方式可以看出,虽然针对5.1声道的情况,考虑到.1声道实际需要编码的频带仅仅到120Hz,其他全频带一般要编码到20kHz,已经进行了非平均码率分配,但是对于立体声、5.1中的全频带声道一般采用各个声道平均分配码率然后每个声道内自由竞争方式分配比特(或码率)。这种方法没有考虑到以下两点:(1)对于5.1以上等多声道情况,各个全频带声道(包含目标信号)在对总主观声音质量上的贡献并不相同;(2)在一定码率要求条件下,每个声道的低频和高频失真对总的主观声音质量的影响也不相同。在对立体声或多声道音频信号编码时,如果码率低于某一个值,例如DRA立体声96kbps、5.1环绕声256kbps时,通常采用强度立体声编码(IntensityStereoCoding)。这是因为当在这个码率以下编码时,无法达到透明编码质量,需要改进编码策略。人类听觉系统对于音频高频部分的包络更敏感,而其细节不太重要,基于此原理,强度立体声编码技术可以将立体声信号的高频(或者5.1声道的5个全频带信号的高频部分)混合成一个声道,同时传输所有声道的高频包络。这种编码策略保证了在较低的码率下获得更好的编码主观声音质量。例如对于立体声编码时,通常左(L)右(R)声道强度立体声编码处理如下:若强度立体声编码的频率点(通常全频带声道高频一直到20kHz)为8kHz,则处理后的L声道构成为:L声道的0~8kHz+(L声道8~20kHz高频与R声道8~20kHz高频)混合后的高频部分;处理后的R声道构成为:R声道的0~8kHz。然后对重构的左右声道进行自由竞争的码率分配方式处理。可以看出,强度立体声编码方法存在以下码率分配上的问题:由于只传输一个混合的高频细节,在解码时通过这个高频细节和各个声道的高频包络来恢复各个声道的高频部分。如果作为像传统(没有采用强度立体声模式)的多个声道码率分配方式来编码这种多个声道共用的高频细节,这个共用的高频部分在码率分配时并没有任何优势,在独立的声道编码时,各个声道的高频部分失真都限定在各声道内,而强度立体声编码的高频部分细节编码失真会带入各个声道。
技术实现思路
本专利技术要解决的技术问题在于,针对现有技术的上述缺陷,提供数字音频编码中码率分配的方法和装置,能够获得更好的主观声音质量。本专利技术为解决其技术问题在第一方面提出一种数字音频编码中声道内码率分配的方法,包括如下步骤:S1、选择一组特定的调整系数对一个声道内从低频到高频各子带的掩蔽门限进行自适应调整;S2、基于调整后的掩蔽门限进行声道内的全局比特分配。根据本专利技术第一方面的一个实施例中,所述步骤S1中一组特定的调整系数基于个人对失真的不敏感来选择。根据本专利技术第一方面的一个实施例中,所述步骤S1中一组特定的调整系数基于输入音频信号的类型来选择。根据本专利技术第一方面的一个实施例中,所述步骤S1进一步包括:对于语音类信号,选择一个小于1的系数以降低高频子带的掩蔽门限;对于音乐类信号,选择适当的调整系数以降低最低频带的掩蔽门限,并相对于最低频带较次之的降低中间频带的掩蔽门限。本专利技术为解决其技术问题在第二方面提出一种数字音频编码中声道间码率分配的方法,包括如下步骤:S1、对输入的多声道音频信号进行声道特性分析,获得声道配置信息;S2、根据所述声道配置信息,在平均分配码率的基础上对各声道的码率进行不同权重系数的调整;S3、基于调整后的各声道的码率进行全局比特分配。根据本专利技术第二方面的一个实施例中,对于5.1声道音频信号,所述步骤S2中码率的调整包括:对前置声场的L声道和R声道给予相较于后置声场的LS声道和RS声道更高的权重系数;对中央声道,在总的编码码率较高时给予相较于其他声道更小的权重系数,在总的编码码率较低时给予相较于其他声道更高的权重系数。根据本专利技术第二方面的一个实施例中,对于3D多声道音频信号,所述步骤S2中码率的调整包括:中间层声道的权重系数高于顶层声道的权重系数,顶层声道的权重系数高于底层声道的权重系数,且前置声道的权重系数高于后置声道的权重系数。根据本专利技术第二方面的一个实施例中,对于输入的多声道音频信号中包含目标信号的情况,所述步骤S1进一步包括:分析目标信号的特性,获得目标信号描述信息;所述步骤S2进一步包括:基于目标信号描述信息来确定目标信号码率分配的权重系数。根据本专利技术第二方面的一个实施例中,所述步骤S2中确定目标信号的码率分配的权重系数进一步包括:当目标信号为不同语种的伴音时,给予和中央声道一样的权重系数;当目标信号为方向性活动目标信号时,给予较声道信号更低的码率分配权重系数。本专利技术为解决其技术问题在第三方面提出一种数字音频的强度立体声编码中码率分配的方法,包括如下步骤:S1、选择一特定的权重系数对混合的高频信号部分的掩蔽门限进行自适应调整;S2、基于调整后的掩蔽门限进行自由竞争码率分配。根据本专利技术第三方面的一个实本文档来自技高网
...
数字音频编码中码率分配的方法和装置

【技术保护点】
一种数字音频编码中声道内码率分配的方法,其特征在于,包括如下步骤:S1、选择一组特定的调整系数对一个声道内从低频到高频各子带的掩蔽门限进行自适应调整;S2、基于调整后的掩蔽门限进行声道内的全局比特分配。

【技术特征摘要】
1.一种数字音频编码中声道内码率分配的方法,其特征在于,包括如下步骤:S1、选择一组特定的调整系数对一个声道内从低频到高频各子带的掩蔽门限进行自适应调整;S2、基于调整后的掩蔽门限进行声道内的全局比特分配。2.根据权利要求1所述的方法,其特征在于,所述步骤S1中一组特定的调整系数基于个人对失真的不敏感来选择。3.根据权利要求1所述的方法,其特征在于,所述步骤S1中一组特定的调整系数基于输入音频信号的类型来选择。4.根据权利要求3所述的方法,其特征在于,所述步骤S1进一步包括:对于语音类信号,选择一个小于1的系数以降低高频子带的掩蔽门限;对于音乐类信号,选择适当的调整系数以降低最低频带的掩蔽门限,并相对于最低频带较次之的降低中间频带的掩蔽门限。5.一种数字音频编码中声道间码率分配的方法,其特征在于,包括如下步骤:S1、对输入的多声道音频信号进行声道特性分析,获得声道配置信息;S2、根据所述声道配置信息,在平均分配码率的基础上对各声道的码率进行不同权重系数的调整;S3、基于调整后的各声道的码率进行全局比特分配。6.根据权利要求5所述的方法,其特征在于,对于5.1声道音频信号,所述步骤S2中码率的调整包括:对前置声场的L声道和R声道给予相较于后置声场的LS声道和RS声道更高的权重系数;对中央声道,在总的编码码率较高时给予相较于其他声道更小的权重系数,在总的编码码率较低时给予相较于其他声道更高的权重系数。7.根据权利要求5所述的方法,其特征在于,对于3D多声道音频信号,所述步骤S2中码率的调整包括:中间层声道的权重系数高于顶层声道的权重系数,顶层声道的权重系数高于底层声道的权重系数,且前置声道的权重系数高于后置声道的权重系数。8.根据权利要求5所述的方法,其特征在于,对于输入...

【专利技术属性】
技术研发人员:闫建新王磊
申请(专利权)人:广州广晟数码技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1