The invention relates to a method and a device for allocating bit rates in digital audio coding. The method selects a specific set of adjustment coefficient to adjust the masking threshold from low frequency to high frequency sub bands of a channel to realize adaptive bit allocation in the channel, the method of adaptive bit allocation between channels according to the characteristics of each channel, the method selects a specific adaptive rate coefficient the distribution of high-frequency signal masking threshold mixed are adaptively adjusted to achieve the strength of stereo encoding. Through the adaptive rate allocation method, the invention can obtain better subjective sound quality.
【技术实现步骤摘要】
数字音频编码中码率分配的方法和装置
本专利技术涉及数字音频编码技术,更具体地说,涉及一种数字音频编码中码率分配的方法和装置。
技术介绍
随着超高清电视等应用的发展,对于音频的要求也进一步提高,以便获得身临其境的沉浸式听觉效果。为此,输入音频信号的声道数明显增多(例如5.1.4、7.1.4和22.2等),甚至还有多个独立的目标音频信号。在给定编码总码率条件下,如何处理各声道(包含目标信号)的码率分配以及每个声道内的码率分配将会影响总的编码质量。当前的多声道数字音频编码,如DRA5.1、AAC5.1、DD(DD+)、DTS等,都是属于感知音频编码技术,在变换域或子带域通过心理声学模型计算出的掩蔽门限对频率谱系数进行量化和熵编码,通常在码率分配时没有考虑声道的特点,所有声道同样对待。以DRA多声道编码技术为例(其他编码算法类似),对于输入的多声道PCM信号,首先通过心理声学模型,以人类听觉的临界频带为单位进行掩蔽门限计算,同时,将输入的多声道PCM信号通过滤波器组采用改进离散余弦变换(MDCT)从时域变换到频域,得到多个声道的MDCT系数。根据设定的比特率,比如立体声128kbps或者5.1环绕声384kbps,一般有两种码率分配方式:第一种:多个声道平均分配码率,这是一种简单的分配方法,每个声道内再采用自由竞争的方式(具体参考以下第二种方式)分配比特。对于立体声128kbps时,每个声道64kbps;对于5.1环绕声时,低频效果声道一般仅仅编码120Hz以下的低频部分,可以分配较少的码率,比如24kbps,其它5个全频带声道每个声道分配72kbps。第二种:自 ...
【技术保护点】
一种数字音频编码中声道内码率分配的方法,其特征在于,包括如下步骤:S1、选择一组特定的调整系数对一个声道内从低频到高频各子带的掩蔽门限进行自适应调整;S2、基于调整后的掩蔽门限进行声道内的全局比特分配。
【技术特征摘要】
1.一种数字音频编码中声道内码率分配的方法,其特征在于,包括如下步骤:S1、选择一组特定的调整系数对一个声道内从低频到高频各子带的掩蔽门限进行自适应调整;S2、基于调整后的掩蔽门限进行声道内的全局比特分配。2.根据权利要求1所述的方法,其特征在于,所述步骤S1中一组特定的调整系数基于个人对失真的不敏感来选择。3.根据权利要求1所述的方法,其特征在于,所述步骤S1中一组特定的调整系数基于输入音频信号的类型来选择。4.根据权利要求3所述的方法,其特征在于,所述步骤S1进一步包括:对于语音类信号,选择一个小于1的系数以降低高频子带的掩蔽门限;对于音乐类信号,选择适当的调整系数以降低最低频带的掩蔽门限,并相对于最低频带较次之的降低中间频带的掩蔽门限。5.一种数字音频编码中声道间码率分配的方法,其特征在于,包括如下步骤:S1、对输入的多声道音频信号进行声道特性分析,获得声道配置信息;S2、根据所述声道配置信息,在平均分配码率的基础上对各声道的码率进行不同权重系数的调整;S3、基于调整后的各声道的码率进行全局比特分配。6.根据权利要求5所述的方法,其特征在于,对于5.1声道音频信号,所述步骤S2中码率的调整包括:对前置声场的L声道和R声道给予相较于后置声场的LS声道和RS声道更高的权重系数;对中央声道,在总的编码码率较高时给予相较于其他声道更小的权重系数,在总的编码码率较低时给予相较于其他声道更高的权重系数。7.根据权利要求5所述的方法,其特征在于,对于3D多声道音频信号,所述步骤S2中码率的调整包括:中间层声道的权重系数高于顶层声道的权重系数,顶层声道的权重系数高于底层声道的权重系数,且前置声道的权重系数高于后置声道的权重系数。8.根据权利要求5所述的方法,其特征在于,对于输入...
【专利技术属性】
技术研发人员:闫建新,王磊,
申请(专利权)人:广州广晟数码技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。