一种数字音频粗分层编码方法和装置制造方法及图纸

技术编号:8834990 阅读:143 留言:0更新日期:2013-06-22 20:56
本发明专利技术涉及一种数字音频粗分层编码方法和装置。所述方法包括:S1、将数字音频信号分为一基本层和至少一增强层;S2、对所述一基本层和至少一增强层分别进行编码;所述步骤S1进一步包括:S11、对于单声道音频信号,基于频带或残差分层结构将其分为一基本层和至少一增强层;S12、对于立体声音频信号,基于频带、声道、参数立体声编码或残差分层结构将其分为一基本层和至少一增强层;S13、对于多声道音频信号,基于频带、声道、或残差分层结构将其分为一基本层和至少一增强层。本发明专利技术避免了精细分层引起的编码效率下降,实现简单,能获取最佳综合声音质量,易于满足信道编码要求,并且不需要精细分层时的各种限制条件,保证更高效率的压缩。

【技术实现步骤摘要】

本专利技术涉及音频编解码技术,更具体地说,涉及一种数字音频粗分层编码方法和>J-U ρ α装直。
技术介绍
在分层音频编码上,已经存在通过精细分层方式进行的有损数字音频编码技术及无损音频编码技术。例如,IS0/IEC14496-3MPEG-4BSAC (Bit sliced arithmetic coding)比特片算术编码便提出了精细分层技术。在这种编码算法中,基于对MDCT (ModifiedDiscrete Cosine Transform,修正离散余弦变换)变换后的变换域系数(频谱系数)被量化为整数后,从低频到高频分成多个组,每个组谱系数从高位到低位形成比特片方式进行算术编码,因此可以实现非常精细的分层(或者伸缩)编码。但是为了精细分层,需要考虑限制频谱分区长度等,从而导致降低编码效率。例如,在AVS (Audio Video coding Standard Workgroup of China)中米用的类似于MPEG-4BSAC的编码方法,其中熵编码算法从算术编码换成了霍夫曼编码,编码原理相同。在MPEG-4第三部分和MPEG-2第七部分中都提供了可伸缩采样率编码算法AAC-SSRCAdvanced Audio Coding-Scalable Sampling Rate),首先是由 Sony提出的,编码架构也类似于其独有的ARTAC (Adaptive Transform Acoustic Coding)编码。该编码算法首先将输入的数字 音频信号通过4带的多相正交滤波器组(PQF, Polyphase QuadratureFilter)分割成四个频带,然后这四个频带分别进行一个256点MDCT (512样点窗长)或八个32点(64样点窗长)MDCT。该编码技术还可通过去除高PQF带的方式降低数据率,提供了一种通过减少频带的方式实现比特流分层,从而获得不同比特率和采样率,例如:.4 个频带:比特率=128kbit/s,米样率=48kHz, f_lowpass=20kHz ;.3 个频带:比特率 120kbit/s,米样率=48kHz, f_lowpass=18kHz ;.2 个频带:比特率 100kbit/s,米样率=24kHz, f_lowpass=l2kHz ;.I 个频带:比特率 65kbit/s,米样率=12kHz, f_lowpass=6kHz这种编码技术的好处是在每个频带内可以独立选择长块或短块MDCT,因此对高频可使用短块编码增强时间分辨率,而对低频使用长块编码获得高频率分辨率。但是由于四个PQF带间存在混迭,因此相邻部分的变换域系数编码效率会下降。MPEG-4SLS (Scalable Lossless Coding,可伸缩无损编码)有两种分层方式:一种是一个有损音频编码层(如AAC)和无损误差增强层,这样就保证了与原来有损编码的后向兼容;另外一种是没有有损编码层,仅仅无损增强层。在这两种方式中,无损增强层能够实现精细分层,提供低质量、高质量以及无损质量。但是,精细分层的方式存在编码效率低、结构复杂、处理逻辑复杂度高等缺点
技术实现思路
本专利技术要解决的技术问题在于,针对现有技术的上述精细分层的方式存在编码效率低、结构复杂、处理逻辑复杂度高的缺点,提供一种数字音频粗分层编码方法和装置。本专利技术解决其技术问题所采用的技术方案是:提出一种数字音频粗分层编码方法,包括如下步骤:S1、将数字音频信号分为一基本层和至少一增强层;S2、对所述一基本层和至少一增强层分别进行编码;其中,所述步骤SI进一步包括:S11、对于单声道音频信号,基于频带或残差分层结构将其分为一基本层和至少一增强层;S12、对于立体声音频信号,基于频带、声道、参数立体声编码或残差分层结构将其分为一基本层和至少一增强层;S13、对于多声道音频信号,基于频带、声道、或残差分层结构将其分为一基本层和至少一增强层;其中,所述基于频带将数字音频信号分为一基本层和至少一增强层进一步包括:依次从低频到高频将每个频段的音频编码信息放入所述一基本层和至少一增强层;所述基于声道将数字音频信号分为一基本层和至少一增强层进一步包括:由所述基本层传输至少一声道,由所述至少一增强层传输至少另一声道,且所述基本层传输的声道的数量小于等于所述至少一增强层传输的声道的数量;所述基于参数立体声将数字音频信号分为一基本层和至少一增强层进一步包括:由所述基本层传输立体声道对缩混的单个声道,由所述至少一增强层传输参数立体声信息;所述基于残差分层结构将数字音频信号分为一基本层和至少一增强层进一步包括:根据基本层的码率要求对数字音频信号进行编码并将编码后的数据放入基本层;将数字音频信号与基本层解码恢复到的信号进行比较获得第一级残差信号并对所述第一级残差信号进行编码后放入第一级增强层;从上一级残差信号中去除上一级增强层解码恢复到的信号获得下一级残差信号并对所述下一级残差信号进行编码后放入下一级增强层;其中,所述基于声道将数字音频信号分为一基本层和至少一增强层还进一步包括:在数据帧总字节数一定的前提下,基于基本层强调配置方案、均匀配置方案、近均匀配置方案或受限配置方案对所述一基本层和至少一增强层分别配置字节数;其中,所述基本层强调配置方案包括:分配给所述一基本层的字节数大于等于分配给所述至少一增强层的字节数;所述均匀配置方案包括:对所述一基本层和所述至少一增强层的每个全频带声道分配同样的字节数;所述近均匀配置方案包括:对所述基本层中每个全频带声道配置的字节数为(数据帧总字节数/基本层包含的全频带声道数),且(数据帧总字节数/2) > (数据帧总字节数/基本层包含的全频带声道数)> (数据帧总字节数/ (基本层包含的全频带声道数+增强层包含的全频带声道数));对增强层中的一声道配置的字节数大于(数据帧总字节数* (1-1/基本层包含的全频带声道数))/增强层包含的全频带声道数,而对增强层中其余至少一声道配置的字节数小于(数据帧总字节数* (1-1/基本层包含的全频带声道数))/增强层包含的全频带声道数;所述受限配置方案包括:根据每一传输帧中LDPC编码的块大小、信道编码条件、所述基本层的特性和/或所述增强层的特性,对所述基本层和增强层分别配置字节数。一个实施例中,所述步骤S2进一步包括:对所述一基本层和至少一增强层分别进打DRA编码。一个实施例中,所述步骤S2还进一步包括:对所述一基本层和至少一增强层中的任意全频带声道进行带宽扩展编码。一个实施例中,所述步骤S2还进一步包括:对所述一基本层和至少一增强层中的任意声道对进行参数立体声编码。一个实施例中,所述步骤SI进一步包括:基于声道将5.1环绕声数字音频信号分为一基本层和一增强层,其中,由所述基本层传输立体声左声道和立体声右声道,由所述增强层传输中央声道、超重低音声道、左环绕声道和右环绕声道;基于基本层强调配置方案或近均匀配置方案对所述基本层和增强层分别配置字节数;所述步骤S2进一步包括:使用带宽扩展编码技术和参数立体声编码技术对所述基本层中的立体声左声道和立体声右声道缩混的单个声道的低频带部分进行DRA编码;使用带宽扩展编码技术对所述增强层中的中央声道进行DRA编码;对所述增强层中的超重低音声道进本文档来自技高网
...

【技术保护点】
一种数字音频粗分层编码方法,其特征在于,包括如下步骤:S1、将数字音频信号分为一基本层和至少一增强层;S2、对所述一基本层和至少一增强层分别进行编码;其中,所述步骤S1进一步包括:S11、对于单声道音频信号,基于频带或残差分层结构将其分为一基本层和至少一增强层;S12、对于立体声音频信号,基于频带、声道、参数立体声编码或残差分层结构将其分为一基本层和至少一增强层;S13、对于多声道音频信号,基于频带、声道、或残差分层结构将其分为一基本层和至少一增强层;其中,所述基于频带将数字音频信号分为一基本层和至少一增强层进一步包括:依次从低频到高频将每个频段的音频编码信息放入所述一基本层和至少一增强层;所述基于声道将数字音频信号分为一基本层和至少一增强层进一步包括:由所述基本层传输至少一声道,由所述至少一增强层传输至少另一声道,且所述基本层传输的声道的数量小于等于所述至少一增强层传输的声道的数量;所述基于参数立体声将数字音频信号分为一基本层和至少一增强层进一步包括:由所述基本层传输立体声道对缩混的单个声道,由所述至少一增强层传输参数立体声信息;所述基于残差分层结构将数字音频信号分为一基本层和至少一增强层进一步包括:根据基本层的码率要求对数字音频信号进行编码并将编码后的数据放入基本层;将数字音频信号与基本层解码恢复到的信号进行比较获得第一级残差信号并对所述第一级残差信号进行编码后放入第一级增强层;从上一级残差信号中去除上一级增强层解码恢复到的信号获得下一级残差信号并对所述 下一级残差信号进行编码后放入下一级增强层;其中,所述基于声道将数字音频信号分为一基本层和至少一增强层还进一步包括:在数据帧总字节数一定的前提下,基于基本层强调配置方案、均匀配置方案、近均匀配置方案或受限配置方案对所述一基本层和至少一增强层分别配置字节数;其中,所述基本层强调配置方案包括:分配给所述一基本层的字节数大于等于分配给所述至少一增强层的字节数;所述均匀配置方案包括:对所述一基本层和所述至少一增强层的每个全频带声道分配同样的字节数;所述近均匀配置方案包括:对所述基本层中每个全频带声道配置的字节数为(数据帧总字节数/基本层包含的全频带声道数),且(数据帧总字节数/2)>(数据帧总字节数/基本层包含的全频带声道数)>(数据帧总字节数/(基本层包含的全频带声道数+增强层包含的全频带声道数));对增强层中的一声道配置的字节数大于(数据帧总字节数*(1?1/基本层包含的全频带声道数))/增强层包含的全频带声道数,而对增强层中其余至少一声道配置的字节数小于(数据帧总字节数*(1?1/基本层包含的全频带声道数))/增强层包含的全频带声道数;所述受限配置方案包括:根据每一传输帧中LDPC编码的块大小、信道编码条件、所述基本层的特性和/或所述增强层的特性,对所述基本层和增强层分别配置字节数。...

【技术特征摘要】
1.一种数字音频粗分层编码方法,其特征在于,包括如下步骤: S1、将数字音频信号分为一基本层和至少一增强层; S2、对所述一基本层和至少一增强层分别进行编码; 其中, 所述步骤S1进一步包括: S11、对于单声道音频信号,基于频带或残差分层结构将其分为一基本层和至少一增强层; S12、对于立体声音频信号,基于频带、声道、参数立体声编码或残差分层结构将其分为一基本层和至少一增强层; S13、对于多声道音频信号,基于频带、声道、或残差分层结构将其分为一基本层和至少一增强层; 其中, 所述基于频带将数字音频信号分为一基本层和至少一增强层进一步包括:依次从低频到高频将每个频段的音频编码信息放入所述一基本层和至少一增强层; 所述基于声道将数字音频信号分为一基本层和至少一增强层进一步包括:由所述基本层传输至少一声道,由所述至少一增强层传输至少另一声道,且所述基本层传输的声道的数量小于等于所述至少一增强层传输的声道的数量; 所述基于参数立体声将数字音频信号分为一基本层和至少一增强层进一步包括:由所述基本层传输立体声道对缩混的单个声道,由所述至少一增强层传输参数立体声信息;所述基于残差分层结构将数字音频信号分为一基本层和至少一增强层进一步包括:根据基本层的码率要求对数字音频信号进行编码并将编码后的数据放入基本层;将数字音频信号与基本层解码恢复到的信号进行比较获得第一级残差信号并对所述第一级残差信号进行编码后放入第一级增强层;从上一级残差信号中去除上一级增强层解码恢复到的信号获得下一级残差信号并对所述下一级残差信号进行编码后放入下一级增强层; 其中,所述基于声道将数字音频信号分为一基本层和至少一增强层还进一步包括:在数据帧总字节数一定的前提下,基于基本层强调配置方案、均匀配置方案、近均匀配置方案或受限配置方案对所述一基本层和至少一增强层分别配置字节数; 其中, 所述基本层强调配置方案包括:分配给所述一基本层的字节数大于等于分配给所述至少一增强层的字节数; 所述均匀配置方案包括:对所述一基本层和所述至少一增强层的每个全频带声道分配同样的字节数; 所述近均匀配置方案包括:对所述基本层中每个全频带声道配置的字节数为(数据帧总字节数/基本层包含的全频带声道数),且(数据帧总字节数/2) > (数据帧总字节数/基本层包含的全频带声道数)> (数据帧总字节数/ (基本层包含的全频带声道数+增强层包含的全频带声道数));对增强层中的一声道配置的字节数大于(数据帧总字节数* (1-1/基本层包含的全频带声道数))/增强层包含的全频带声道数,而对增强层中其余至少一声道配置的字节数小于(数据帧总字节数* (1-1/基本层包含的全频带声道数))/增强层包含的全频带声道数;所述受限配置方案包括:根据每一传输帧中LDPC编码的块大小、信道编码条件、所述基本层的特性和/或所述增强层的特性,对所述基本层和增强层分别配置字节数。2.根据权利要求1所述的数字音频粗分层编码方法,其特征在于,所述步骤S2进一步包括:对所述一基本层和至少一增强层分别进行DRA编码。3.根据权利要求2所述的数字音频粗分层编码方法,其特征在于,所述步骤S2还进一步包括:对所述一基本层和至少一增强层中的任意全频带声道进行带宽扩展编码。4.根据权利要求3所述的数字音频粗分层编码方法,其特征在于,所述步骤S2还进一步包括:对所述一基本层和至少一增强层中的任意声道对进行参数立体声编码。5.根据权利要求4所述的数字音频粗分层编码方法,其特征在于,所述步骤SI进一步包括: 基于声道将5.1环绕声数字音频信号分为一基本层和一增强层,其中,由所述基本层传输立体声左声道和立体声右声道,由所述增强层传输中央声道、超重低音声道、左环绕声道和右环绕声道; 基于基本层强调配置方案或近均匀配置方案对所述基本层和增强层分别配置字节数; 所述步骤S2进一步包括: 使用带宽扩展编码技术和参数立体声编码技术对所述基本层中的立体声左声道和立体声右声道缩混的单个声道的低频带部分进行DRA编码; 使用带宽扩展编码技术对所述增强层中的中央声道进行DRA编码; 对所述增强层中的超重低音声道进行DRA编码; 使用带宽扩展编码技术和参数立体声编码技术对所述增强层中的左环绕声道和右环绕声道缩混的单个声道的高频部分进行DRA...

【专利技术属性】
技术研发人员:闫建新王磊
申请(专利权)人:深圳广晟信源技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1