一种数字音频粗分层编码方法和装置制造方法及图纸

技术编号：8834990 阅读：143 留言：0更新日期：2013-06-22 20:56

本发明专利技术涉及一种数字音频粗分层编码方法和装置。所述方法包括：S1、将数字音频信号分为一基本层和至少一增强层；S2、对所述一基本层和至少一增强层分别进行编码；所述步骤S1进一步包括：S11、对于单声道音频信号，基于频带或残差分层结构将其分为一基本层和至少一增强层；S12、对于立体声音频信号，基于频带、声道、参数立体声编码或残差分层结构将其分为一基本层和至少一增强层；S13、对于多声道音频信号，基于频带、声道、或残差分层结构将其分为一基本层和至少一增强层。本发明专利技术避免了精细分层引起的编码效率下降，实现简单，能获取最佳综合声音质量，易于满足信道编码要求，并且不需要精细分层时的各种限制条件，保证更高效率的压缩。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音频编解码技术，更具体地说，涉及一种数字音频粗分层编码方法和>J-U ρ α装直。
技术介绍
在分层音频编码上，已经存在通过精细分层方式进行的有损数字音频编码技术及无损音频编码技术。例如，IS0/IEC14496-3MPEG-4BSAC (Bit sliced arithmetic coding)比特片算术编码便提出了精细分层技术。在这种编码算法中，基于对MDCT (ModifiedDiscrete Cosine Transform,修正离散余弦变换)变换后的变换域系数(频谱系数)被量化为整数后，从低频到高频分成多个组，每个组谱系数从高位到低位形成比特片方式进行算术编码，因此可以实现非常精细的分层(或者伸缩)编码。但是为了精细分层，需要考虑限制频谱分区长度等，从而导致降低编码效率。例如，在AVS (Audio Video coding Standard Workgroup of China)中米用的类似于MPEG-4BSAC的编码方法，其中熵编码算法从算术编码换成了霍夫曼编码，编码原理相同。在MPEG-4第三部分和MPEG-2第七部分中都提供了可伸缩采样率编码算法AAC-SSRCAdvanced Audio Coding-Scalable Sampling Rate),首先是由 Sony提出的，编码架构也类似于其独有的ARTAC (Adaptive Transform Acoustic Coding)编码。该编码算法首先将输入的数字音频信号通过4带的多相正交滤波器组(PQF, Polyphase QuadratureFilter)分...

【技术保护点】
一种数字音频粗分层编码方法，其特征在于，包括如下步骤：S1、将数字音频信号分为一基本层和至少一增强层；S2、对所述一基本层和至少一增强层分别进行编码；其中，所述步骤S1进一步包括：S11、对于单声道音频信号，基于频带或残差分层结构将其分为一基本层和至少一增强层；S12、对于立体声音频信号，基于频带、声道、参数立体声编码或残差分层结构将其分为一基本层和至少一增强层；S13、对于多声道音频信号，基于频带、声道、或残差分层结构将其分为一基本层和至少一增强层；其中，所述基于频带将数字音频信号分为一基本层和至少一增强层进一步包括：依次从低频到高频将每个频段的音频编码信息放入所述一基本层和至少一增强层；所述基于声道将数字音频信号分为一基本层和至少一增强层进一步包括：由所述基本层传输至少一声道，由所述至少一增强层传输至少另一声道，且所述基本层传输的声道的数量小于等于所述至少一增强层传输的声道的数量；所述基于参数立体声将数字音频信号分为一基本层和至少一增强层进一步包括：由所述基本层传输立体声道对缩混的单个声道，由所述至少一增强层传输参数立体声信息；所述基于残差分层结构将数字音频信号分为一基本层和至少一...

【技术特征摘要】
1.一种数字音频粗分层编码方法，其特征在于，包括如下步骤: S1、将数字音频信号分为一基本层和至少一增强层； S2、对所述一基本层和至少一增强层分别进行编码；其中，所述步骤S1进一步包括: S11、对于单声道音频信号，基于频带或残差分层结构将其分为一基本层和至少一增强层； S12、对于立体声音频信号，基于频带、声道、参数立体声编码或残差分层结构将其分为一基本层和至少一增强层； S13、对于多声道音频信号，基于频带、声道、或残差分层结构将其分为一基本层和至少一增强层；其中，所述基于频带将数字音频信号分为一基本层和至少一增强层进一步包括:依次从低频到高频将每个频段的音频编码信息放入所述一基本层和至少一增强层；所述基于声道将数字音频信号分为一基本层和至少一增强层进一步包括:由所述基本层传输至少一声道，由所述至少一增强层传输至少另一声道，且所述基本层传输的声道的数量小于等于所述至少一增强层传输的声道的数量；所述基于参数立体声将数字音频信号分为一基本层和至少一增强层进一步包括:由所述基本层传输立体声道对缩混的单个声道，由所述至少一增强层传输参数立体声信息；所述基于残差分层结构将数字音频信号分为一基本层和至少一增强层进一步包括:根据基本层的码率要求对数字音频信号进行编码并将编码后的数据放入基本层；将数字音频信号与基本层解码恢复到的信号进行比较获得第一级残差信号并对所述第一级残差信号进行编码后放入第一级增强层；从上一级残差信号中去除上一级增强层解码恢复到的信号获得下一级残差信号并对所述下一级残差信号进行编码后放入下一级增强层；其中，所述基于声道将数字音频信号分为一基本层和至少一增强层还进一步包括:在数据帧总字节数一定的前提下，基于基本层强调配置方案、均匀配置方案、近均匀配置方案或受限配置方案对所述一基本层和至少一增强层分别配置字节数；其中，所述基本层强调配置方案包括:分配给所述一基本层的字节数大于等于分配给所述至少一增强层的字节数；所述均匀配置方案包括:对所述一基本层和所述至少一增强层的每个全频带声道分配同样的字节数；所述近均匀配置方案包括:对所述基本层中每个全频带声道配置的字节数为(数据帧总字节数/基本层包含的全频带声道数)，且(数据帧总字节数/2) > (数据帧总字节数/基本层包含的全频带声道数)> (数据帧总字节数/ (基本层包含的全频带声道数+增强层包含的全频带声道数));对增强层中的一声道配置的字节数大于(数据帧总字节数* (1-1/基本层包含的全频带声道数))/增强层包含的全频带声道数，而对增强层中其余至少一声道配置的字节数小于(数据帧总字节数* (1-1/基本层包含的全频带声道数))/增强层包含的全频带声道数；所述受限配置方案包括:根据每一传输帧中LDPC编码的块大小、信道编码条件、所述基本层的特性和/或所述增强层的特性，对所述基本层和增强层分别配置字节数。2.根据权利要求1所述的数字音频粗分层编码方法，其特征在于，所述步骤S2进一步包括:对所述一基本层和至少一增强层分别进行DRA编码。3.根据权利要求2所述的数字音频粗分层编码方法，其特征在于，所述步骤S2还进一步包括:对所述一基本层和至少一增强层中的任意全频带声道进行带宽扩展编码。4.根据权利要求3所述的数字音频粗分层编码方法，其特征在于，所述步骤S2还进一步包括:对所述一基本层和至少一增强层中的任意声道对进行参数立体声编码。5.根据权利要求4所述的数字音频粗分层编码方法，其特征在于，所述步骤SI进一步包括: 基于声道将5.1环绕声数字音频信号分为一基本层和一增强层，其中，由所述基本层传输立体声左声道和立体声右声道，由所述增强层传输中央声道、超重低音声道、左环绕声道和右环绕声道；基于基本层强调配置方案或近均匀配置方案对所述基本层和增强层分别配置字节数；所述步骤S2进一步包括: 使用带宽扩展编码技术和参数立体声编码技术对所述基本层中的立体声左声道和立体声右声道缩混的单个声道的低频带部分进行DRA编码；使用带宽扩展编码技术对所述增强层中的中央声道进行DRA编码；对所述增强层中的超重低音声道进行DRA编码；使用带宽扩展编码技术和参数立体声编码技术对所述增强层中的左环绕声道和右环绕声道缩混的单个声道的高频部分进行DRA...

【专利技术属性】
技术研发人员：闫建新，王磊，
申请(专利权)人：深圳广晟信源技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人