当前位置: 首页 > 专利查询>武汉大学专利>正文

一种空间参数立体声编解码方法及其装置制造方法及图纸

技术编号:3688516 阅读:165 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了空间参数立体声编解码方法及装置:编码端首先将立体声左右声道信号在时域或频域下混,然后下混信号传送到变换编码器产生单声道编码数据,同时提取包含量化误差的下混信号,并根据其短时频谱特性将其变换域划分为连续且不重叠的子带,以子带为单位提取左右声道的空间参数。解码端根据变换编码数据,生成与编码端一致的包含量化误差的下混信号并采用同样的划分方法得到子带划分,然后根据空间参数信息重建立体声左右声道子带信号,反变换输出时域立体声信号。与现有技术相比,本发明专利技术没有正反变换带来的附加延时并且可在不传送子带划分信息的条件下实现动态的时频划分,提高了空间参数立体声编解码的实时性和效率。

【技术实现步骤摘要】

本专利技术属于数字音频压縮编码领域,特别涉及一种以参数表示空间信息的 立体声编解码系统和装置。技术背景数字音频编码起源于20世纪80年代末,以MP3(MPEG-1 Layer III)和 AAC(Advanced Audio Coding)为典型代表。此时编码技术在立体声的处理方面 考虑声道间的相关性,采用和差(Mid/Side)立体声或强度立体声(Intensity Stereo) 处理技术,然后对处理后的两路完整的音频信号采用独立的编码方法,因此码 率与声道数基本成正比。2002年C. Faller等人提出了一种基于空间心理声学的参数立体声编解码系 统BCC(Binaural Cue Coding)。此系统在变换域提取声道间强度差ILD (Interchannel Level Difference),声道间时间差ITD(Interchannel Time Difference), 和声道间相关度IC(Interchannel Coherence),其解码器根据这些参数和下混声道 重建多声道的输出。2004年J. Breebaart等人提出参数立体声PS(Parametric Stereo) 编解码系统,2005年MPEG推出MPEG环绕声(MPEG Surround)系统都是以 BCC为基础发展起来的立体声/多声道编解码系统,其核心架构与BCC系统一 致。上述空间参数编解码系统相对于只采用和差立体声和强度立体声技术的 MP3/AAC等编解码系统,在性能上有明显的提升以单声道的码率达到立体声的音质,因此在对音质和码流要求严格的音频广播和移动音频中得到应用。但 是这些空间参数编解码系统最突出的问题是延时增加,编解码端的时频分析模块引入了至少一帧的延时,通常在20ms到40ms之间,不利于双向实时通信。 因此减小空间参数立体声编解码的延时是本领域亟待解决的问题。BCC、 PS、和MPEG Surround的另一个问题是难于实现动态的时频划分。 根据空间心理声学,ILD、 ITD、和IC只有针对同一或空间上连续的声源才有明 确的意义。上述空间参数编码系统都采用子带划分的方式来区分信号中不同的 声源进而提取空间参数,为了避免传送子带划分信息带来的码率增加,这种划 分是静态的且独立于信号特性的。由于实际信号中各个声源的频谱范围是动态 的,这种方式降低了空间参数编码的效率。因此在不增加码率的情况下实现动 态的时频划分是本领域亟待解决的另 一个问题。
技术实现思路
本专利技术的目的在于解决现有空间参数编解码系统的不足,提供一种无附加 延时且支持动态时频划分的空间参数立体声编解码方法及其装置,减少系统延 时并提高立体声信号压缩的效率。本专利技术的编码技术解决方案包括以下步骤 步骤l,对输入的左右两路时域音频信号进行下混,生成一路信号; 步骤2,对得到的下混信号进行变换音频编码,生成下混信号的编码数据; 步骤3,获得与下混信号的编码数据对应的下混信号的反量化频谱; 步骤4,分析频域反量化的下混信号,将频谱划分成若干连续且无重叠的子带;步骤5,以划分的子带为单位,提取输入的左右两路信号在频域每个子带的空间参数信息,生成空间参数编码数据;步骤6,将下混信号的编码数据和空间参数编码数据按一定格式组合成一路 编码码流。而且,步骤1所述的下混是在时域操作,即取左右两路音频信号的时域平 均值作为下混信号,其中时域平均值是两路信号在同一时刻处的样点值之和的一半。而且,步骤1所述的下混是在频域操作,即取左右两路音频信号的频域平 均值或乘以增益系数,得到频域下混信号,其中频域平均值是两路信号在同一 频点处的谱线值之和的一半,增益系数是为了调整下混信号能量而在平均值之 上乘的一个正的实数。而且,步骤3所述的下混信号的反量化频谱,通过对下混信号的编码数据 进行解码获得;或者当变换编码过程中生成了下混信号的反量化频谱时,直接 从编码过程中获得。本专利技术还提供了相应的空间参数立体声解码方法,依次包含以下步骤 步骤I ,将合成码流分离成下混信号编码数据和空间参数编码数据;步骤n,对下混信号编码数据进行变换音频解码,生成频域反量化的下混信号,同时将此信号的频谱划分成若干连续且无重叠的子带;步骤m,根据空间参数编码数据和频域反量化的下混信号,以步骤II划分的 子带为单位,生成两路包含频域音频信号,这两路频域音频信号包含空间参数 编码数据给定的空间信息;步骤IV,对两路频域音频信号,进行时频逆变换或综合滤波器组滤波,生成 左右两路时域音频信号。本专利技术提供了一种与空间参数立体声编码方法相应的装置,由下混模块、 核心编码模块、核心解码模块、动态时频划分模块、分析滤波器组、参数提取 模块和码流成型模块组成,左右两路时域音频信号输入下混模块和分析滤波器 组,下混模块的输出接入核心编码器,核心编码器的输出接入核心解码模块, 核心解码模块输出接入动态时频划分模块,动态时频划分模块和分析滤波器组 的输出接入参数提取模块,核心编码模块的输出和参数提取模块的输出接入码 流成型模块。而且,所述核心编码模块采用AAC编码器。本专利技术也提供了一种与空间参数立体声解码方法相应的装置,由码流解析 模块、核心解码模块、动态时频划分模块、参数合成模块和综合滤波器组组成, 合成码流输入码流解析模块后分离出核心解码数据和空间参数数据,核心解码 数据输入核心解码模块,核心解码模块的输出经动态时频划分模块后和空间参 数数据共同输入参数合成模块,参数合成模块的输出接入综合滤波器。本专利技术将输入的立体声信号直接在时域下混或利用核心编码的时频变换工 具在频域下混成一路信号作为核心编码器的输入,从而避免单独的时频正反变 换带来的附加延时;基于分析综合法,空间参数的提取位于核心编码之后,并且根据编码后反量化的数据进行动态的时频划分,然后提取每个划分单元的空 间参数,由于编码后反量化的数据在解码端可以精确复现,因此只要解码端采 用相同的时频划分方法,无需传送划分信息,就可以得到与编码端一致的时频 划分,并以每个划分单元为单位根据空间参数合成立体声左右两路信号。本发 明不仅降低了空间参数编解码系统的延时,而且可以实现在不传送频谱划分信 息条件下的动态时频划分,使空间参数立体声的编解码实时性和效率都有显著提咼° 附图说明图l是本专利技术实施例空间参数编码流程,其中图la为时域下混情况,图lb 为频域下混情况;图2是本专利技术实施例空间参数解码流程;图3是本专利技术空间参数立体声编解码装置基本结构;图4是本专利技术实施例采用AAC为核心编码的编码装置结构图;图5是本专利技术实施例采用AAC为核心解码的解码装置结构图。具体实施方式本专利技术提供的空间参数立体声编码方法包括以下步骤步骤1,对输入的左 右两路时域音频信号进行下混,生成一路信号;步骤2,对得到的下混信号进行变换音频编码,生成下混信号的编码数据;步骤3,获得与下混信号的编码数据对应的下混信号的反量化频谱;步骤4,分析频域反量化的下混信号,将频谱划分成若干连续且无重叠的子带;步骤5,以划分的子带为单位,提取输入的左右两路信号在频域每个子带的 空间参数信息,生成空间参数编码数据;步骤6,将下混信号的编码数据和空间参数编码数据按一定格式组合成一路 编码码流。具体实施时一般首先对相本文档来自技高网
...

【技术保护点】
一种空间参数立体声编码方法,其特征在于包括以下步骤:步骤1,对输入的左右两路时域音频信号进行下混,生成一路信号;步骤2,对得到的下混信号进行变换音频编码,生成下混信号的编码数据;步骤3,获得与下混信号的编码数据对应的 下混信号的反量化频谱;步骤4,分析频域反量化的下混信号,将频谱划分成若干连续且无重叠的子带;步骤5,以划分的子带为单位,提取输入的左右两路信号在频域每个子带的空间参数信息,生成空间参数编码数据;步骤6,将下混信号的编 码数据和空间参数编码数据按一定格式组合成一路编码码流。

【技术特征摘要】

【专利技术属性】
技术研发人员:胡瑞敏陈水仙艾浩军涂卫平曹晟王恒李璇周婷
申请(专利权)人:武汉大学
类型:发明
国别省市:83[中国|武汉]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利