立体声音频编/解码方法及编/解码器技术

技术编号:3044180 阅读:216 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种立体声音频编码方法,对左右声道的矢量语音信号进行旋转正交变换,提高两个矢量之间的相关度。本发明专利技术还提供相应的立体声音频解码方法以及立体声音频编/解码器。由于变换后的两个矢量具有较好的相关性,本发明专利技术使得后续的编码过程能够以低码率实现较高的音质,确保了编码增益的提高。与传统方法相比,能够在相同的码率下获得更高的音质,或者在同等音质下实现更低的码率。

【技术实现步骤摘要】

本专利技术涉及音频处理
,具体涉及数字立体声音频编/解码方法及 编/解码器。
技术介绍
立体声是指能使听者有声源在空间分布的感觉的声音信号。立体声音频在录制时通常被分配到两个独立的声道左声道和右声道,在重放时人耳通过分 辨来自左右声道的音频信号的强度差、延时等产生听觉的空间感。通常立体声信号主要有两个来源 一是采用双麦克风或多麦克风自然录 音,此时左右声道音频来自同一音频场景,除了由于麦克风摆位造成的时间差、 强度差等不同,他们记录的音频信息基本一致; 一是采用音频工作室人工混音, 由于在大多数情况下力求营造具有真实感的音频场景,因此这种方式下左右声 道间 一般也具有较强的相关性。在处理立体声音频信号时, 一般先对左右声道进行模/数(A/D: Analog/ Digital)采样得到数字立体声信号,本文中将左右声道的对应的数字信号表示 为两个矢量语音信号Xl和Xr,矢量的维数与采样数据点数相关;然后对XL和 XR进行编码。如何在尽可能低的编码码率下获得尽可能好的重现音质是始终 追求的目标之一。目前主要有两种立体声音频编码方法一、 和差立体声(Sum-difference Stereo)如图1所示,该方法将XL和XR在频域对应频率处进行相加和相减处理,分別得到和矢量信号Xs与差矢量信号Xd,然后分别对Xs和XD进行量化编码。 由图l可以看出,在较为理想的情况下,由于Xl和Xr差別不大,使得Xd能量 非O但明显小于Xs。因此可对与XL和XR类似的Xs以常规的码率进行编码,而 对Xo则以较小的码率进行编码。二、 强度立体声(Intensity Stereo )为了使码率进一步下降,在强度立体声方法中引入心理声学以去除声道间 的主观冗余。该方法中只编码一个声道的信号,例如Xl或Xr,以及另一个声道与之的能量比。在解码端重现出一个声道的信号,以及仅体现能量差异的另 一个信号。在对现有技术的研究和实践过程中,专利技术人发现实际的立体声信号由于受 环境噪音,墙体、地面的多次反射、折射和吸收,以及多声源的影响,在很多 时候并不接近图1所示的模型,而是表现为图2所示的情况,即差矢量信号Xo的能量并不明显小于原始的矢量语音信号XL和XR。此时,现有和差立体声 编码方法无法带来码率降低的效果,而强度立体声编码方法则会引入明显的失真。
技术实现思路
本专利技术提供一种能够有效提高编码增益的立体声音频编码方法以及相应 的解码方法和编/解码器。一种立体声音频编码方法,包括获取分别属于左声道和右声道的两个对 应的矢量语音信号;对所述两个矢量语音信号进行正交旋转变换,获得两个旋 转矢量信号;所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语 音信号之间的相关度;对所述旋转矢量信号进行编码;在编码结果中放入所述 正交旋转变换的旋转角度的信息。一种立体声音频解码方法,包括获取立体声音频编码码流;从所述编码 码流中获取旋转角度的信息;从所述编码码流中获取两个旋转矢量信号;按照 所述旋转角度对所述两个旋转矢量信号进行反向正交旋转变换,获得两个矢量 语音信号。一种立体声音频编码器,包括信号分析单元,用于输出分别属于左声道 和右声道的两个对应的矢量语音信号;旋转变换单元,用于对所述两个矢量语 音信号进行正交旋转变换,输出两个旋转矢量信号以及所述正交旋转变换的旋 转角度;所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语音信 号之间的相关度;编码单元,用于对输入的两个矢量信号进行编码,输出编码 结果;当输入的矢量信号为所述旋转变换单元输出的旋转矢量信号时,在输出 的编码结果中放入所述旋转变换单元输出的旋转角度的信息。一种立体声音频解码器,包括码流接收单元,用于获取立体声音频编码码流;解码单元,用于从所述编码码流中获取旋转角度的信息以及两个旋转矢 量信号并输出;反旋转变换单元,用于按照所述解码单元输出的旋转角度的信 息对所述解码单元输出的两个旋转矢量信号进行反向正交旋转变换,输出两个 矢量语音信号。本专利技术实施例采用对左右声道的矢量语音信号进行旋转正交变换,提高两 个矢量之间的相关度的方法;由于变换后的两个矢量具有较好的相关性,使得 后续的编码过程能够以低码率实现较高的音质,确保了编码增益的提高。与传 统方法相比,能够在相同的码率下获得更高的音质,或者在同等音质下实现更 低的码率。 附图说明图l是一种现有左右声道矢量声音信号和差示意图; 图2是另一种现有左右声道矢量声音信号和差示意图; 图3是本专利技术实施例一立体声音频编码方法流程示意图; 图4是本专利技术实施例一中正交旋转变换示意图; 图5是本专利技术实施例二立体声音频解码方法流程示意图; 图6是本专利技术实施例三立体声音频编码方法流程示意图; 图7是本专利技术实施例四立体声音频编码方法流程示意图; 图8是本专利技术实施例五立体声音频编码方法流程示意图; 图9是本专利技术实施例六立体声音频解码方法流程示意图; 图IO是本专利技术实施例七立体声音频编码器逻辑结构示意图; 图ll是本专利技术实施例八立体声音频解码器逻辑结构示意图; 图12是本专利技术实施例九立体声音频编码器逻辑结构示意图; 图13是本专利技术实施例十立体声音频编码器逻辑结构示意图; 图14是本专利技术实施例十一立体声音频编码器逻辑结构示意图; 图15是本专利技术实施例十二立体声音频解码器逻辑结构示意图。 具体实施例方式本专利技术实施例提供了 一种立体声音频编码方法,对左右声道的矢量语音信 号进行旋转正交变换,提高两个矢量之间的相关度。本专利技术实施例还提供相应的立体声音频解码方法和立体声音频编/解码器。以下分别进行详细说明。实施例一、 一种立体声音频编码方法,如图3所示,包括 Al 、获取分别属于左声道和右声道的两个对应的矢量语音信号。 对左右声道矢量语音信号的采集可参照现有方式进行。基于人耳的听觉特 性,可将左声道和右声道按频率划分为若干子带,获取分别属于左声道和右声 道的相同子带的两个矢量语音信号作为对应的矢量语音信号。以子带为单位进 行立体声音频处理的依据在于人的听觉可以用一个非均匀带宽的滤波器组描述,每个滤波器组通道被称 为一个子带。子带的带宽与人的听觉特性匹配,人耳对立体声的空间感主要来 自左右声道对应子带信号的整体特性,如强度差、延时等,而对子带信号的细 节不敏感。从低频到高频,子带的带宽不断增大,在理想的情况下与心理声学 中的关键带(Critical Band)或等效矩形带宽(Equivalent Rectangular Bandwidth, ERB)—致。因此根据心理声学,子带是最小的听觉单位,每个子带可以作为 一个独立的听觉单元,即可以以子带为单位进行立体声音频处理操作。获取子带的矢量语音信号可采用两类方法1、基于可重建滤波器组,如 滤波器多相滤波器组(PQMF: Polyphase Quadrature Mirror Filterbank); 2 、基 于时频变换,如快速傅立叶变换(FFT: Fast Fourier Transform )、离散余弦变 换(DCT: Discrete Cosine Transform)和修正离散余弦变换(MDCT: Modified Discrete Cosine Transform )等。将左右声道相同子带的采样数据按本文档来自技高网
...

【技术保护点】
一种立体声音频编码方法,其特征在于,包括: 获取分别属于左声道和右声道的两个对应的矢量语音信号; 对所述两个矢量语音信号进行正交旋转变换,获得两个旋转矢量信号;所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语音信号之间的相关度; 对所述旋转矢量信号进行编码; 在编码结果中放入所述正交旋转变换的旋转角度的信息。

【技术特征摘要】
1、一种立体声音频编码方法,其特征在于,包括获取分别属于左声道和右声道的两个对应的矢量语音信号;对所述两个矢量语音信号进行正交旋转变换,获得两个旋转矢量信号;所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语音信号之间的相关度;对所述旋转矢量信号进行编码;在编码结果中放入所述正交旋转变换的旋转角度的信息。2、 根据权利要求l所述的立体声音频编码方法,其特征在于,所述左声道 和右声道按频率划分为若干子带,所述获取分别属于左声道和右声道的两个对 应的矢量语音信号的步骤具体为获取分别属于左声道和右声道的相同子带的 两个矢量语音信号。3、 根据权利要求l所述的立体声音频编码方法,其特征在于,在所述对两 个矢量语音信号进行正交旋转变换的步骤之前还包括判断需要对所述两个矢 量语音信号进行正交旋转变换;在所述对旋转矢量信号进行编码的步骤之后还包括在所述编码结果中设 置已进行正交旋转变换的标识。4、 根据权利要求3所述的立体声音频编码方法,其特征在于,所述判断需 要对两个矢量语音信号进行正交旋转变换的步骤具体为计算所述两个矢量语 音信号的相关度,当相关度小于设定阈值时,确定需要进行所述正交旋转变换。5、 根据权利要求l所述的立体声音频编码方法,其特征在于,在所述对两 个矢量语音信号进行正交旋转变换的步骤之后还包括比较所述两个旋转矢量 信号之间的相关度相对所述两个矢量语音信号之间的相关度的增加量,根据所 述增加量判断需要对所述旋转矢量信号进行后续的编码操作;在所述对旋转矢量信号进行编码的步骤之后还包括在所述编码结果中设 置已进行正交旋转变换的标识。6、 根据权利要求l所述的立体声音频编码方法,其特征在于,在所述对旋 转矢量信号进行编码的步骤之后还包括将在未采用所述正交旋转变换的情况下对所述两个矢量语音信号进行编 码的结果,与所述对旋转矢量信号进行编码的结果进行比较,根据比较结果判断需要采用所述对旋转矢量信号进行编码的结果;在所采用的编码结果中设置已进行正交旋转变换的标识。7、根据权利要求1 6任意一项所述的立体声音频编码方法,其特征在于, 所述对两个矢量语音信号进行正交旋转变换的步骤具体为按照旋转角度e执 行所述正交旋转变换,cos 9 sin0 一sin9 cos 9,其中,e的值在[-7i/2,V2]之间表示为,<formula>formula see original document page 3</formula>X^和XR表示所述两个矢量语音信号;Yo和Yi表示所述两个旋转语音信号; 〈xl, x2〉表示矢量xl和x2的标量积。8、 根据权利要求7所述的立体声音频编码方法,其特征在于,所述对旋转 矢量信号进行编码的步骤包括计算所述两个旋转矢量信号的和与差,获得和矢量信号与差矢量信号; 对所述和矢量信号与差矢量信号分别进行量化编码。9、 根据权利要求7所述的立体声音频编码方法,其特征在于,所述对旋转 矢量信号进行编码的步骤具体为对所述两个旋转矢量信号中的任意一个进行 量化编码。10、 一种立体声音频解码...

【专利技术属性】
技术研发人员:张树华窦维蓓张斌侯欢郭利斌王庭红肖玮
申请(专利权)人:华为技术有限公司清华大学
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1