立体声音频编／解码方法及编／解码器技术

技术编号：3044180 阅读：216 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种立体声音频编码方法，对左右声道的矢量语音信号进行旋转正交变换，提高两个矢量之间的相关度。本发明专利技术还提供相应的立体声音频解码方法以及立体声音频编／解码器。由于变换后的两个矢量具有较好的相关性，本发明专利技术使得后续的编码过程能够以低码率实现较高的音质，确保了编码增益的提高。与传统方法相比，能够在相同的码率下获得更高的音质，或者在同等音质下实现更低的码率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音频处理
，具体涉及数字立体声音频编/解码方法及编/解码器。
技术介绍
立体声是指能使听者有声源在空间分布的感觉的声音信号。立体声音频在录制时通常被分配到两个独立的声道左声道和右声道，在重放时人耳通过分辨来自左右声道的音频信号的强度差、延时等产生听觉的空间感。通常立体声信号主要有两个来源一是采用双麦克风或多麦克风自然录音，此时左右声道音频来自同一音频场景，除了由于麦克风摆位造成的时间差、强度差等不同，他们记录的音频信息基本一致；一是采用音频工作室人工混音，由于在大多数情况下力求营造具有真实感的音频场景，因此这种方式下左右声道间一般也具有较强的相关性。在处理立体声音频信号时，一般先对左右声道进行模/数(A/D: Analog/ Digital)采样得到数字立体声信号，本文中将左右声道的对应的数字信号表示为两个矢量语音信号Xl和Xr,矢量的维数与采样数据点数相关；然后对XL和 XR进行编码。如何在尽可能低的编码码率下获得尽可能好的重现音质是始终追求的目标之一。目前主要有两种立体声音频编码方法一、和差立体声(Sum-difference Stereo)如图1所示，该方法将XL和XR在频域对应频率处进行相加和相减处理，分別得到和矢量信号Xs与差矢量信号Xd，然后分别对Xs和XD进行量化编码。由图l可以看出，在较为理想的情况下，由于Xl和Xr差別不大，使得Xd能量非O但明显小于Xs。因此可对与XL和XR类似的Xs以常规的码率进行编码，而对Xo则以较小的码率进行编码。二、强度立体声(Intensity Ster...

【技术保护点】
一种立体声音频编码方法，其特征在于，包括：　获取分别属于左声道和右声道的两个对应的矢量语音信号；　对所述两个矢量语音信号进行正交旋转变换，获得两个旋转矢量信号；所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语音信号之间的相关度；　对所述旋转矢量信号进行编码；　在编码结果中放入所述正交旋转变换的旋转角度的信息。

【技术特征摘要】
1、一种立体声音频编码方法，其特征在于，包括获取分别属于左声道和右声道的两个对应的矢量语音信号；对所述两个矢量语音信号进行正交旋转变换，获得两个旋转矢量信号；所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语音信号之间的相关度；对所述旋转矢量信号进行编码；在编码结果中放入所述正交旋转变换的旋转角度的信息。2、根据权利要求l所述的立体声音频编码方法，其特征在于，所述左声道和右声道按频率划分为若干子带，所述获取分别属于左声道和右声道的两个对应的矢量语音信号的步骤具体为获取分别属于左声道和右声道的相同子带的两个矢量语音信号。3、根据权利要求l所述的立体声音频编码方法，其特征在于，在所述对两个矢量语音信号进行正交旋转变换的步骤之前还包括判断需要对所述两个矢量语音信号进行正交旋转变换；在所述对旋转矢量信号进行编码的步骤之后还包括在所述编码结果中设置已进行正交旋转变换的标识。4、根据权利要求3所述的立体声音频编码方法，其特征在于，所述判断需要对两个矢量语音信号进行正交旋转变换的步骤具体为计算所述两个矢量语音信号的相关度，当相关度小于设定阈值时，确定需要进行所述正交旋转变换。5、根据权利要求l所述的立体声音频编码方法，其特征在于，在所述对两个矢量语音信号进行正交旋转变换的步骤之后还包括比较所述两个旋转矢量信号之间的相关度相对所述两个矢量语音信号之间的相关度的增加量，根据所述增加量判断需要对所述旋转矢量信号进行后续的编码操作；在所述对旋转矢量信号进行编码的步骤之后还包括在所述编码结果中设置已进行正交旋转变换的标识。6、根据权利要求l所述的立体声音频编码方法，其特征在于，在所述对旋转矢量信号进行编码的步骤之后还包括将在未采用所述正交旋转变换的情况下对所述两个矢量语音信号进行编码的结果，与所述对旋转矢量信号进行编码的结果进行比较，根据比较结果判断需要采用所述对旋转矢量信号进行编码的结果；在所采用的编码结果中设置已进行正交旋转变换的标识。7、根据权利要求1 6任意一项所述的立体声音频编码方法，其特征在于，所述对两个矢量语音信号进行正交旋转变换的步骤具体为按照旋转角度e执行所述正交旋转变换，cos 9 sin0 一sin9 cos 9,其中，e的值在[-7i/2,V2]之间表示为，<formula>formula see original document page 3</formula>X^和XR表示所述两个矢量语音信号；Yo和Yi表示所述两个旋转语音信号；〈xl, x2〉表示矢量xl和x2的标量积。8、根据权利要求7所述的立体声音频编码方法，其特征在于，所述对旋转矢量信号进行编码的步骤包括计算所述两个旋转矢量信号的和与差，获得和矢量信号与差矢量信号；对所述和矢量信号与差矢量信号分别进行量化编码。9、根据权利要求7所述的立体声音频编码方法，其特征在于，所述对旋转矢量信号进行编码的步骤具体为对所述两个旋转矢量信号中的任意一个进行量化编码。10、一种立体声音频解码...

【专利技术属性】
技术研发人员：张树华，窦维蓓，张斌，侯欢，郭利斌，王庭红，肖玮，
申请(专利权)人：华为技术有限公司，清华大学，
类型：发明
国别省市：94[中国|深圳]

全部详细技术资料下载我是这个专利的主人