当前位置: 首页 > 专利查询>北京大学专利>正文

一种基于正交解相关技术的参数立体声编码、解码方法技术

技术编号:9853833 阅读:132 留言:0更新日期:2014-04-02 17:47
本发明专利技术公开了一种基于正交解相关技术的参数立体声编码、解码方法。本编码方法:1)将输入的左声道、右声道时域信号分别变换到复频域,得到两复频域信号L和R;2)对L和R输出为一个下混信号M;3)利用L和R估算出边信息,并对所述边信息进行融合量化;所述边信息包括声道内互相关系数ICC、声道间强度差IID和旋转方位信息RD;4)对M时域反变换并编码输出;将边信息压缩编码输出。解码方法:将输入的时域下混信号变换到复频域输出信号M;对输入的边信息进行解码;根据RD求解一与M幅值相等且正交的输出信号D;根据ICC、IID计算旋转矩阵H;利用H、M及D得到复频域信号L和R变化到时域输出。本发明专利技术大大提高了解码速度。

【技术实现步骤摘要】
—种基于正交解相关技术的参数立体声编码、解码方法
本专利技术属于音频压缩领域,涉及一种参数立体声编码、解码方法,尤其涉及。
技术介绍
多媒体技术兴起于80年代末期,是近年来计算机领域中热门的技术之一。数字音频编解码技术采用计算机的数字记录和传输传送方式,对各种媒体进行处理,具有广泛的用途。但受限于网络带宽和存储空间,如何在保证高质量听感下将原始数据压缩为尽量少的比特数成为研究热点。音频文件之所以可以压缩,是因为存在冗余,传统压缩算法主要考虑消除声道内冗余,在不考虑声道间冗余时,由于多声道音频文件的码率与声道数是线性关系,声道数的增加会导致码率成倍增加。从1993年MP3开始,人们逐渐发现声道间也是存在冗余并且开始尝试消除声道间冗余,逐步解决了在保持较高主观听感的条件下实现超低码率的问题。现有的消除声道间冗余的方法主要有如下3种:1>联合立体声是MPEG-1、MEPG-2/4AAC等音频编解码国际标准中的重要组成部分,包括和差变换编码与强度立体声两种立体声编解码技术。(I)和差变换编码也被称为MS编码,是Middle-Side编码的简称。编码端将原始左右声道信号转换为和差信号,解码端做相应逆变换。该方法利用声道间相关性,将信号能量集中在和声道上,以此去除声道间冗余。但该方法压缩效率严重依赖信号本身特性,只有在原始左右声道相关性很强的情况下才能得到较高的压缩率。(2)强度立体声强度立体声基本思想是通过将原始信号空间的坐标轴进行旋转,得到主轴的强度信号和与之正交的残差信号。在编码端,丢弃与主轴正交的残差信号而只对强度信号和坐标轴旋转角度α进行量化编码。在解码端,根据角度α和强度信号,对坐标轴作逆旋转,重构出左右声道的立体声信号。这样重构得到的左右声道信号只是幅度不同,而相位信息一致。但是通过乘以相应的幅度比例因子,可以较好地保存原信号能量一时间包络。这样的处理方式符合人耳听觉系统对各声道信号高频成分的相位差异及其精细结构不敏感,而随时间变化的能量包络相对重要的感知特点,因此不会明显降低重构立体声信号的主观质量。2>双耳线索编码2002 年 C.Faller 提出 了名为双耳线索编码(Binaural Cue Coding,BCC)的编解码技术,其出发点和传统立体声编码技术不同,是一种基于空间听觉理论的参数编码技术。立体声或者多声道输入信号下混成单声道信号,同时根据空间听觉特性,对各个声道在变换域进行分析,提取三种空间参数:声道间强度差(Inter-channel IntensityDifference, IID)、声道间时间差(Inter-channel Time Difference, ITD)及声道间相关性(Inter-Channel Coherence, ICC)。在这里IID及ITD与传统的空间听觉线索缩写相同但含义不同,相应缩写都是指声道间参数而非听觉线索。下混信号可以使用传统的音频编码器来进行编码,参数经过量化编码后作为辅助部分嵌入到比特流中。在解码端,解码后的下混信号利用相应的空间参数来重构立体声或多声道音频信号。双耳线索编码最大的特点就是能够提供极高的压缩率和任意声道形式的压缩编码,可看作是一种对强度立体声的发展,但是其克服了强度立体声编码的缺陷,具有以下几个明显优点:强度立体声编码实际只利用IID进行重构,因此仅对高频范围有效,若将强度立体声拓展到低频则会引入严重的噪声,而双耳线索编码利用IID及ITD进行重构,在全频谱范围内进行处理也不会产生严重噪声;另外强度立体声编码不能重构具有宽度立体声声像的音频信号,而双耳线索编码则可以利用ICC对其进行很好的重构。3>参数立体声飞利浦公司的J.Breebaart等人于2004年提出了名为参数立体声(ParametricStereo,PS)的编解码技术。基本思路是在编码端输出一个单声道信号和若干空间参数,在解码端利用单声道信号和空间参数重构双声道立体声信号,是目前消除声道间冗余最优秀的方法之一。已经被 MPEG-4 及 3GPP (3rd Generation Partnership Project)米纳为相应音频编码国际标准中的组成部分。在参数立体声的编码端,将输入的左右声道信号分别经过混合正交镜像分析滤波器组,各滤波器的输出经过降采样,获得分带后的复频域信号。利用左右声道各子带的复频域信号估算出相应的空间参数并量化输出,同时将其加和生成单声道下混信号,通过混合正交镜像合成滤波器组再变换回时域信号。参数立体声编码的基本原理如图1所示。参数立体声解码也是通过混合正交镜像分析滤波器组将时域信号转换到复频域来进行处理的,因此不再赘述混合正交镜像滤波器组的相关内容。参数立体声解码是由下混信号结合相应的空间参数来合成环境声(Synthetic Ambience),最终重构双声道立体声信号的过程。参数立体声解码原理如图2所示。在参数立体声解码端,解相关模块的作用是利用输入的单声道下混信号M生成相应的解相关输出信号D。为了能精确恢复原信号,D应该和M正交,具体实现中,参数立体声的采用频带不同而改变的小数化延迟(Fractional Delay)、全通滤波器(All-passFilter)模块。由于全通滤波器不能对相位进行精确控制,因此会影响D和M的正交性,导致重构的信号存在较大的误差。
技术实现思路
针对现有技术中存在的技术问题,本专利技术的目的在于提供一种精确解相关方法,基于此方法建立的参数立体声编解码方法,在解码端更精确的恢复编码端输入的双声道信号。本专利技术的技术方案为:一种基于正交解相关技术的参数立体声编码方法,其步骤为:I)将输入的左声道、右声道时域信号分别变换到复频域,得到两复频域信号L和R;2)对两复频域信号L和R进行下混加和输出为一个下混信号M ;3)利用复频域信号L和R估算出边信息,并对所述边信息进行融合量化;所述边信息包括声道内互相关系数ICC、声道间强度差IID和旋转方位信息RD ;4)对下混信号M进行时域反变换,得到时域信号并编码输出;将所述边信息压缩编码输出。进一步的,利用公式本文档来自技高网
...

【技术保护点】
一种基于正交解相关技术的参数立体声编码方法,其步骤为:1)将输入的左声道、右声道时域信号分别变换到复频域,得到两复频域信号L和R;2)对两复频域信号L和R进行下混加和输出为一个下混信号M;3)利用复频域信号L和R估算出边信息,并对所述边信息进行融合量化;所述边信息包括声道内互相关系数ICC、声道间强度差IID和旋转方位信息RD;4)对下混信号M进行时域反变换,得到时域信号并编码输出;将所述边信息压缩编码输出。

【技术特征摘要】
1.一种基于正交解相关技术的参数立体声编码方法,其步骤为: 1)将输入的左声道、右声道时域信号分别变换到复频域,得到两复频域信号L和R; 2)对两复频域信号L和R进行下混加和输出为一个下混信号M; 3)利用复频域信号L和R估算出边信息,并对所述边信息进行融合量化;所述边信息包括声道内互相关系数ICC、声道间强度差IID和旋转方位信息RD ; 4)对下混信号M进行时域反变换,得到时域信号并编码输出;将所述边信息压缩编码输出。2.如权利要求1所述的编码方法,其特征在于利用公式 3.如权利要求1所述的编码方法,其特征在于利用公式 4.如权利要求1所述的编码方法,其特征在于利用公式 5.如权利要求1~4任一所述的编码方法,其特征在于以左右声道复频域信号的能量和作为权重对所述边信息RD,ICC、IID进行压缩编码。6.如权利要求5所述的编码方法,其特征在于根据听觉等效矩形带宽对所述边信息在频域上进行融合;所述声道内互相关系数ICC量化为3bit、声道间强度差IID量化为5bit、旋转方位信息RD量化为Ibit。7.一种基于正交解相关技术的参数立体声解码方法,其步骤为: O将输入的时域下混信号变换到复频域,输出一复频域下混信号M ;对输入的边信息进行解码,得到声道内互相关系数ICC、声道间强度差IID和旋转方位信息RD ; 2)针对每一复频域下混信号M,根据旋转方位信息RD求解一...

【专利技术属性】
技术研发人员:曲天书吴玺宏黄益超黄庆博
申请(专利权)人:北京大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1