用较少的计算量重构高频分量的声频解码方法和装置制造方法及图纸

技术编号:3046744 阅读:220 留言:0更新日期:2012-04-11 18:40
一种在解码声频数据时产生高频分量的方法,包括步骤:    利用第一和第二声道信号之间的相似性,产生高频分量。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及声频编码方法和装置,特别涉及一通过用较少的计算量重构声频信号的高频分量而能够获得和输出高质量的声频信号的声频解码方法和装置。
技术介绍
一般,在声频编码中使用心理声学模型高效地压缩声频数据,使得少量位分配到人耳不能收听的高频分量中。此时,增加了压缩比,但是损失了高频声信号。由于损失高频声信号,所以在再现声频数据时,声音的音调改变,可读性降低,产生模糊的声音。因此,需要后处理方法,重构损失的高频分量来加强声音质量,以便完全地再现原始声音的音调和提高声频信号的可读性。结合图1说明加强声频信号的声音质量的后处理方法。参见图1,如果输入编码的信号,它们被分成左右声道信号,并通过解码器110分别解码被分开的信号。然后,分别用第一和第二高频分量发生器单元120和130重构解码的左右声道信号的高频分量。但是,因为大多数的声频信号的左右声道的声频信号彼此基本相似和高度冗余,所以不对它们单独编码。因此,存在的问题是,分开地重构左右声道信号的现有技术的后处理方法不能够有效地利用声道信号之间地相似性,因而不必要地增加了计算时间。
技术实现思路
本专利技术的一个目的是提供一种即使使用较少的计算也能加强声频信号的声音质量的声音解码方法和装置。为实现上述目的,根据本专利技术的一个方面,提供了一种声频解码方法,该方法包括步骤对每个声道信号每隔一帧跳跃地产生帧的高频分量;在左右声道信号彼此相似时,使用所产生的另一个声道信号的相应帧的高频分量,产生任何一个声道信号的跳跃的帧的高频分量;和在左右声道信号彼此不相似时,用相关的声道信号的前帧,产生每个声道信号的跳跃帧的高频分量。根据本专利技术的另一方面,提供一种重构高频分量的声频解码装置,它包括声频解码器,它接收编码的声频数据,解码接收的数据,和输出第一和第二声道的解码的声频数据;声道相似性确定单元,它确定在第一和第二声道信号之间的相似性;高频分量发生单元,它基于第一和声道信号之间的相似性,产生每个声道的声频信号的高频分量;和声频合成单元,它将解码的声频信号与产生的高频分量结合并输出结合的声频信号。附图说明通过结合以下优选实施例的说明将明了本专利技术的上述目的和其它特征。图1是应用现有技术后处理算法的声频解码装置的方框图;图2是根据本专利技术的声音解码装置的配置示意图;图3是MPEG(活动图像专家组)一1层3的格式示意图;图4是根据本专利技术的声频解码方法的整个处理过程流程图;图5是根据本专利技术对每个声道信号每隔一个帧跳跃地,产生高频分量的处理图;图6是在声道信号彼此不相似时,产生左右声道信号的高频分量的方法示意图;图7是在声道信号彼此相似时,产生左右声道信号的高频分量的方法示意图;和图8的图表,示出了与现有技术比较,本专利技术的声频解码方法声音质量的加强。具体实施例方式下面参照附图详细说明本专利技术的声频解码装置的配置和工作。图2示出声频解码装置200的配置示意图。参见图2,声频解码装置200包括解码器210;声道相似性确定单元220;高频分量发生单元230;和声频合成单元240。装置200被配置成解码声频位流,然后重构来自解码的声频信号的各声道信号的高频分量。解码器210解码输入的声频位流并产生声频信号。即,从输入的声频位流解码声频数据,然后将解码的数据去量化(dequantize),以恢复在声频数据的编码处理中以前进行的量化操作,使得输出原始声频信号。这里,在解码器210中采用的解码方法可以根据压缩声频信号使用的编码类型,例如比例因子编码、AC一3、MEPG和霍夫曼(Huffman)编码等变化。然而,因为在声频信号处理中使用的编码器的配置和操作基本彼此相同,所以,在此省略其详细说明。同时,已知SBR(频谱带复制Spectral Band Replication),即,从声频信号的低频范围重构高频范围的算法是迄今提出的声音质量强化的几种后处理算法当中的最有效的技术。但是,不能够将SBR2应用到各种声频编解码器,因为它是依靠MEPG-1层3的后处理算法。另外,与SBR2比较,SBRl能够用于各种声频编解码器,但是它将对每帧的左右声道信号进行后处理操作。因此,操作中不能够有效地利用两个声道之间的相似性,结果,增加了计算时间。因此,存在着几乎不能够将这种算法用于相关的产品的限制。因此,为了减少与能够用于各种声频编解码器的相应于SBRl(下面简称为SBR)的问题的大计算量,和具有优良的重构性能,将本专利技术成配置成这样,通过声道相似性确定单元220和高频分量发生单元230,有效地利用声道的相似性,即使使用小的计算量也能够重构高频分量。在输入解码的声频信号时,声道相似性确定单元220分析输入的声频信号是否包括模式信息。然后,声道相似性确定单元220根据该模式信息确定左右声道信号之间的相似性。否则,基于从声道信号之间的和及差信息获得的SNR(信噪比),确定声道信号之间的相似性。这里,在声频信号不包括模式信息时使用SNR确定声道信号之间相似性的原因是,基于从声道信号之间的和及差获得的SNR值,能够容易地确定左右声道之间的相似性,因为在压缩比高时,在通常的声频编解码器中频繁编码该和及差信息。下面,为了更好理解本专利技术,通过MEPG-1层3声频信号的例子说明确定左右声道信号之间相似性的方法。图3示出了MEPG-1层3声频流的格式。MEPG一1层3声频流由多个AAU(声音访问单元)300构成。每个AAU300是能够单个解码并含有预定的固定数目的压缩数据的取样的最小的单元。每个AAU300包括标题310,循环冗余校验(CRC)320,声频数据330,和辅助数据340。标题310含有关于同步字、ID、层、保护位的存在、位速率指数、取样频率、填充位的存在、专用使用位、模式、模式扩展、版权、原始/复制和强调特征的信息。CRC320是可任选的,16位长,并且标题310定义在每个AAU300中是否包括CRC320。声频数据330是含有压缩声音数据的部分。辅助数据340是在每个声频数据330的尾端未达到相关AAU的尾端时的剩余的部分。在辅助数据340中能够包括除了MPEG声频数据外的任何数据如图3所示,MP3声频位流的标题310含有模式信息,该模式信息表示所述流是否使用声道信号之间的相似性被压缩。因此,通过分析输入的MP3声频位流的模式信息,能够容易地确定在声道信号之间的相似性。因此,在包括上述模式信息的MEPG-1层3声频信号输入时,声道相似性确定单元220分析在输入信号中的模式信息,并根据模式信息是否是具有左右声道信号之间很大相似性的共同立体声(joint stereo)模式值,或是具有在声道信号之间很小相似性的立体声模式值,来确定在声道信号之间的相似性。在另一方面,在解码的声频信号中不包括模式信息的情况,声道相似性确定单元220基于从声频信号获得的声道信号之间的和及差信息,计算与代表声道信号之间相似性的参数相对应的SNR。然后,如果计算的SNR值小于声道信号之间相似性的阈值,则确定这两个声道信号彼此相似。否则确定这两个声道信号不彼此相似。即,将从关于声道的信号之间的和及差的信息获得的SNR值用作代表声道之间相似性的参数。现在详细说明基于关于两个声道信号之间的和及差的信息计算SNR值的方法。首先,计算在这两个声道信号之间的和及差的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种在解码声频数据时产生高频分量的方法,包括步骤利用第一和第二声道信号之间的相似性,产生高频分量。2.如权利要求1所述的方法,其中基于第一和第二声道信号之间的和及差的信息获得的信噪比(SNR),确定声道信号之间的相似性。3.如权利要求1所述的方法,其中声频数据包括模式信息。4.如权利要求3所述的方法,还包括步骤确定模式信息是否是表示在第一和第二声道信号之间大的相似性的共同立体声值,或是表示第一和第二声道信号之间没有相似性的立体声模式值。5.如权利要求1所述的方法,还包括步骤在第一和第二声道信号彼此相似时,产生每个声道信号的仅一些帧的高频分量;和使用另一声道信号的某些帧的产生的高频分量,产生每个声道信号的其它一些帧的高频分量。6.如权利要求5所述的方法,其中通过适当修改一些帧的高频分量产生其它帧的高频分量。7.如权利要求1所述的方法,还包括步骤在第一和第二声道信号彼此不相似时,产生每个声道信号的仅一些帧的高频分量;和使用相关声道信号的一些帧的产生的高频分量,产生每个声道信号的其它帧的高频分量。8.如权利要求7所述的方法,其中通过适当修改一些帧的高频分量产生其它帧的高频分量。9.一种重构高频分量的声频解码方法,包括步骤(a)接收编码的声频数据,解码接收的数据,和输出第一和第二声道的解码的声频信号;(b)产生每个第一和第二声道信号的仅一些帧的高频分量;(c)确定在第一声道和第二声道信号之间的相似性;(d)在第一和第二声道信号彼此相似时,使用另一声道信号的一些帧的产生的高频分量,产生每个声道信号的另一些帧的高频分量;和(e)将产生的高频分量与解码的声频信号结合,并输出结合的声频信号。10...

【专利技术属性】
技术研发人员:吴润学马修·马努
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1