音响信号编码方法及设备、音响信号解码方法及设备技术

技术编号:3046595 阅读:139 留言:0更新日期:2012-04-11 18:40
本发明专利技术是一种对多个声道的音响信号进行高效率编码音响信号编码设备,包括相关对象设定器(52)、相关对象选择器(56)、可变长编码器(58)。基于由左声道频率信息保持器(50)保持的左声道频率信息和由右声道频率信息保持器(51)保持的右声道频率信息,相关对象设定器(52)设定index[i],其表示与右声道的正弦波对应的那个左声道的正弦波,用来计算差值。根据此index[i],相关对象选择器(56)在从存储部件(55)读取的缺省值与从左声道振幅信息保持器(53)读取的第index[i]振幅信息,以作为对象用来计算与右声道第i振幅信息的差值。可变长编码器(58)从右声道振幅信息中减去左声道相关对象振幅信息或缺省值,并对该差值进行可变长编码。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及音响信号编码方法及设备、音响信号解码方法及设备、程序及记录介质,特别地,涉及音响信号编码方法及设备,用来对多个声道的音响信号进行高效率编码和传送该编码音响信号、或将该信号记录至记录介质;记录介质,其记录了由编码生成的码列;对该接收或再现的码列进行解码的音响信号解码方法及设备;和使得计算机实行音响信号编码处理或音响信号解码处理的程序、以及记录该程序的计算机可读取的记录介质。本申请主张于2002年5月20日提交的日本专利申请2002-145267,其全部内容在此作为参照而被引用。
技术介绍
历来,例如以子带编码等为代表的非块化子频带技术和以变换编码等为代表的块化子频带技术等是公知的用于声音等音频信号的高效率编码的方式。对于非块化子频带分割技术,时间轴上的音频信号不被块化并通过将其分割成多个子频带而进行编码。另一方面,对于块化子频带技术,时间轴上的音频信号通过频率轴上的信号的频谱变换而被分割成多个子频带,即,通过音频信号频谱变换所得的系数由各所预置的子频带分组,接着信号由子频带进行编码。为了改善编码效率,提供了一种高效率编码技术,即非块化子频带编码和块化子频带编码的组合。根据此技术,例如,一信号的频带由子带编码而分割成子频带,接着各子频带的信号被频谱变换成频率轴上的信号,并由频谱变换后的子频带对该信号进行编码。为了分割频带,例如,多次地使用正交镜像滤波器(QMF),因为它能简单地分割频带并消去镜像混淆。注意到QMF的频带分割详细地记载于文献“1976 R.E.Crochiere,子带中的话音数字编码,Bell Syst.Tech.J.Vol.55,№.8,1976年”等。子频带技术还包括例如多相位正交滤波器(PQF)等。此技术将一频带分割成相等带宽。PQF技术详细地记载于文献“ICASSP 83 BOSTON,多相位正交滤波器-一种新型子带编码技术,Joseph·H·Rothweiler”等。另一方面,上述频谱变换包括例如,输入音频信号被块化为所预置单位时间的帧,而通过使各块受到离散傅立叶变换(DFT)、离散余弦变换(DCT)、改良DCT变换(MDCT)等而将时间轴信号变换成频率轴信号。注意到MDCT详细地记载于文献“ICASSP,1987,使用滤波器组设计基于时域混淆消去的子带/变换编码,J.P.Princen,·Bradley,萨里皇家墨尔本理工学院”等。通过对如上使用滤波器和频谱变换而得的各频带的信号进行量化,能够控制由量化杂音而发生的一频带,从而,利用杂音的掩蔽效果,信号能够以听觉的更高效率来进行编码。而且,以例如该子带的信号成分的绝对值的最大值而对各子频带的信号成分进行正规化,该信号能够以高得多的效率进行编码。各频率子频带的宽度是考虑例如人类听觉特性而决定的。一般地,音频信号被分割成多个(例如,32个子带)称之为“临界频段”的频带,其宽度随着频率升高而扩大。而且,为了对各子频带的数据进行编码,而对子频带进行所预置的位分配或适应性位分配。即,为了随位分配而对MDCT处理所得的系数数据进行编码,将数位码适应性地分配给对信号的各块进行MDCT处理所得的各子频带的MDCT系数数据。为了构成实际的码列,首先,表示量化步骤的量化精度信息和表示正规化各信号成分所用系数的正规化系数以所预置的位数进行编码,接着,对正规化和量化的频谱信号进行编码。为了进一步改善值的压缩率,被直接编码的主信息,例如有必要提高频谱信号的编码效率、以及提高量化精度信息和正规化系数等不被直接编码的子信息的编码效率。由此,本专利技术的专利技术人通过先行申请的日本专利申请2000-390589的说明书及附图,提供了一种技术,其利用声道间相关的可变长编码技术、或使用梯度系数来控制存在分布范围的编码技术,从而提高子信息的编码效率。而且,本专利技术的专利技术人通过日本专利申请2001-182093的说明书及附图,提供了一种技术,其在增益控制被用来抑制由频谱信号的量化发生的、称之为“前回声/后回声”的量化杂音的编码中,利用各种相关来提高增益信息的编码效率。进而,本专利技术的专利技术人通过日本专利申请2000-380639及日本日本专利申请2001-182384的说明书及附图,提供了一种技术,其从时序信号提取音调成分并对该残余误差信号进行频谱变换编码,以抑止编码效率由于在历来的编码技术中在正弦波等局部频率处存在的音调成分而恶化。注意到表示上述提取的音调成分的正弦波信息、例如频率信息、振幅信息及相位信息等波形参数是分别由残余误差信号的频谱信息、正规化系数及量化精度信息而编码的。通过对残余误差信号进行编码、其使用本专利技术人的上述日本专利申请2000-390589和日本专利申请2001-182093的说明书及附图中记载的技术,例如利用声道间相关的可变长编码技术或使用梯度系数来控制存在分布范围的编码技术,能够提高压缩效率。然而,不同于残余误差信号的频谱信息、正规化系数及量化精度信息,提取的音调成分在全部频率带域中一样地存在,从而,在某些场合下,在音频信号间利用声道间相关的可变长编码技术可使编码效率恶化。以下,具体地说明历来的利用声道间相关的可变长编码技术。在以下的具体例中,假定声道数为2,就是说音频信号是立体声,而声道间相关意味着左右声道间相关。而且,尽管在所说明的一例中,仅对于表示音调成分的正弦波信息的振幅信息而利用左右声道间相关,但该说明对于相位信息也是相同的。进而,假定在左声道Lch上提取NL个正弦波而在右声道Rch上提取NR个正弦波。图1表示利用左右声道间相关对正弦波信息进行编码的历来的正弦波信息编码器对右声道Rch的振幅信息进行编码的部分的概略构成。但是,为了解释的简单起见,假定左声道Lch上的正弦波数NL等于右声道Rch上的正弦波数NR。如图1所示,正弦波信息编码器一般以标记200表示,其包括左声道振幅信息保持器201、右声道振幅信息保持器202、加减法器203、可变长编码器204、码列生成器205。左声道振幅信息保持器201索引了从左声道Lch提取的NL个正弦波,其分别为从低频侧顺次开始的0~NL-1,并保持对应于该索引的振幅信息。同样地,右声道振幅信息保持器202索引了从右声道Rch提取的NR个正弦波,其分别为从低频侧顺次开始的0~NR-1,并保持对应于该索引的振幅信息。而且,左声道振幅信息保持器201和右声道振幅信息保持器202将其保持的振幅信息提供给加减法器203。加减法器203通过从右声道Rch上的第i振幅信息中减去左声道Lch上的第i振幅信息而计算差值,并将计算出的差值提供给可变长编码器204。可变长编码器204对从加减法器203供给的差值根据可变长码表而进行可变长编码,并将所得的可变长码作为正弦波信息码而提供给码列生成器205。码列生成器205基于从可变长编码器204供给的正弦波信息码而生成码列。当正弦波信息如图2所示而提供时,正弦波信息编码器1如下运作。正如已知,右声道上的许多信息与左声道上的对应信息具有类似值,故可利用左右声道间相关来改善信息的编码效率。在对振幅信息(非压缩时为3位)进行编码时,从右声道Rch上的振幅信息中减去具有相同对应索引(n)的左声道Lch上的振幅信息而得的差值如图3所示。由于该差值的分布不均,故可根据例本文档来自技高网...

【技术保护点】
一种对多个声道的音响信号进行编码的音响信号编码方法,包括以下步骤:    从所述多个声道的所述音响信号各提取任意数量的正弦波;    使用第1声道信息和第2声道信息或基于预置的正弦波的正弦波信息而将第2声道信息的正弦波信息或基于预置的正弦波的正弦波信息之一设定为相关对象,用来相对于所述第1声道信息的各正弦波信息而编码,该第1声道信息包括基于从多个声道中的第1声道提取的正弦波的正弦波信息,而该第2声道信息包括基于从多个声道中的第2声道提取的正弦波的正弦波信息;和    对所述第2声道信息的正弦波信息进行编码,同时使用与设定为所述相关对象的正弦波信息的相关而对所述第1声道信息的正弦波信息进行编码。

【技术特征摘要】
JP 2002-5-20 145267/20011.一种对多个声道的音响信号进行编码的音响信号编码方法,包括以下步骤从所述多个声道的所述音响信号各提取任意数量的正弦波;使用第1声道信息和第2声道信息或基于预置的正弦波的正弦波信息而将第2声道信息的正弦波信息或基于预置的正弦波的正弦波信息之一设定为相关对象,用来相对于所述第1声道信息的各正弦波信息而编码,该第1声道信息包括基于从多个声道中的第1声道提取的正弦波的正弦波信息,而该第2声道信息包括基于从多个声道中的第2声道提取的正弦波的正弦波信息;和对所述第2声道信息的正弦波信息进行编码,同时使用与设定为所述相关对象的正弦波信息的相关而对所述第1声道信息的正弦波信息进行编码。2.根据权利要求1的方法,其中在相关对象设定步骤中,基于在频率轴上所述第1声道信息的所述正弦波信息中所含的频率信息和所述第2声道信息的所述正弦波信息中所含的频率信息之间的距离而将正弦波信息设定为所述相关对象。3.根据权利要求2的方法,其中在相关对象设定步骤中,包括所述第1声道信息的所述正弦波信息所含的频率信息在频率轴上的距离小于一阈值的频率信息的所述第2声道信息的正弦波信息被设定为所述相关对象。4.根据权利要求3的方法,其中若包括所述第1声道信息的所述正弦波信息所含的频率信息在频率轴上的距离小于所述阈值的频率信息的第2声道信息中没有正弦波信息时,则在所述相关对象设定步骤中,将所述第2声道信息所含的任意正弦波信息设定为所述相关对象。5.根据权利要求3的方法,其中若包括所述第1声道信息的所述正弦波信息所含的频率信息在频率轴上的距离小于所述阈值的频率信息的第2声道信息中没有正弦波信息,则在所述相关对象设定步骤中,将基于预置的正弦波的正弦波信息设定为所述相关对象。6.根据权利要求1的方法,其中所述正弦波信息包括所述正弦波的振幅信息;和在所述正弦波信息编码步骤中,从所述第1声道信息的所述正弦波信息所含的振幅信息中减去作为所述相关对象的所述正弦波信息所含的振幅信息而得到差值,使该差值受到可变长编码。7.根据权利要求1的方法,其中所述正弦波信息包括所述正弦波的振幅信息;和在所述正弦波信息编码步骤中,从所述第1声道信息的所述正弦波信息所含的相位信息中减去作为所述相关对象的所述正弦波信息所含的相位信息而得到差值,使该差值受到可变长编码。8.根据权利要求1的方法,其中在所述正弦波信息编码步骤中,当第1声道信息的所述正弦波信息与所述相关对象的所述正弦波信息完全一致时,所述第1声道信息的所述正弦波信息所含的除频率信息以外的其他信息皆不被编码。9.根据权利要求1的方法,其中在所述正弦波信息编码步骤中,当第1声道信息的所述振幅信息与所述相关对象的所述振幅信息完全一致时,所述第1声道信息的所述正弦波信息所含的振幅信息不被编码。10.根据权利要求1的方法,其中在所述正弦波信息编码步骤中,当第1声道信息的所述相位信息与所述相关对象的所述相位信息完全一致时,所述第1声道信息的所述正弦波信息所含的相位信息不被编码。11.一种对多个声道的音响信号进行编码的音响信号编码设备,所述设备包括正弦波提取装置,用来从所述多个声道的所述音响信号各提取任意数量的正弦波;相关对象设定装置,用来使用第1声道信息和第2声道信息或基于预置的正弦波的正弦波信息而将第2声道信息的正弦波信息或基于预置的正弦波的正弦波信息之一设定为相关对象,用来相对于所述第1声道信息的各正弦波信息而编码,该第1声道信息包括基于从多个声道中的第1声道提取的正弦波的正弦波信息,而该第2声道信息包括基于从多个声道中的第2声道提取的正弦波的正弦波信息;和正弦波信息编码装置,用来对所述第2声道信息的正弦波信息进行编码,同时使用与设定为所述相关对象的正弦波信息的相关而对所述第1声道信息的正弦波信息进行编码。12.一种允许计算机对多个声道的音响信号进行编码的程序,该程序包括以下步骤从所述多个声道的所述音响信号各提取任意数量的正弦波;使用第1声道信息和第2声道信息或基于预置的正弦波的正弦波信息而将第2声道信息的正弦波信息或基于预置的正弦波的正弦波信息之一设定为相关对象,用来相对于所述第1声道信息的各正弦波信息而编码,该第1声道信息包括基于从多个声道中的第1声道提取的正弦波的正弦波信息,而该第2声道信息包括基于从多个声道中的第2声道提取的正弦波的正弦波信息;和对所述第2声道信息的正弦波信息进行编码,同时使用与设定为所述相关对象的正弦波信息的相关而对所述第1声道信息的正弦波信息进行编码。13.一种计算机可读取的记录介质,其上记录了允许对多个声道的音响信号进行编码的程序,该程序包括以下步骤从所述多个声道的所述音响信号各提取任意数量的正弦波;使用第1声道信息和第2声道信息或基于预置的正弦波的正弦波信息而将第2声道信息的正弦波信息或基于预置的正弦波的正弦波信息之一设定为相关对象,用来相对于所述第1声道信息的各正弦波信息而编码,该第1声道信息包括基于从多个声道中的第1声道提取的正弦波的正弦波信息,而该第2声道信息包括基于从多个声道中的第2声道提取的正弦波的正弦波信息;和对所述第2声道信息的正弦波信息进行编码,同时使用与设定为所述相关对象的正弦波信息的相关而对所述第1声道信息的正弦波信息进行编码。14.一种计算机可读取的记录介质,其上记录了由对多个声道的音响信号进行编码的音响信号编码方法而生成的码列,该码列是由以下步骤而得的正弦波信息码从所述多个声道的所述音响信号各提取任意数量的正弦波;使用第1声道信息和第2声道信息或基于预置的正弦波的正弦波信息而将第2声道信息的正弦波信息或基于预置的正弦波的正弦波信息之一设定为相关对象、用来相对于所述第1声道信息的各正弦波信息而编码,该第1声道信息包括基于从多个声道中的第1声道提取的正弦波的正弦波信息,而该第2声道信息包括基于从多个声道中的第2声道提取的正弦波的正弦波信息;和对所述第2声道信息的正弦波信息进行编码,同时使用与设定为所述相关对象的正弦波信息的相关而对所述第1声道信息的正弦波信息进行编码。15.一种恢复多个声道的音响信号的音响信号解码方法,其需要从所述多个声道的所述音响信号各提取任意数量的正弦波,使用第1声道信息和第2声道信息或基于预置的正弦波的正弦波信息而将第2声道信息的正弦波信息或基于预置的正弦波的正弦波信息之一设定为相关对象,用来相对于所述第1声道信息的各正弦波信息而编码,该第1声道信息包括基于从多个声道中的第1声道提取的正弦波的正弦波信息,而该第2声道信息包括基于从多个声道中的第2声道提取的正弦波的正弦波信息,并通过对所述第2声道信息的正弦波信息进行编码、同时使用与设定为所述相关对象的正弦波信息的相关而对所述第1声道信息的正弦波信息进行编码,从而提供正弦波信息码,对该正弦波信息码进行解码,该方法包括以下步骤对已编码的所述第2声道信息的正弦波信息进行解码,并使用与设定为所述相关对象的正弦波信息的相关而对已编码的所述第1声道信息的正弦波信息进行解码,和基于所述第1声道信息的正弦波信息和所述第2声道信息的正弦波信息对所述多个声道的音响信号进行恢复。16.根据权利要求15的方法,其中在正弦波信息解码步骤中,已编码的所述第1声道信息的正弦波信息是使用作为所述相关对象的正弦波信息而解码的,该相关对象是基于在频率轴上所述第1声道信息的所述正弦波信息中所含的频率信息和所述第2声道信息的所述正弦波信息中所含的频率信包之间的距离而设定的。17.根据权利要求16的方法,其中在正弦波信息解码步骤中,已编码的所述第1声道信息的正弦波信息是使用所述第2声道信息的正弦波信息而解码的,其中在频率轴上所述第1声道信息的所述正弦波信息中所含的频率信息和所述第2声道信息的所述正弦波信息中所含的频率信息之间的距离小于一阈值。18.根据权利要求17的方法,其中在正弦波信息解码步骤中,若第2声道信息中没有正弦波信息,其包括所述第1声道信息的所述正弦波信息所含的频率信息在频率轴上的距离小于所述阈值的频率信息时,则已编码的所述第1声道信息的正弦波信息是使用所述第2声道信息的任意正弦波信息而解码的。19.根据权利要求17的方法,其中在正弦波信息解码步骤中,若第2声道信息中没有正弦波信息,其包括所述第1声道信息的所述正弦波信息所含的频率信息在频率轴上的距离小于所述阈值的频率信息时,则已编码的所述第1声道信息的正弦波信息是使用基于预置的正弦波的正弦波信息而解码的。20.根据权利要求15的方法,其中从所述第1声道信息的所述正弦波信息所含的振幅信息中减去作为所述相关对象的所述正弦波信息所含的振幅信息而得到差值,使该差值受到可变长编码,从而得到已编码的所述第1声道信息的正弦波信息;和在正弦波信息解码步骤中,已编码的所述第1声道信息的正弦波信息所含的振幅信息是通过附加解码的差值并将所述正弦波信息所含的振幅信息作为所述相关对象而解码的。21.根据权利要求15的方法,其中从所述第1声道信息的所述正弦波信息所含的相位信息中减去作为所述相关对象的所述正弦波信息所含的相位信息而得到差值,使该差值受到可变长编码,从而得到已编码的所述第1声道信息的正弦波信息;和在正弦波信息解码步骤中,已编码的所述第1声道信息的正弦波信息所含的相位信息是通过附加解码的差值并将所述正弦波信息所含的相位信息作为所述相关对象而解码的。22.根据权利要求15的方法,其中在正弦波信息解码步骤中,若第1声道信息的正弦波信息所含的除频率信息以外的其他信息未被编码,则设定为所述相关对象的所述正弦波信息所含的除频率信息以外的其他信息被用作第1声道信息的正弦波信息所含的除频率信息以外的其他信息。23.根据权利要求15的方法,其中在正弦波信息解码步骤中,若第1声道信息的频率信息所含的振幅信息未被编码,则设定为所述相关对象的所述正弦波信息所含的振幅信息被用作第1声道信息的正弦波信息所含的振幅信息。24.根据权利要求15的方法,其中在正弦波信息解码步骤中,若第1声道信息的频率信息所含的相位信息未被编码,则设定为所述相关对象的所述正弦波信息所含的相位信息被用作第1声道信息的正弦波信息所含的相位信息。25.一种恢复多个声道的音响信号的音响信号解码设备,其需要从所述多个声道的所述音响信号各提取任意数量的正弦波,使用第1声道信息和第2声道信息或基于预置的正弦波的正弦波信息而将第2声道信息的正弦波信息或基于预置的正弦波的正弦波信息之一设定为相关对象,用来相对于所述第1声道信息的各正弦波信息而编码,该第1声道信息包括基于从多个声道中的第1声道提取的正弦波的正弦波信息,而该第2声道信息包括基于从多个声道中的第2声道提取的正弦波的正弦波信息,并通过对所述第2声道信息的正弦波信息进行编码,同时使用与设定为所述相关对象的正弦波信息的相关而对所述第1声道信息的正弦波信息进行编码,该设备包括正弦波信息解码装置,用来对已编码的所述第2声道信息的正弦波信息进行解码,并使用与设定为所述相关对象的正弦波信息的相关而对已编码的所述第1声道信息的正弦波信息进行解码;和音响信号恢复装置,用来基于所述第1声道信息的正弦波信息和所述第2声道信息的正弦波信息对所述多个声道的音响信号进行恢复。26.一种允许计算机恢复多个声道的音响信号的程序,其需要从所述多个声道的所述音响信号各提取任意数量的正弦波,使用第1声道信息和第2声道信息或基于预置的正弦波的正弦波信息而将第2声道信息的正弦波信息或基于预置的正弦波的正弦波信息之一设定为相关对象,用来相对于所述第1声道信息的各正弦波信息而编码,该第1声道信息包括基于从多个声道中的第1声道提取的正弦波的正弦波信息,而该第2声道信息包括基于从多个声道中的第2声道提取的正弦波的正弦波信息,并通过对所述第2声道信息的正弦波信息进行编码,同时使用与设定为所述相关对象的正弦波信息的相关而对所述第1声道信息的正弦波信息进行编码,该程序包括以下步骤对已编码的所述第2声道信息的正弦波信息进行解码,并使用与设定为所述相关对象的正弦波...

【专利技术属性】
技术研发人员:辻实铃木志朗东山惠佑
申请(专利权)人:索尼株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1