编码离散信号和解码已编码的离散信号的方法和设备技术

技术编号:3047576 阅读:128 留言:0更新日期:2012-04-11 18:40
对以第一取样速率取样的离散第一时间信号(x↓[1])进行编码的方法,所述编码方法包括以下步骤: 从第一时间信号(x↓[1])产生第二时间信号(x↓[2]),其带宽对应于低于第一取样速率的第二取样速率; 为得到编码后的第二信号(x↓[2c]),按照第一编码算法编码第二时间信号(x↓[2]); 为得到带宽对应于第二取样速率的编码/解码后的第二时间信号(x↓[2cd]),按照第一编码算法解码已编码的第二信号(x↓[2c]); 把第一时间信号(x↓[1])变换到频率域以便得到第一频谱值(X↓[1]); 从编码/解码后的第二时间信号(x↓[2cd])产生第二频谱值(X↓[2cd]),第二频谱值(X↓[2cd])是编码/解码后的第二时间信号(x↓[2cd])的频率域表示,且其时间和频率分辨率大体上等于第一频谱值(X↓[1]); 用第二频谱值(X↓[2cd])加权第一频谱值(X↓[1]),以便得到加权频谱值(X↓[b]),其数量和第一频谱值(X↓[1])的数目对应; 按照第二编码算法编码加权频谱值(X↓[b]),以便得到编码加权频谱值(X↓[cb])。(*该技术在2017年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及编码离散信号和解码已编码的离散信号的方法和设备,尤其涉及对于分级音频编码器所进行的有效的差分编码。分级音频编码器是模型化结构的编码器。人们不断在作出努力以使用现有的语音编码器处理以例如8kHz取样的信号,并以例如4.8到8千比特每秒的速率输出数据。这些已知的编码器,如专家们知道的编码器G.729,G.723,FS1016和CELP,主要用来编码语音信号,而一般不适合编码高质量的音乐信号,因为它们通常是为以8kHz取样的信号设计的,这样只能编码最大4kHz的声音带宽。但是,一般它们能运行较快且计算开销低。对于音乐信号的音频编码,为了得到如高保真(HIFI)音质或压缩唱片(CD)音质,分级编码器把语音编码器和音频编码器组合使用,这样能够编码高取样速率如48kHz的信号。当然能够用别的编码器替代上述的语音编码器,如依照MPEG1,MPEG2或MPEG3标准工作的音乐/音频编码器。这样的级连语音编码器和高级音频编码器通常使用时域差分编码所述的编码方法。如一取样速率为48kHz的输入信号,通过下取样滤波器的下取样,可使其频率适合语音编码器。下取样所得的信号随后被编码。编码所得的信号直接放入它的传输比特流格式化装置中以进行发送。但是,它只含有最高4kHz带宽的信号。编码所得信号进而又再次被解码,并由上取样滤波器进行上取样。但是,由于经过了下取样滤波器,得到的信号所含的有用信息只有4kHz的带宽。而且,应注意经过上取样编码/解码的信号的从低频直到4kHz的信息并不确切对应于输入的48kHz取样速率的信号第一个4kHz的信息,因为编码器一般会引入编码错误(参见“关于分级声音编码的初步想法”(“First Ideas onScalable Audio Coding”),K.Brandenburg,B.Grill,97th AES-Convention,San Francisco,1994,预印本3924)。已经指出,分级编码器包括通常所知的语音编码器和一个能处理高取样速率信号的音频编码器。为发送输入信号中4kHz以上的频率分量,对于每一个时间离散取样值,可以取得语音编码器的输入8kHz的信号与编码/解码上取样所得的信号的差值。该差值随后被已为专家所知的一音频编码器量化和编码。这里应注意向输入能编码高取样速率信号的音频编码器输入的差值信号,如不计语音编码器的编码错误,在低频基本上为零。在高于语音编码器经上取样编码/解码所得的输出信号的频谱范围内,差值信号基本上对应于48kHz输入信号的真实信息。在第一阶段,即语音编码器阶段,主要用低取样速率的编码器,因为一般信号编码的目标是获得非常低的比特速率。目前,除过已提及的编码器,还有些编码器,工作在几千比特(2-8千比特或更高)的比特率。这些编码器只允许最大8kHz的取样速率,因为高带宽的声音无论如何不可能用如此低的比特率,并且低取样频率的编码因计算开销小而更优越一些。可能的最高声音带宽为4kHz,而在实际应用中,带宽限制在大约3.5kHz。在为达到提高带宽的情况下,即在包括音频编码器的阶段,此附加的阶段将不得不工作于高取样频率。为匹配取样频率,用抽取和内插滤波器来进行下取样和上取样。因为FIR(有限冲激响应)滤波器有利于获得优异的相位特性,例如为匹配从8kHz到48kHz的频率,滤波器需要合理安排上百个系数或抽头。从该现有技术出发,本专利技术的目的就是提供用以编码离散信号和解码已编码离散信号的设备和方法,而省去复杂的上取样滤波器。这一目的通过以下方法和设备实现按照权利要求1的编码方法,按照权利要求13的解码方法,按照权利要求14的编码设备和按照权利要求15的解码设备。本专利技术的优点在于使用本专利技术的包含最少两个分离的编码器的编码设备(分级音频编码器),在考虑心理声学模型的情况下,第二个编码器能工作于最佳方式。本专利技术基于一个事实当音频编码器或解码器在频率域进行编码和解码,且用高取样速率执行低级的编码器或解码器的编码/解码输出信号与原始输入信号之间的差值运算或基于此运算的信号的相应频谱运算表示时,包含大量计算时间的上取样滤波器可以省去。这样不再需要通过传统的上取样滤波器来上取样低级编码器的编码/解码输出信号,但是还是需要两组滤波器,即一组滤波器仅用来处理编码器或低级编码器的编码/解码输出信号,另一组用高取样频率处理原始输入信号。已提到的两组滤波器传递输出信号频谱值,为了形成加权频谱值,输出信号频谱值要通过一种适当的方式加权,优选采用减法的方式。这些加权频谱值随后采用考虑了心理声学模型的量化器和编码器来编码。为了能被以合适的方式的复用,优选把加权频谱值经过量化和编码后的数据和低级编码器生成的编码信号一起放入比特格式化装置中,这样它们可以被发送和存储。此处还应注意节省的计算时间量实际上很大。在前面的例子中,语音编码器处理8kHz取样的信号,进而处理它,以上取样FIR滤波器对每个取样值或取样点需要超过100次乘法运算,而滤波器组可通过专家所知的MDCT实现,每个取样值仅需要10到几十(如约30)次乘法运算。这里要指出的是,使用按照本专利技术的分级音频编码器,语音编码器可以被依照MPEG1到MPEG3标准的工作的任何的音频编码器替换,只要第一和第二阶段的编码器被设计在两个不同的取样频率上。本专利技术的优选实施例将参照后面附图予以详细说明。附图说明如下图1示出了按照本专利技术进行编码的设备的框图;图2示出了解码已编码的离散信号的设备的框图;图3示出了图1中的量化器/编码器的详细框图。图1示出了按照本专利技术对(分级音频编码器的)时间离散信号编码的设备的基本框图。用第一取样速率(如48kHz)取样的离散信号x1,经过取样速率低于第一取样速率的下取样滤波器12的滤波,被变为第二取样速率(如8kHz)。第一和第二取样速率尽量取整数比关系。下取样滤波器12的输出被输入到按照第一编码算法编码的编码器/解码器14中。上面已经提到,编码器/解码器14可以是一低级语音编码器,如G.729,G.723,FS1016,MPEG-4,CELP等编码器。这些编码器工作于从4.8千比特每秒(FS1016)到8千比特每秒(G.729)的数据率上。它们都处理经取样频率8kHz取样过的信号。但是,专家们清楚地知道还可以使用别的工作于别的数据率和取样频率的任意编码器来替代。编码器14编码的信号,即已编码的第二信号x2c,是一依赖编码器14的采用上述速率的比特流。它通过连线16输入到比特格式化装置18中,比特格式化装置18的功能在后面叙述。下取样滤波器12和编码器/解码器14一起组成本专利技术的分级音频编码器第一阶段。在连线16上输出的已编码的第二信号x2c进而又被第一编码器/解码器14解码,以产生连线20上的编码/解码第二时间信号x2cd。和第一离散时间信号x1相比,编码/解码第二时间信号x2cd是一带宽减少的时间离散信号。在上面例子的数据中,第一时间离散信号x1最大有24kHz的带宽,因为取样速率为48kHz。编码/解码第二时间信号x2cd有最大为4kHz的带宽,因为已通过下取样滤波器12的抽取把第一时间信号x1的取样频率变为8kHz。在如不计编码器/解码器14引入的编码错误,从0到4kHz的带宽内,信号x1和xcd本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.对以第一取样速率取样的离散第一时间信号(x1)进行编码的方法,所述编码方法包括以下步骤从第一时间信号(x1)产生第二时间信号(x2),其带宽对应于低于第一取样速率的第二取样速率;为得到编码后的第二信号(x2c),按照第一编码算法编码第二时间信号(x2);为得到带宽对应于第二取样速率的编码/解码后的第二时间信号(x2cd),按照第一编码算法解码已编码的第二信号(x2c);把第一时间信号(x1)变换到频率域以便得到第一频谱值(X1);从编码/解码后的第二时间信号(x2cd)产生第二频谱值(X2cd),第二频谱值(X2cd)是编码/解码后的第二时间信号(x2cd)的频率域表示,且其时间和频率分辨率大体上等于第一频谱值(X1);用第二频谱值(X2cd)加权第一频谱值(X1),以便得到加权频谱值(Xb),其数量和第一频谱值(X1)的数目对应;按照第二编码算法编码加权频谱值(Xb),以便得到编码加权频谱值(Xcb)。2.权利要求1所述的编码方法,其中产生第二频谱值(X2cd)步骤包括在编码/解码后的第二时间信号(x2cd)的每个离散值间插入多个零值,零的数目等于第一与第二取样速率的比值减一,以便得到修改的编码/解码后的第二信号;把修改的编码/解码后的第二信号变换到频率域,以便得到修改频谱值;为得到第二频谱值(X2cd),选择所修改频谱值的范围,所述的范围从最低频率的频谱值到其频率值基本上等于第二时间信号(x2)带宽值的频谱值。3.权利要求1所述的编码方法,其中产生第二频谱值(X2cd)的步骤包括以下步骤在每个编码/解码后的第二时间信号(x2cd)间插入多个零,零的数目等于第一与第二取样速率的比值减一,以便得到修改的编码/解码后的第二信号;从修改的编码/解码后的第二信号仅计算频谱值的范围,所述的范围从最低频率的频谱值到频率值大体上等于第二时间信号(x2)带宽值的频谱值。4.权利要求2或3所述的编码方法其中在对应于第二时间信号(x2)带宽值的频率附近的少量谱线不被选中或由加权函数加权并在以后选中。5.任何前述的权利要求之一所述的编码方法,其中加权的步骤包括以下步骤从第一频谱值(X1)中减去第二频谱值(X2cd),以便得到差值频谱值(Xd);计算差值频谱值(Xd)的能量;计算第一频谱值(X1)的能量;频率选择性地比较差值频谱值(Xd)和第一频谱值(X1)的能量;取k值在0.1到10之间时,当在频率选择中差值频谱值(Xd)的能量超过第一频谱值(X1)与系数k的乘积的能量时,确定第一频谱值(X1)为加权频谱值;否则,确定差值频谱值(Xd)为加权频谱值(Xb)。6.权利要求5所述的编码方法,其中以频率群的形式进行所述频率选择性比较。7.任何前述的权利要求之一所述的编码方法,其中按照第二编码算法编码已加权的频谱值(Xb)时考虑了心理声学模型。8.权利要求7所述的编码方法,其中编码过程包括以下步骤考虑到心理声学模型,从第一时间信号(x1)计算某频带内的允许干扰能量(EPM);量化此频带内的加权频率值(Xb);反量化此频带内量化加权频谱值(Xqb);通过下面的方程式计算此频带内的实际的干扰能量ETS=∑(X1[i]-(Xqdb+X2cd))2此处X1代表第一频谱值,Xqdb代表量化/反量化的加权频谱值,X2cd代表第二频谱值且i代表频谱值的求和指数,i包括的范围从频带的第一个频谱值到最后一个频谱值。比较此频带内的实际干扰能量(ETS)和允许的干扰能量...

【专利技术属性】
技术研发人员:伯恩哈特·格里尔伯恩德·埃德勒卡尔海因茨·勃兰登堡
申请(专利权)人:弗劳恩农场主协会应用研究开发E·V·
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利