使用语音相关的频谱整形信息编码音频信号和解码音频信号的概念制造技术

技术编号:24760290 阅读:48 留言:0更新日期:2020-07-04 10:07
根据本发明专利技术的方面,一种用于编码音频信号的编码器包括用于从音频信号的帧得到预测系数和残差信号的分析器。编码器包括:共振峰信息计算器,用于从预测系数计算语音相关的频谱整形信息;增益参数计算器,用于从无声残差信号和频谱整形信息计算增益参数;和比特流形成器,用于基于与有声信号帧相关的信息、增益参数或经量化的增益参数和预测系数形成输出信号。

The concept of encoding and decoding audio signals using speech related spectrum shaping information

【技术实现步骤摘要】
使用语音相关的频谱整形信息编码音频信号和解码音频信号的概念本申请是申请日为2014年10月10日、优先权日为2013年10月18日、申请号为“201480057458.9”、专利技术名称为“编码和解码音频信号的编码器、解码器及相关方法”的中国专利技术专利的分案申请。
本专利技术涉及用于编码音频信号(特别是语音相关音频信号)的编码器。本专利技术也涉及用于解码经编码的音频信号的解码器及方法。本专利技术还涉及经编码的音频信号及低比特率下的高级语音无声编码。
技术介绍
在低比特率下,语音编码可从对无声帧的特殊处置收益,以便维持语音质量同时减少比特率。无声帧可感知地模型化为在频域和时域上都被整形的随机激励。由于波形和激励看起来和听起来几乎与高斯白噪声相同,因此可由经合成地产生的白噪声松弛并替换其波形编码。接着,编码将由编码信号的时域形状及频域形状组成。图16展示参数无声编码方案的示意性方块图。合成滤波器1202用于模型化声道且由LPC(线性预测编码)参数参数化。可通过对LPC系数进行加权从包括滤波函数A(z)的获得的LPC滤波器获得感知加权滤波器。感知滤波器fw(n)通常具有如下形式的传递函数:其中w小于1。根据如下方程计算增益参数gn以获得与感知域中的原始能量匹配的经合成的能量:其中sw(n)及nw(n)分别为感知滤波器fw(n)所滤波的输入信号和所产生的噪声。针对具有大小Ls的每个子帧,计算增益gn。例如,可将音频信号划分成长度为20ms的帧。可将每个帧再划分成子帧,例如再划分成各个长度为5ms的四个子帧。码激励线性预测(CELP)编码方案广泛用于语音通信且为编码语音的极有效方式。相比参数编码,该编码方案给予较自然的语音质量但其也要求较高速率。CELP通过输送将音频信号合成为线性预测滤波器,其称为LPC合成滤波器,该LPC合成滤波器可包括两个激励的和的形式1/A(z)。一个激励来自称为自适应码本的经解码的过去。另一贡献来自由固定码所填入的革新码本。然而,在低比特率下,革新码本未经充分填入以用于有效地模型化无声的语音或类噪声激励的精细结构。因此,感知质量降低,尤其是接着听起来清脆且不自然的无声帧。为降低低比特率下的编码伪影,已提出了不同解决方案。在G.718[1]及[2]中,通过增强对应于当前帧的共振峰的频谱区而自适应地且频谱上整形革新码本的码。可直接从编码器侧及解码器侧两处已可用的系数的LPC系数扣除共振峰位置及形状。根据如下方程通过进行简单滤波而进行码c(n)的共振峰增强:c(n)*fe(n)其中*表示卷积运算符,其中fe(n)为传递函数的滤波器的脉冲响应:其中w1及w2为大致强调传递函数Ffe(z)的共振峰结构的两个加权常数。所得的经整形的码继承语音信号的特性,且经合成的信号听起来较清晰。在CELP中,将频谱倾斜添加至革新码本的解码器也是常见的。通过用以下滤波器对码进行滤波而进行此操作:Ft(z)=1-βz-1因子β通常与先前帧的浊音度相关且视情况而定(即,其发生变化)。可从自适应码本的能量贡献估计浊音度。如果先前帧是有声的,则预测当前帧也将是有声的且码应在低频率中具有较多能量(即,应展示负向倾斜)。相反地,对于无声帧所添加的频谱倾斜将是正向的且朝向高频率将分布较多能量。使用频谱整形以对解码器的输出进行语音增强及噪声减少为惯例。作为后滤波的所谓的共振峰增强由从解码器的LPC参数获得系数的自适应后滤波组成。后滤波器看起来类似于如上文所述的一个(fe(n)),用于整形某些CELP编码器中的革新激励。然而,在那种情况下,后滤波仅应用于解码器程序的结束处而非编码器侧处。在现有CELP(CELP=(码)-本激励线性预测)中,由LP(线性预测)合成滤波器模型化频率形状,同时可由发送至每个子帧的激励增益近似时域形状,但长期预测(LTP)和革新码本通常并不适于模型化无声帧的类噪声激励。CELP需要相对高的比特率以达到无声语音的良好质量。有声或无声特性化相关于将语音分段成部分并将其中的每个相关联至语音的不同源模型。源模型在用于CELP语音编码方案时依赖于用于模拟从声门出来的气流的自适应谐波激励和用于模型化由所产生的气流所激励的声道的谐振滤波器。此模型可为类音素声乐提供良好结果,但尤其当声带并未振动(例如,无声音素“S”或“f”)时,其可导致不正确地模型化并非由声门所产生的语音部分。另一方面,参数语音编码器也被称为声码器,并针对无声帧采用单一源模型。其可到达极低的比特率同时实现并不与由CELP编码方案在高得多的速率下所递送的质量一样自然的所谓的合成质量。因此,需要增强音频信号。
技术实现思路
本专利技术的目标为在低比特率下增加声音质量和/或为实现良好声音质量而减少比特率。通过根据独立权利求的编码器、解码器、经编码的音频信号及方法实现此目标。专利技术人发现,在第一方面,可通过确定语音相关的整形信息,使得可从语音相关的整形信息获得用于放大信号的增益参数信息而增加(增强)与音频信号的无声帧相关的经解码的音频信号的质量。此外,语音相关的整形信息可用于频谱上整形经解码的信号。因此可处理包括较高语音重要性的频率区(例如,低于4kHz的低频率)使得其包括较少误差。专利技术人进一步发现,在第二方面,通过从用于经合成的信号的帧或子帧(部分)的确定性码本产生第一激励信号,且通过从用于经合成的信号的帧或子帧的类噪声信号产生第二激励信号,并通过组合第一激励信号和第二激励信号以产生经组合的激励信号,可增加(增强)经合成的信号的声音质量。尤其对于包括具有背景噪声的语音信号的音频信号的部分,可通过添加类噪声信号改良声音质量。可在编码器处确定用于可选地放大第一激励信号的增益参数,且可将与该参数相关的信息和经编码的音频信号一起传输。可选地或另外,可至少部分利用所合成的音频信号的增强以减少用于编码音频信号的比特率。根据第一方面的编码器包括用于从音频信号的帧获得预测系数和残差信号的分析器。编码器进一步包括用于从预测系数计算语音相关的频谱整形信息的共振峰信息计算器。编码器进一步包括用于从无声残差信号和频谱整形信息计算增益参数的增益参数计算器,以及用于基于与有声信号帧相关的信息、增益参数或经量化的增益参数和预测系数形成输出信号的比特流形成器。进一步,第一方面的实施例提供一种经编码的音频信号,包括用于音频信号的有声帧和无声帧的预测系数信息、与有声信号帧相关的进一步信息和用于无声帧的增益参数(或经量化的增益参数)。此情况允许有效地传输语音相关信息以使能经编码的音频信号的解码,以获得具有高音频质量的经合成的(复原)信号。进一步,第一方面的实施例提供一种用于解码包括预测系数的所接收的信号的解码器。解码器包括共振峰信息计算器、噪声产生器、整形器及合成器。共振峰信息计算器用于从预测系数计算语音相关的频谱整形信息。噪声产生器用于产生解码类噪声信号。整形器用于使用频谱整形信息整形解码类噪声信号(或其放大表示)的频谱以获本文档来自技高网
...

【技术保护点】
1.一种用于编码音频信号(102)的编码器(100;200;300),所述编码器包括:/n分析器(120;320),用于从所述音频信号(102)的帧得到预测系数(122;322)和残差信号(124;324);/n共振峰信息计算器(160),用于从所述预测系数(122;322)计算语音相关的频谱整形信息(162);/n增益参数计算器(150;350;350’;550),用于从无声残差信号和所述频谱整形信息(162)计算增益参数(g

【技术特征摘要】
20131018 EP 13189392.7;20140728 EP 14178788.71.一种用于编码音频信号(102)的编码器(100;200;300),所述编码器包括:
分析器(120;320),用于从所述音频信号(102)的帧得到预测系数(122;322)和残差信号(124;324);
共振峰信息计算器(160),用于从所述预测系数(122;322)计算语音相关的频谱整形信息(162);
增益参数计算器(150;350;350’;550),用于从无声残差信号和所述频谱整形信息(162)计算增益参数(gn;gc);和
比特流形成器(190;690),用于基于与有声信号帧相关的信息(142)、所述增益参数(gn;gc)或经量化的增益参数和所述预测系数(122;322)形成输出信号(192;692)。


2.如权利要求1所述的编码器,进一步包括:
决定器(130),用于确定所述残差信号是否是从无声信号音频帧确定的。


3.如权利要求1所述的编码器,其中所述增益参数计算器(150;350;350’;550)包括:
噪声产生器(350a),用于产生编码类噪声信号(n(n));
整形器(350c),用于使用所述语音相关的频谱整形信息(162)和作为临时增益参数(gn(temp))的所述增益参数(gn)对所述编码类噪声信号(n(n))的频谱进行放大(350e)和整形(350d),以获得经放大整形的编码类噪声信号(350g);
比较器(350h),用于比较所述无声残差信号和所述经放大整形的编码类噪声信号(350g)以获得所述无声残差信号和所述经放大整形的编码类噪声信号(350g)之间的相似性的度量;和
控制器(350k),用于确定所述增益参数(gn)并基于所述比较结果调适所述临时增益参数(gn(temp));
其中当所述相似性的度量值高于阈值时,所述控制器(350k;550n)用于将所述编码增益参数(gn)提供至所述比特流形成器。


4.如权利要求1所述的编码器,其中所述增益参数计算器(150;350;350’;550)包括:
噪声产生器(350a),用于产生编码类噪声信号;
整形器(350c),用于使用所述语音相关的频谱整形信息(162)和作为临时增益参数(gn(temp))的所述增益参数(gn)对所述编码类噪声信号(n(n))的频谱进行放大(350e)和整形(350d),以获得经放大整形的编码类噪声信号(350g);
合成器(350m’),用于从所述经放大整形的编码类噪声信号(350g)和所述预测系数(122;322)合成经合成的信号(350l’),并提供所述经合成的信号(350l’);
比较器(350h’),用于比较所述音频信号(102)和所述经合成的信号(350l’)以获得所述音频信号(102)和所述经合成的信号(350l’)之间的相似性的度量;和
控制器(350k),用于确定所述增益参数(gn)并基于所述比较结果调适所述临时增益参数(gn(temp));
其中当所述相似性的度量值高于阈值时,所述控制器(350k)用于将所述编码增益参数(gn)提供至所述比特流形成器。


5.如权利要求4所述的编码器,进一步包括用于记录编码信息的增益存储器(350n’),所述编码信息包括所述编码增益参数(gn;gc)或与其相关的信息其中所述控制器(350k)用于在处理所述音频帧的过程中记录所述编码信息,并且用于基于所述音频信号(102)的先前帧的所述编码信息确定所述音频信号(102)的后续帧的所述增益参数(gn;gc)。


6.如权利要求3所述的编码器,其中所述噪声产生器(350a)用于产生多个随机信号,并组合所述多个随机信号以获得所述编码类噪声信号(n(n))。


7.如权利要求1所述的编码器,进一步包括:
量化器(170),用于接收所述增益参数(gn;gc),并量化所述增益参数(gn;gc)以获得所述经量化的增益参数<...

【专利技术属性】
技术研发人员:吉约姆·福克斯马库斯·缪特拉斯伊曼纽尔·拉维利马库斯·施奈尔
申请(专利权)人:弗朗霍夫应用科学研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利