码簿激励线性预测编码器、译码器及编码、译码方法技术

技术编号:10385731 阅读:180 留言:0更新日期:2014-09-05 12:14
本发明专利技术提供了码簿激励线性预测编码器、译码器及编码、译码方法。根据本发明专利技术的一方面,通过共同句柄簿激励线性预测(CELP)编译码器的码簿激励的增益,连同控制该变换编码帧的变换或反变换电压,可实现跨CELP编码帧及变换编码帧的全域增益控制。根据又另一方面,通过执行在激励信号的加权域的CELP编码中的增益值确定,当改变个别增益值时,可更良好适应于变换编码电压调整的表现而呈现CELP编码比特流的响度变化。

【技术实现步骤摘要】
【专利摘要】本专利技术提供了。根据本专利技术的一方面,通过共同句柄簿激励线性预测(CELP)编译码器的码簿激励的增益,连同控制该变换编码帧的变换或反变换电压,可实现跨CELP编码帧及变换编码帧的全域增益控制。根据又另一方面,通过执行在激励信号的加权域的CELP编码中的增益值确定,当改变个别增益值时,可更良好适应于变换编码电压调整的表现而呈现CELP编码比特流的响度变化。【专利说明】本申请是分案申请,其母案的申请号为201080058349.0,申请日为2010年10月19日,专利技术名称为“多模式音频编译码器及其适用的码簿激励线性预测编码”。
本专利技术涉及多模式音频编码,诸如统一语音及音频编译码器,或适用于一般音频信号诸如音乐、语音、混合及其它信号的编译码器,及其适用的一种CELP编码方案。
技术介绍
混合不同编码模式来编码表示不同类型音频信号诸如语音、音乐等的混合的一般音频信号是有利的个别编码模式可适用于特定的音频类型,因此,多模式音频编码器可利用随着时间与音频内容类型的改变相对应地改变编码模式的优势换言之,多模式音频编码器例如可判定使用特别专用于编码语音的编码模式来编码该音频信号的语音内容部分,使用另一编码模式来编码该音频内容的表示非语音内容诸如音乐的部分。线性预测编码模式倾向于较为适合用以编码语音内容,而只要有关音乐的编码,则频域编码模式倾向于表现效能优于线性预测编码模式。但使用不同的编码模式,使得其难以全域地调整已编码的比特流内增益,或更准确地说,已编码的比特流的音频内容的译码表示型态的增益,无需实际上将该已编码的比特流译码然后再度重新编码增益已调整的译码表示型态,迂回绕道必然减低已调整增益的比特流的质量,原因在于再量化在重新编码已译码且已调整增益的表示型态进行。举例来说,在AAC中,通过改变8-位字段「全域增益」的值,在比特流层面可实现输出电压的调整。此比特流元素可简单地被通过、编辑,而无需完整译码及重编码。如此,此处理并未引入任何质量下降,并且可毫无损耗地取消。有些应用用途实际上使用了此选项。举例来说,一种免费软件称作「AAC增益」,恰应用了前述方法。此种软件为免费软件「MP3增益」的衍生,其应用与MPEC1/2层3相同的技术。在刚萌芽的USAC编译码器中,FD编码模式从AAC继承8-位全域增益。因此,若USAC只以FD模式执行,例如用于较高比特率,则与AAC比较,全然保留电压调整功能。但一旦允许模式转换,则此项可能性不复存在。举例来说,在TCX模式中,也有一个具相同功能的比特流元素也称作「全域增益」,其具有7-位长度。换言之,编码个别模式的个别增益元素的比特数主要适应于各自的编码模式,来实现一方面耗用较少比特于增益控制,另一方面避免质量因增益调整的量化太过粗糙而降低间的最佳折衷。显然此折衷在比较TCX模式与FD模式时导致不同的比特数。在目前萌生的USAC标准的ACELP模式中,电压可通过具有2-位长度的比特流元素「平均能量」控制。再次,显然过多比特用于平均能量与过少比特用于平均能量间的折衷,结果导致与其它编码模式(即,TCX和FD编码模式)相比不同的比特数。如此,到目前为止,全域地调整通过多模式编码所编码的已编码比特流的译码表示型态的增益烦琐且易于造成质量的降低。执行译码接着执行增益调整及重新编码,或单独通过调整影响比特流的不同编码模式部分的增益的不同模式的个别比特流元素,试探性地执行响度电压的调整。但后一可能性极其可能将假像(artifacts)引入已增益调整的已译码的表示型态。因此,本专利技术的目的是提供一种多模式音频编码器,其允许全域增益调整,而无译码及重新编码的绕道,就质量及压缩率而言只有中等降低,及提供一种适用于嵌入多模式音频编码而达成类似性质的CELP编译码器。该目的可通过所附的独立权利要求的主题实现。
技术实现思路
根据本专利技术的第一方面,本申请专利技术人了解当尝试跨不同编码模式使得全域增益调整协调时所遭遇的问题,系植基于实际上不同编码模式具有不同帧尺寸且以不同方式分解成子帧。根据本专利技术的第一方面,此困难可通过将子帧的比特流元素不同地编码成全域增益值,使得帧的全域增益值的改变导致该音频内容的译码表示型态的输出电压的调整。同时,不同的编码可节省位,否则当将新语法元素导入编码比特流时将出现位。另外,不同的编码通过允许设定全域增益值的时间分辨率比前述比特流元素不同地编码成全域增益值来调整各子帧的增益时的时间分辨率更低,而允许全域调整编码的比特流的增益时的负担减轻。因此,根据本申请的第一方面,一种用以基于编码比特流而提供音频内容的译码表示型态的多模式音频译码器,该多模式音频译码器被配置为译码该编码比特流的每个帧的全域增益值,其中帧的第一子集以第一编码模式编码,及帧的第二子集以第二编码模式编码,而该第二子集的各个帧由多于一个子帧组成;对帧的该第二子集的子帧的至少一个子集的每个子帧,与各帧的全域增益值不同地译码相对应的比特流元素;在译码帧的第二子集的子帧的至少一个子集的子帧时使用所述全域增益值及相对应的比特流元素,及译码帧的第一子集时使用该全域增益值,完成所述比特流的译码,其中该多模式音频译码器被配置为使得编码比特流内的帧的全域增益值变化导致该译码音频内容表示型态的输出电压的调整。根据本第一方面,一种多模式音频编码器被配置为将音频内容编码成编码的比特流而帧的第一子集以第一编码模式编码及帧的第二子集以第二编码模式编码,此时帧的第二子集由一个或多个子帧组成,此时该多模式音频编码器被配置为确定和编码每帧的全域增益值,及对第二子集的子帧的至少一个子集的每个子帧与各帧的全域增益值不同地编码和确定相对应的比特流元素,其中执行多模式音频编码方法,使得编码比特流内的帧的全域增益值的改变导致音频内容的译码表示型态在译码端的输出电位的调整。根据本申请的第二方面,本申请专利技术人发现若CELP编译码器的码簿激励的增益连同变换编码帧的变换或反变换电压一起控制,则跨经CELP编码帧及变换编码帧的通用增益控制可经由维持前文概述的优点实现。据此,根据第二方面,一种用以基于编码比特流而提供音频内容的译码表示型态的多模式音频译码器,其帧的第一子集以CELP编码,及其帧的第二子集以变换编码,该多模式音频译码器包括CELP译码器,其被配置为解码该第一子集的目前帧,该CELP译码器包括激励发生器,其被配置为通过基于该编码比特流内的该第一子集的目前帧的码簿指标及过去激励而组成码簿激励,以及基于该编码比特流内部之全域增益值而设定该码簿激励之增益,来产生该第一子集的前帧的目前激励;以及线性预测合成滤波器,其被配置为基于该编码比特流内的第一子集的目前帧的线性预测滤波系数而滤波目前激励;变换译码器被配置为通过如下方式解码该第二子集的目前帧:由编码比特流构造第二子集的目前帧的频谱信息,及对该频谱信息进行频域至时域变换来获得时域信号,使得时域信号的电压取决于全域增益值。同理,根据第二方面,一种多模式音频编码器,用于通过CELP编码音频内容的帧的第一子集及通过变换编码的第二帧子集而将该音频内容编码成编码比特流,该多模式音频编码器包括=CELP编码器,被配置为编码第一子集的目前帧,该CELP编码器包括:线性预测分析器,其被配置为对该第一子集的目前帧本文档来自技高网
...

【技术保护点】
一种CELP译码器,包括:激励发生器(540),被配置为产生比特流(544)的目前帧的目前激励(542),该产生通过基于所述比特流(544)内的目前帧的自适应码簿指标(550)及过去激励(548),构造自适应码簿激励(546);基于所述比特流(544)内的目前帧的创新码簿指标(554),构造创新码簿激励(552);计算由所述比特流(36,134,304,514)内的线性预测滤波系数(556)所构造的加权线性预测合成滤波器而频谱加权的所述创新码簿激励(546)的能量的估值;基于所述比特流(544)内的全域增益值(560)与估算的所述能量间的比,设定所述创新码簿激励(552)的增益;以及组合所述自适应码簿激励(546)和所述创新码簿激励(552)以获得所述目前激励(542);以及线性预测合成滤波器(542),被配置为基于所述线性预测滤波系数(556)而滤波所述目前激励(542)。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:拉尔夫·盖尔纪尧姆·福奇斯马库斯·穆赖特鲁斯伯恩哈德·格里
申请(专利权)人:弗兰霍菲尔运输应用研究公司
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1