调适最低有效比特的编码与解码的音频编码器、音频解码器、方法及计算机程序技术

技术编号:26344834 阅读:72 留言:0更新日期:2020-11-13 21:02
一种用于基于经编码音频信息提供经解码音频信息的音频解码器经配置以基于表示频谱值的经编码信息获得经解码频谱值。音频解码器经配置以使用算术解码,针对一组频谱值,基于相应符号码来联合地解码每频谱值两个或更多个最高有效比特,其中相应符号码表示针对一个或多个频谱值的每频谱值两个或更多个最高有效比特。音频解码器经配置以取决于多少最低有效比特信息可用而解码与频谱值中的一个或多个相关联的一个或多个最低有效比特,使得与频谱值中的一个或多个相关联的一个或多个最低有效比特被解码,而针对解码一个或多个最高有效比特所针对的一个或多个其他频谱值,最低有效比特不被解码,一个或多个其他频谱值包括多于一个或多个最高有效比特的比特。音频解码器经配置以使用频谱值来提供经解码音频信息。音频解码器的修改是可能的。还描述了一种音频编码器。

The method of the lowest bit, audio codec and audio codec

【技术实现步骤摘要】
调适最低有效比特的编码与解码的音频编码器、音频解码器、方法及计算机程序本申请是申请人为弗朗霍夫应用科学研究促进协会、申请日为“2018年11月8日”、申请号为“201880085999.0”、专利技术名称为“调适最低有效比特的编码与解码的音频编码器、音频解码器、方法及计算机程序”的分案申请。
根据本专利技术的实施例关于用于基于经编码音频信息提供经解码音频信息的音频解码器。根据本专利技术的其他实施例关于用于基于输入音频信息提供经编码音频信息的音频编码器。根据本专利技术的其他实施例关于用于基于经编码音频信息提供经解码音频信息的方法。根据本专利技术的其他实施例关于用于基于输入音频信息提供经编码音频信息的方法。根据本专利技术的其他实施例关于相应计算机程序。根据本专利技术的实施例关于算术编码音频数据的经改良截断。
技术介绍
在过去,已开发出音频内容的编码及解码的许多不同概念。举例而言,新蓝牙编解码器(NBC)为极类似于在3GPPEVS标准[1]中使用的基于MDCT的TCX音频编解码器的音频编解码器。此二者皆采用标量量化及基于上下文的算术编码(例如,参考用于写码MDCT数据的[2]至[4])。标量量化器为简单的均匀量化器(具有额外死区),其步长由唯一的全局增益(其例如作为边信息被发送至解码器)控制。此全局增益控制由标量量化器引入的失真以及由算术编码器消耗的比特的数目二者。全局增益愈高,失真就愈高,且由算术编码器消耗的比特的数目就愈小。在EVS中,如同在大多数其他通信编解码器中一样,编解码器比特率是恒定的,亦即,存在有限数目个可用于编码MDCT数据的比特(比特预算)。因此,编码器应寻找(或必须寻找)不过低的全局增益,否则由算术编码器消耗的比特的数目会超出比特预算。并且,其应(或必须)寻找不过高的全局增益,否则由量化引入的失真会较高,从而导致经解码输出信号的感知质量较差。理想地,编码器应在每一帧处寻找最佳全局增益:赋予最小失真同时产生少于比特预算的比特数目的全局增益。此目标可例如使用迭代方法来达成,该迭代方法亦已知为速率回路:在回路的每次迭代时,重新量化MDCT数据,估计由算术编码器消耗的比特的数目,且随着比特数目和/或失真变化调整全局增益。然而,速率回路在计算上较为复杂,且为了降低复杂性,通常使用小数目的迭代。此与要求极低计算复杂性的极低功率通信编解码器(例如,新蓝牙编解码器)特别相关。因此,实务上,通常发现次最佳的全局增益。已发现,在一些状况下,所发现的全局增益过高,从而导致所消耗的比特数目显著低于比特预算。在此状况下,存在数个未使用的比特。这些比特实际上可由称为“残差量化/写码”(其例如用于EVS及NBC中)的额外工具使用。此工具使用一个比特pro系数来细化经量化的非零系数,且帮助获得即使在全局增益过高时亦不会过高的失真。此外,已发现,在一些其他状况下,所发现的全局增益过低,从而导致所消耗的比特数目超出比特预算。在此状况下,经量化数据无法被完全编码。换言之,必须省略数据的一部分以便保持在比特预算之内。在EVS标准中(且当前亦在NBC中)采用的方案为藉由将高频率非零系数设定成零来将其截断。由于算术编码器不编码高频率零系数的部分(藉由使用最末非零系数指数),因此,此方法允许节省比特,且若足够的高频率非零系数被截断,则此方法允许保持在比特预算之内。已发现,此方法在低比特率下产生良好结果,因为高频率系数在感知上不太重要,且其可由不规则规噪声替换(使用噪声填充工具,参见例如EVS[1])而无感知质量的显著损失。然而,亦已发现,在高比特率下,此方法可能使编解码器效能严重降级。鉴于此情形,希望有允许在音频质量、复杂性与比特率之间进行经改良权衡的概念。
技术实现思路
根据本专利技术的实施例产生一种用于基于经编码音频信息提供经解码音频信息的音频解码器。该音频解码器经配置以基于表示频谱值的经编码信息获得经解码频谱值。该音频解码器经配置以使用算术解码,针对一组频谱值,基于相应符号码来联合地解码每频谱值(例如,每经量化频谱值)两个或更多个最高有效比特。相应符号码表示针对一个或多个频谱值的每频谱值两个或更多个最高有效比特。该音频解码器经配置以取决于多少最低有效比特信息可用而解码与频谱值中的一个或多个相关联的一个或多个最低有效比特,使得与频谱值(其可例如为经量化频谱值)中的一个或多个相关联的一个或多个最低有效比特被解码,而针对已解码两个或更多个最高有效比特所针对的一个或多个其他频谱值,最低有效比特不被解码,一个或多个其他频谱值包括多于两个或更多个最高有效比特的比特。此外,该音频解码器经配置以使用(经解码)频谱值来提供经解码音频信息。此音频解码器允许在音频质量、复杂性与比特率之间提供良好权衡的高效编码/解码概念。举例而言,音频解码器可较好地处置比特预算不足以在给定比特预算约束下编码音频编码器侧处的所有(经量化)频谱值的状况。该音频解码器基于如下发现:对于给定比特预算,若针对许多频谱值(或甚至针对所有非零频谱值)编码(及解码)一个或多个最高有效比特,同时省略(经量化)频谱值中的一些的最低有效比特的编码(及解码),则可达成相对良好的音频质量。换言之,本专利技术的关键想法在于,在比特预算不足(例如,针对经量化频谱值的完整编码)的状况下,若省略一些最低有效比特的编码及解码,则相比于省略完整频谱值的编码的方案,音频质量的降级通常较小。换言之,已发现,相比于完全省略相对较少量的频谱值的编码,省略许多频谱值的最低有效比特的编码通常仍为减少比特需求(以保持在比特预算之内)的较佳方案(即使仅省略高频率区中的频谱值亦如此)。换言之,本专利技术基于如下发现:(选择性地)省略针对已解码一个或多个最高有效比特所针对的频谱值的最低有效比特的解码是减少比特需求的良好方式,相比于省略高频率范围内的频谱值的编码及解码,该方式带来较少失真。因此,此处所描述的音频解码器通常不会导致比特预算不足以对经量化频谱值进行完整无损编码的帧中的严重信号噪声比降级。此外,已发现,该概念在联合地编码及解码每频谱值两个或更多个最高有效比特的状况下特别高效,因为在此状况下,最高有效比特携载足够有意义的信息,以便即使在不编码及解码最低有效比特的状况下也允许进行良好的音频表示。换言之,藉由联合地解码每频谱值两个或更多个最高有效比特,可确保不存在过多伪声,该将会例如藉由引入编码有高频率区中的少于二个比特的音频内容来产生该伪声。换言之,已发现,本文中所提及的概念实现比特率、复杂性与音频质量之间的良好构成。在较佳实施例中,该音频解码器经配置以将算术编码表示的一个符号映射到至少一个频谱值的至少两个最高有效比特上,该符号表示该至少一个频谱值的该至少两个最高有效比特。因此,可达成由算术编码表示(其为经编码音频信息的部分)的单一符号表示两个或更多个最高有效比特,此允许良好地考虑编码/解码上下文及邻近(经量化)频谱值之间的统计相依性。在较佳实施例中,该算术解码经配置以确定至少两个最高有效本文档来自技高网
...

【技术保护点】
1.一种用于基于输入音频信息(310;410;510;610)提供经编码音频信息(312;412;512;612)的音频编码器(300;400;500;600),/n其中音频编码器经配置以获得(620,630,640,650,660)表示输入音频信息的音频内容的频谱值(330;662;X

【技术特征摘要】
20171110 EP PCT/EP2017/0789591.一种用于基于输入音频信息(310;410;510;610)提供经编码音频信息(312;412;512;612)的音频编码器(300;400;500;600),
其中音频编码器经配置以获得(620,630,640,650,660)表示输入音频信息的音频内容的频谱值(330;662;Xq[n]),且
其中音频编码器经配置以编码(670;800)至少多个频谱值,以便获得表示频谱值的经编码信息(350,450,550,672;sym,lsbs[]);
其中音频编码器经配置以获得(810,814,818,822)增益信息,增益信息确定频谱值的量化的量化步骤,且确定对编码经量化频谱值(330;662;Xq[n])的比特需求;
其中音频编码器经配置以使用算术编码,针对多个频谱值(Xq[0]…Xq[lastnz-1]),使用相应符号码(sym)来编码(878,886,890;1000a,1020a,1040a-1040d)一个或多个最高有效比特,且针对频谱值中的一个或多个编码一个或多个最低有效比特,
其中相应符号码(sym)表示针对一个或多个频谱值的每频谱值一个或多个最高有效比特,
其中音频编码器经配置以取决于可用比特预算而编码(882;898;1010a-1010e,1011a-1011e)与频谱值中的一个或多个相关联的一个或多个最低有效比特,
使得与频谱值中的一个或多个相关联的一个或多个最低有效比特被编码,而针对编码一个或多个最高有效比特所针对的一个或多个其他频谱值,最低有效比特不被编码,一个或多个其他频谱值包括多于一个或多个最高有效比特的比特;且
其中音频编码器经配置以使用表示频谱值的经编码信息来提供经编码音频信息。


2.如权利要求1所述的音频编码器,其中音频编码器经配置以基于频谱值组的能量获得(810)增益信息的第一估计值,
使用增益信息的第一估计值来量化(814)一组频谱值,
计算或估计(818)编码经量化的该组频谱值所需的比特数目,该组频谱值使用增益信息的第一估计值或使用经细化增益信息而被量化,且
取决于所需的比特数目而决定(830)使用第一模式还是第二模式。


3.如权利要求1所述的音频编码器,
其中音频编码器经配置成在以下各者之间可切换
-第一模式,在第一模式中,在可用比特预算被较低频率范围内的经编码频谱值用完的状况下,省略较高频率范围内的非零频谱值的编码,且针对编码一个或多个最高有效比特所针对的所有频谱值,编码最低有效比特,编码一个或多个最高有效比特所针对的所有频谱值包括多于最高有效比特的比特,以及
-第二模式,在第二模式中,编码与频谱值中的一个或多个相关联的一个或多个最低有效比特,而针对编码一个或多个最高有效比特所针对的一个或多个其他频谱值,不编码最低有效比特,一个或多个其他频谱值包括多于最高有效比特的比特;且
其中音频编码器经配置以取决于所需的比特数目且取决于指示多少频谱值包括多于一个或多个最高有效比特的比特的准则而决定使用第一模式还是第二模式。


4.如权利要求1所述的音频编码器,
其中音频编码器经配置成在以下各者之间可切换
-第一模式,在第一模式中,在可用比特预算被较低频率范围内的经编码频谱值用完的状况下,省略较高频率范围内的非零频谱值的编码,且针对编码一个或多个最高有效比特所针对的所有频谱值,编码最低有效比特,编码一个或多个最高有效比特所针对的所有频谱值包括多于最高有效比特的比特,以及
-第二模式,在第二模式中,编码与频谱值中的一个或多个相关联的一个或多个最低有效比特,而针对编码一个或多个最高有效比特所针对的一个或多个其他频谱值,不编码最低有效比特,一个或多个其他频谱值包括多于最高有效比特的比特;且
其中音频编码器经配置以取决于所需的比特数目且取决于比特率而决定使用第一模式还是第二模式,使得若比特率大于或等于比特率阈值及若编码一组频谱值所需的经计算或经估计比特数目大于比特预算,则选择第二模式。


5.如权利要求1所述的音频编码器,其中算术编码经配置以确定一个或多个最高有效比特的比特位置,且将描述比特位置的信息包括至算术编码表示中。


6.如权利要求1所述的音频编码器,其中音频编码器经配置以将至少一个频谱值的至少两个最高有效比特映射到算术编码表示的一个符号上,符号表示至少一个频谱值的至少两个最高有效比特。


7.如权利要求1所述的音频编码器,其中音频编码器经配置以针对编码一个或多个最高有效比特所针对的所有频谱值,编码一个或多个中间比特,编码一个或多个最高有效比特所针对的所有频谱值包括多于一个或多个最高有效比特及最低有效比特的比特,一个或多个中间比特的比特位置在最低有效比特与一个或多个最高有效比特之间。


8.如权利要求1所述的音频编码器,其中音频编码器经配置以在第一编码阶段中
-编码每频谱值一个或多个最高有效比特,以及
-针对编码一个或多个最高有效比特所针对的所有频谱值,编码一个或多个中间比特,编码一个或多个最高有效比特所针对的所有频谱值包括多于一个或多个最高有效比特及最低有效比特的比特,一个或多个中间比特的比特位置在最低有效比特与一个或多个最高有效比特之间,以及
-针对编码一个或多个最高有效比特所针对的、且一个或多个最高有效比特及任何中间比特(在中间比特存在的情况下)指示非零值所针对的所有频谱值,编码符号;以及
其中音频编码器经配置以在第一编码阶段中选择性地省略针对一个或多个最高有效值及任何中间比特(在中间比特存在的情况下)指示零值所针对的频谱值的符号的编码,且
其中音频编码器经...

【专利技术属性】
技术研发人员:伊曼纽尔·拉维利吉约姆·福克斯马库斯·施内尔阿德里安·托马塞克斯特凡·盖尔斯伯格
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1