立体声音频信号编码器制造技术

技术编号:22107533 阅读:31 留言:0更新日期:2019-09-14 05:16
一种方法,包括:接收至少两个音频通道信号;针对第一帧,确定表示至少两个通道音频信号之间的差异的至少两个参数;标量量化所述至少两个参数以生成至少两个索引值;对至少两个参数的初始标量量化参数进行自适应编码;确定初始标量量化参数是否具有与预定值不同的值;如果初始标量量化参数具有与预定值不同的值,则对任何未编码的标量量化参数进行自适应编码;如果初始标量量化参数具有等于预定值的值,则确定至少两个标量量化参数是否全部具有等于预定值的值;如果初始标量量化参数具有等于预定值的值且至少两个标量量化参数中的至少一个具有与预定值不同的值,则对任何未编码的标量量化参数进行自适应编码,并生成指示输出是固定速率编码或可变速率编码中的一个的指示符;如果初始标量量化参数具有等于预定值的值且至少两个标量量化参数全部具有等于预定值的值,则生成指示输出是固定速率编码或可变速率编码中的另一个的指示符;根据至少两个参数,生成至少两个音频通道信号的单声道表示;以及对单声道表示进行编码。

Stereo Audio Signal Encoder

【技术实现步骤摘要】
【国外来华专利技术】立体声音频信号编码器
本申请涉及立体声音频信号编码器,尤其但非排它地,涉及用于在便携式装置中使用的立体声音频信号编码器。
技术介绍
如语音或音乐的音频信号被编码,例如以使能音频信号的有效传输或存储。音频编码器和解码器(也称为编解码器)用于表示基于音频的信号,诸如音乐和环境声音(其在语音编码术语中可称为背景噪声)。这些类型的编码器通常不使用语音模型来进行编码处理,而是使用用于表示包括语音的所有类型的音频信号的处理。语音编码器和解码器(编解码器)可被认为是针对语音信号优化的音频编解码器,并且可以以固定或可变比特率来操作。音频编解码器还可被配置为以变化的比特率来操作。在较低比特率的情况下,可以对这样的音频编解码器进行优化,以便以与纯语音编解码器相当的编码速率来处理语音信号。在较高比特率的情况下,音频编解码器可以用更高的质量和性能对包括音乐、背景噪声和语音的任何信号进行编码。可变速率音频编解码器还可以实现嵌入式的可伸缩编码结构和比特流,其中,附加比特(特定比特量通常被称为层)在较低速率时改进编码,并且其中,较高速率的比特流可被截短以获得较低速率编码的比特流。这种音频编解码器可以将纯粹针对语音信号而设计的编解码器用作核心层或最低比特率编码。音频编解码器被设计为保持高(感知)质量,同时提高压缩比。因此,代替波形匹配编码,通常采用各种参数方案来降低比特率。对于诸如立体声信号的多通道音频,通常对单声道表示使用较大量的可用比特率,而利用使用相对较少比特的参数方法对立体声或多通道信息进行编码。当前第三代合作伙伴计划(3GPP)的语音和音频标准化工作旨在通过编码效率、带宽以及通道数量来提高编码信号的质量。正在准备立体声/双耳扩展以用于增强型语音服务(EVS)语音和音频编解码器候选。编码效率对于该提议非常重要,尤其是对于较低的编解码器比特率。因为如果总比特率等于或超过双模式的比特率,则大比特率扩展的增加将会贬损进行扩展的益处。所提出的立体声/双耳扩展包括编码的立体声参数。提高这些参数的编码效率意味着降低扩展的比特率以及使用“保存的”比特来更好地对单声道下混合进行编码。这在低比特率的情况下尤其有用,其中,编码下混合的质量对比特率更敏感。在解决立体声参数的编码效率时,可以实现显著的比特节省。立体声参数的编码效率涉及值(级别)的量化,随后进行熵编码以进一步降低比特率。在EP2856776中公开的先前提出的用于对立体声参数进行编码的方法使用Golomb-Rice编码的自适应版本。
技术实现思路
根据第一方面,提供一种方法,其包括:接收至少两个音频通道信号;针对第一帧,确定表示至少两个通道音频信号之间的差异的至少两个参数;标量量化至少两个参数以生成至少两个索引值;对至少两个参数的初始标量量化参数进行自适应编码;确定初始标量量化参数是否具有与预定值不同的值;如果初始标量量化参数具有与预定值不同的值,则对任何未编码的标量量化参数进行自适应编码;如果初始标量量化参数具有等于预定值的值,则确定至少两个标量量化参数是否全部具有等于预定值的值;如果初始标量量化参数具有等于预定值的值且至少两个标量量化参数中的至少一个具有与预定值不同的值,则对任何未编码的标量量化参数进行自适应编码,并生成指示输出是固定速率编码或可变速率编码中的一个的指示符;如果初始标量量化参数具有等于预定值的值且至少两个标量量化参数全部具有等于预定值的值,则生成指示输出是固定速率编码或可变速率编码中的另一个的指示符;根据至少两个参数,生成至少两个音频通道信号的单声道表示;以及对单声道表示进行编码。对初始标量量化参数进行自适应编码和对任何未编码的标量量化参数进行自适应编码可以包括:确定用于对与标量量化参数相关联的索引值进行重排序的初始索引映射,并确定用于对与任何未编码的标量量化参数相关联的至少一个其它索引值进行重排序的至少一个其它索引映射,其中,至少一个其它索引映射基于与标量量化参数相关联的索引值而确定;基于初始索引映射,对与标量量化参数相关联的索引值进行重排序;基于至少一个其它索引映射,对与任何未编码的标量量化参数相关联的至少一个其它索引值进行重排序;根据重排序的与标量量化参数相关联的索引值的顺序位置,对重排序的与标量量化参数相关联的索引值进行编码;以及基于重排序的与任何未编码的标量量化参数相关联的至少一个其它索引值的顺序位置,对与任何未编码的标量量化参数相关联的至少一个其它索引值进行编码。对标量量化参数进行自适应编码可以包括:确定索引值的出现频率;根据索引值的出现频率,对索引值进行重排序以生成重排序的索引值;以及根据重排序的索引值的顺序位置,对重排序的索引值进行编码。根据重排序的索引值的顺序位置,对重排序的索引值进行编码可以包括:根据重排序的索引值的顺序位置,对重排序的索引值应用Golomb-Rice编码。确定索引值的出现频率还可以包括:对于一组索引值,接收第一索引值;增加与第一索引值相关联的计数值;以及减少与第一索引值以外的索引值相关联的计数值。标量量化至少两个参数还可以包括:根据预定映射,对标量量化输出进行排序。固定速率编码或可变速率编码中的一个可以是固定速率编码,而固定速率编码或可变速率编码中的另一个可以是可变速率编码。对单声道表示进行编码可以包括:确定用于对至少两个标量量化参数进行编码的比特数;以及基于所确定的比特数,对单声道表示进行编码。根据第二方面,提供一种方法,其包括:从信号的第一部分解码至少一个参数索引值,其中,参数表示至少两个通道音频信号之间的差异,并从信号的第二部分解码固定速率/可变速率指示符,其中,信号是编码的多通道音频信号;基于第一确定的重排序,对至少一个参数索引值中的第一参数索引值进行重排序以生成第一重排序的索引值;确定与第一重排序的索引相关联的参数值是否与预定值不同;如果与第一重排序的索引相关联的参数值与预定值不同,则对至少一个参数索引值中的任何其它参数索引值进行自适应重排序;确定固定速率/可变速率指示符是否是固定速率/可变速率值中确定的一个;如果与第一重排序的索引相关联的参数值等于预定值且固定速率/可变速率指示符是固定速率/可变速率值中确定的一个,则对至少一个参数索引值中的任何其它索引值进行自适应重排序;以及如果与第一重排序的索引相关联的参数值等于预定值且固定速率/可变速率指示符不是固定速率/可变速率值中确定的一个,则复制至少一个参数索引值以用于帧。基于第一确定的重排序,对至少一个参数索引值中的第一参数索引值进行重排序以生成第一重排序的索引值可以包括:基于第一确定的重排序,对第一参数索引值进行重排序以生成第一重排序的索引值;以及对至少一个参数索引值中的任何其它索引值进行自适应重排序包括:基于第二确定的重排序,对任何其它索引值进行重排序以生成第二重排序的索引值,其中,第二确定的重排序是基于第一重排序的索引值。对至少一个参数索引值中的任何其它索引值进行自适应重排序可以包括:确定索引值的出现频率;对索引值进行重排序以生成重排序的索引值,其中,重排序取决于重排序的索引值的出现频率。所述方法还可以包括:对重排序的索引值进行反量化以生成参数。从信号的第一部分解码可以包括:使用Golomb-Rice解码,对信号的第一部分进行解码。固定速率/可变速率值中确本文档来自技高网
...

【技术保护点】
1.一种方法,包括:接收至少两个音频通道信号;针对第一帧,确定表示所述至少两个通道音频信号之间的差异的至少两个参数;标量量化所述至少两个参数以生成至少两个索引值;对所述至少两个参数的初始标量量化参数进行自适应编码;确定所述初始标量量化参数是否具有与预定值不同的值;如果所述初始标量量化参数具有与所述预定值不同的值,则对任何未编码的标量量化参数进行自适应编码;如果所述初始标量量化参数具有等于所述预定值的值,则确定所述至少两个标量量化参数是否全部具有等于所述预定值的值;如果所述初始标量量化参数具有等于所述预定值的值且所述至少两个标量量化参数中的至少一个具有与所述预定值不同的值,则对任何未编码的标量量化参数进行自适应编码,并生成指示输出是固定速率编码或可变速率编码中的一个的指示符;如果所述初始标量量化参数具有等于所述预定值的值且所述至少两个标量量化参数全部具有等于所述预定值的值,则生成指示所述输出是固定速率编码或可变速率编码中的另一个的指示符;根据所述至少两个参数,生成所述至少两个音频通道信号的单声道表示;以及对所述单声道表示进行编码。

【技术特征摘要】
【国外来华专利技术】2017.01.31 GB 1701596.71.一种方法,包括:接收至少两个音频通道信号;针对第一帧,确定表示所述至少两个通道音频信号之间的差异的至少两个参数;标量量化所述至少两个参数以生成至少两个索引值;对所述至少两个参数的初始标量量化参数进行自适应编码;确定所述初始标量量化参数是否具有与预定值不同的值;如果所述初始标量量化参数具有与所述预定值不同的值,则对任何未编码的标量量化参数进行自适应编码;如果所述初始标量量化参数具有等于所述预定值的值,则确定所述至少两个标量量化参数是否全部具有等于所述预定值的值;如果所述初始标量量化参数具有等于所述预定值的值且所述至少两个标量量化参数中的至少一个具有与所述预定值不同的值,则对任何未编码的标量量化参数进行自适应编码,并生成指示输出是固定速率编码或可变速率编码中的一个的指示符;如果所述初始标量量化参数具有等于所述预定值的值且所述至少两个标量量化参数全部具有等于所述预定值的值,则生成指示所述输出是固定速率编码或可变速率编码中的另一个的指示符;根据所述至少两个参数,生成所述至少两个音频通道信号的单声道表示;以及对所述单声道表示进行编码。2.根据权利要求1所述的方法,其中,对初始标量量化参数进行自适应编码和对任何未编码的标量量化参数进行自适应编码包括:确定用于对与所述标量量化参数相关联的索引值进行重排序的初始索引映射,并确定用于对与所述任何未编码的标量量化参数相关联的至少一个其它索引值进行重排序的至少一个其它索引映射,其中,所述至少一个其它索引映射基于与所述标量量化参数相关联的索引值而确定;基于所述初始索引映射,对与所述标量量化参数相关联的索引值进行重排序;基于所述至少一个其它索引映射,对与所述任何未编码的标量量化参数相关联的至少一个其它索引值进行重排序;根据重排序的与所述标量量化参数相关联的索引值的顺序位置,对重排序的与所述标量量化参数相关联的索引值进行编码;以及基于重排序的与所述任何未编码的标量量化参数相关联的至少一个其它索引值的顺序位置,对与所述任何未编码的标量量化参数相关联的至少一个其它索引值进行编码。3.根据权利要求1所述的方法,其中,对所述标量量化参数进行自适应编码包括:确定索引值的出现频率;根据所述索引值的出现频率,对所述索引值进行重排序以生成重排序的索引值;以及根据重排序的索引值的顺序位置,对重排序的索引值进行编码。4.根据权利要求3所述的方法,其中,确定索引值的出现频率还包括:对于一组索引值,接收第一索引值;增加与所述第一索引值相关联的计数值;以及减少与所述第一索引值以外的索引值相关联的计数值。5.根据权利要求2至4中任一项所述的方法,其中,根据重排序的索引值的顺序位置,对重排序的索引值进行编码包括:根据重排序的索引值的顺序位置,对重排序的索引值应用Golomb-Rice编码。6.根据权利要求1至5中任一项所述的方法,其中,标量量化所述至少两个参数还包括:根据预定映射,对所述标量量化输出进行排序。7.根据权利要求1至6中任一项所述的方法,其中,固定速率编码或可变速率编码中的一个是固定速率编码,而固定速率编码或可变速率编码中的另一个是可变速率编码。8.根据权利要求1至7中任一项所述的方法,其中,对单声道表示进行编码包括:确定用于对所述至少两个标量量化参数进行编码的比特数;以及基于所确定的比特数,对所述单声道表示进行编码。9.一种方法,包括:从信号的第一部分解码至少一个参数索引值,其中,所述参数表示至少两个通道音频信号之间的差异,并从所述信号的第二部分解码固定速率/可变速率指示符,其中,所述信号是编码的多通道音频信号;基于第一确定的重排序,对所述至少一个参数索引值中的第一参数索引值进行重排序以生成第一重排序的索引值;确定与所述第一重排序的索引相关联的参数值是否与预定值不同;如果与所述第一重排序的索引相关联的参数值与所述预定值不同,则对所述至少一个参数索引值中的任何其它参数索引值进行自适应重排序;确定所述固定速率/可变速率指示符是否是固定速率/可变速率值中确定的一个;如果与所述第一重排序的索引相关联的参数值等于所述预定值且所述固定速率/可变速率指示符是固定速率/可变速率值中确定的一个,则对所述至少一个参数索引值中的任何其它索引值进行自适应重排序;以及如果与所述第一重排序的索引相关联的参数值等于所述预定值且所述固定速率/可变速率指示符不是固定速率/可变速率值中确定的一个,则复制所述至少一个参数索引值以用于帧。10.根据权利要求9所述的方法,其中,基于第一确定的重排序,对所述至少一个参数索引值中的第一参数索引值进行重排序以生成第一重排序的索引值包括:基于第一确定的重排序,对第一参数索引值进行重排序以生成第一重排序的索引值;以及对所述至少一个参数索引值中的任何其它索引值进行自适应重排序包括:基于第二确定的重排序,对任何其它索引值进行重排序以生成第二重排序的索引值,其中,所述第二确定的重排序是基于所述第一重排序的索引值。11.根据权利要求9所述的方法,其中,对所述至少一个参数索引值中的任何其它索引值进行自适应重排序包括:确定索引值的出现频率;对所述索引值进行重排序以生成重排序的索引值,其中,所述重排序取决于重排序的索引值的出现频率。12.根据权利要求9至11中任一项所述的方法,还包括:对所述重排序的索引值进行反量化以生成所述参数。13.根据权利要求9至12中任一项所述的方法,其中,从信号的第一部分解码包括:使用Golomb-Rice解码,对信号的第一部分进行解码。14.根据权利要求9至13中任一项所述的方法,其中,固定速率/可变速率值中确定的一个是固定速率编码指示符值。15.根据权利要求9至14中任一项所述的方法,还包括:从信号的另一个部分接收编码的下混合通道信号;确定在所述信号的所述第一部分中使用的比特数;基于在所述信号的所述第一部分中使用的所述比特数,对所述编码的下混合通道信号进行解码。16.根据权利要求1至15中任一项所述的方法,其中,所述预定值是零。17.一种装置,被配置为执行根据权利要求1至8中任一项所述的方法。18.一种装置,被配置为执行根据权利要求9至16中任一项所述的方法。19.一种装置,包括:参数确定器,被配置为针对第一帧,确定表示所述至少两个通道音频信号之间的差异的至少两个参数;标量...

【专利技术属性】
技术研发人员:A·瓦西拉凯
申请(专利权)人:诺基亚技术有限公司
类型:发明
国别省市:芬兰,FI

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1