使用信号白化作为预处理的多信号音频编码制造技术

技术编号:28048771 阅读:26 留言:0更新日期:2021-04-09 23:40
用于编码至少三个音频信号的多信号编码器包括:信号预处理器(100),用于单独地预处理每个音频信号以获得至少三个经预处理的音频信号,其中,预处理被执行为使得经预处理的音频信号相对于预处理之前的信号被白化;自适应联合信号处理器(200),用于对该至少三个经预处理的音频信号执行处理,以获得至少三个经联合处理的信号或者未处理的信号和至少两个经联合处理的信号;信号编码器(300),用于对每个信号进行编码以获得一个或多个经编码的信号;以及输出接口(400),用于发送或存储经编码的多信号音频信号,该经编码的多信号音频信号包括该一个或多个经编码的信号、与所述预处理相关的边信息和与所述处理相关的边信息。

【技术实现步骤摘要】
【国外来华专利技术】使用信号白化作为预处理的多信号音频编码

技术介绍
实施例涉及具有信号自适应联合声道处理的基于MDCT的多信号编码和解码系统,其中,信号可以是声道,并且多信号是多声道信号,或者备选地,音频信号是声场描述的分量,例如环境立体声(Ambisonics)分量,即一阶环境立体声中的W、X、Y、Z或高阶环境立体声描述中的任何其他分量。信号也可以是声场的A格式或B格式或任何其他格式描述的信号。·在MPEGUSAC[1]中,使用复杂预测、MPS2-1-2或具有频段受限或全频段残余信号的统一立体声对两个声道执行联合立体声编码。·MPEG环绕[2]分层地组合OTT和TTT盒,以用于在有残余信号的传输或没有残余信号的传输的情况下对多声道音频进行联合编码。·MPEG-H四声道元素[3]分层地应用MPS2-1-2立体声盒,随后为构建“固定的”4x4重混树(remixingtree)的复杂预测/MS立体声盒。·AC4[4]引入了新的3声道、4声道和5声道元素,其允许经由所发送的混合矩阵和随后的联合立体声编码信息来重新混合所发送的声道。·先本文档来自技高网...

【技术保护点】
1.一种用于编码至少三个音频信号的多信号编码器,包括:/n信号预处理器(100),用于单独地预处理每个音频信号以获得至少三个经预处理的音频信号,其中,所述预处理被执行为使得经预处理的音频信号相对于预处理之前的信号被白化;/n自适应联合信号处理器(200),用于对所述至少三个经预处理的音频信号执行处理,以获得至少三个经联合处理的信号或者未处理的信号和至少两个经联合处理的信号;/n信号编码器(300),用于对每个信号进行编码以获得一个或多个经编码的信号;以及/n输出接口(400),用于发送或存储经编码的多信号音频信号,所述经编码的多信号音频信号包括所述一个或多个经编码的信号、与所述预处理相关的边信...

【技术特征摘要】
【国外来华专利技术】20180704 EP 18181767.71.一种用于编码至少三个音频信号的多信号编码器,包括:
信号预处理器(100),用于单独地预处理每个音频信号以获得至少三个经预处理的音频信号,其中,所述预处理被执行为使得经预处理的音频信号相对于预处理之前的信号被白化;
自适应联合信号处理器(200),用于对所述至少三个经预处理的音频信号执行处理,以获得至少三个经联合处理的信号或者未处理的信号和至少两个经联合处理的信号;
信号编码器(300),用于对每个信号进行编码以获得一个或多个经编码的信号;以及
输出接口(400),用于发送或存储经编码的多信号音频信号,所述经编码的多信号音频信号包括所述一个或多个经编码的信号、与所述预处理相关的边信息和与所述处理相关的边信息。


2.根据权利要求1所述的多信号编码器,其中,所述自适应联合信号处理器(200)被配置为对所述至少三个经预处理的音频信号执行宽带能量归一化(210),使得每个经预处理的音频信号都具有归一化的能量,以及
其中,所述输出接口(400)被配置为包括每个经预处理的音频信号的宽带能量归一化值(534)来作为进一步的边信息。


3.根据权利要求2所述的多信号编码器,其中,所述自适应联合信号处理器(200)被配置为:
计算(212)关于经预处理的音频信号的平均能量的信息;
计算(211)关于每个经预处理的音频信号的能量的信息,以及
基于所述关于平均能量的信息和关于特定的经预处理的音频信号的能量的信息,计算(213、214)所述能量归一化值。


4.根据前述权利要求中的一项所述的多信号编码器,
其中,所述自适应联合信号处理器(200)被配置为根据平均能量和特定的经预处理的音频信号的能量来计算(213、214)该经预处理的音频信号的缩放比例(534b),以及
其中,所述自适应联合信号处理器(200)被配置用于确定标记(534a),所述标记指示所述缩放比例是用于放大还是缩小,并且其中,每个信号的标记被包括在经编码的信号中。


5.根据权利要求4所述的多信号编码器,
其中,所述自适应联合信号处理器(200)被配置为将所述缩放比例量化(214)到相同的量化范围,而与缩放是放大还是缩小无关。


6.根据前述权利要求中的一项所述的多信号编码器,其中,所述自适应联合信号处理器(200)被配置为:
相对于参考能量来对每个经预处理的音频信号进行归一化(210)以获得至少三个归一化信号;
计算(220)所述至少三个归一化信号中的每个可能的归一化信号对的互相关值;
选择(229)具有最高互相关值的信号对;
确定(232a)所选择的信号对的联合立体声处理模式;以及
根据所确定的联合立体声处理模式来对所选择的信号对进行联合立体声处理(232b),以获得经处理的信号对。


7.根据权利要求6所述的多信号编码器,其中,所述自适应联合信号处理器(200)被配置为应用级联信号对预处理,或者其中,所述自适应联合信号处理器(200)被配置为应用非级联信号对处理,
其中,在所述级联信号对预处理中,经处理的信号对中的信号在进一步的迭代步骤中是可选择的,所述进一步的迭代步骤由以下操作组成:计算更新的互相关值,选择具有最高互相关值的信号对,确定所选择的信号对的联合立体声处理模式,以及根据所确定的联合立体声处理模式对所选择的信号对进行联合立体声处理,或者
其中,在所述非级联信号对处理中,经处理的信号对中的信号在以下操作中是不可选择的:附加选择具有最高互相关值的信号对,确定所选择的信号对的联合立体声处理模式,以及根据所确定的联合立体声处理模式对所选择的信号对进行联合立体声处理。


8.根据前述权利要求中的一项所述的多信号编码器,
其中,所述自适应联合信号处理器(200)被配置为确定作为在成对处理过程之后剩余的信号而要被单独地编码的信号,以及
其中,所述自适应联合信号处理器(200)被配置为在执行所述成对处理过程之前修改应用于该信号的能量归一化,例如在执行所述成对处理过程之前使应用于该信号的能量归一化恢复原状(237)或者至少部分地恢复原状。


9.根据前述权利要求中的一项所述的多信号编码器,
其中,所述自适应联合信号处理器(200)被配置为针对要由所述信号编码器(300)处理的每个信号确定比特分配信息(536),其中,所述输出接口(400)被配置为将每个信号的比特分配信息(536)引入到经编码的信号中。


10.根据前述权利要求中的一项所述的多信号编码器,
其中,所述自适应联合信号处理器(200)被配置用于计算(282)要由所述信号编码器(300)处理的每个信号的信号能量信息,
计算(284)要由所述信号编码器(300)编码的所述多个信号的总能量;
基于所述信号能量信息和所述总能量信息来计算(286)每个信号的比特分配信息(536),以及
其中,所述输出接口(400)被配置为针对每个信号将所述比特分配信息引入到经编码的信号中。


11.根据权利要求10所述的多信号编码器,
其中,所述自适应联合信号处理器(200)被配置为:可选地向每个信号指派(290)初始数量的比特,基于所述比特分配信息指派(291)多个比特,可选地执行(292)进一步的精炼步骤,或可选地执行(292)最终捐赠步骤,以及
其中,所述信号编码器(300)被配置为使用每个信号的所指派的比特来执行信号编码。


12.根据前述权利要求中的一项所述的多信号编码器,其中,所述信号预处理器(100)被配置为针对每个音频信号执行:
时间到频谱的转换操作(108、110、112),以获得每个音频信号的频谱;
针对每个信号频谱的时间噪声成形操作(114a,114b)和/或频域噪声成形操作(116),以及
其中,所述信号预处理器(100)被配置为在所述时间噪声成形操作和/或所述频域噪声成形操作之后将信号频谱馈送给所述自适应联合信号处理器(200),以及
其中,所述自适应联合信号处理器(200)被配置为对接收到的信号频谱执行联合信号处理。


13.根据前述权利要求中的一项所述的多信号编码器,其中,所述自适应联合信号处理器(200)被配置为
针对所选择的信号对中的每个信号,确定:用于诸如L/R的全频带分离编码模式的必要比特率或用于诸如M/S的全频带联合编码模式的必要比特率,或者用于诸如M/S的频带方式联合编码模式的比特率加上用于诸如M/S掩码的频带方式信令的必要比特,
针对信号对的所有频带,将分离编码模式或联合编码模式确定为特定模式,这是当大部分频带已经被确定用于所述特定模式,而少于所有频带的10%的少部分频带已经被确定为该另一编码模式时的情况;或者确定需要最少量比特的编码模式,以及
其中,所述输出接口(400)被配置为将指示包括到经编码的信号中,所述指示指出将所述特定模式用于帧的所有频带,而不是将编码模式掩码用于所述帧。


14.根据前述权利要求中的一项所述的多信号编码器,
其中,所述信号编码器(300)包括用于每个单独信号或跨两个或更多个信号的速率回路处理器,所述速率回路处理器被配置用于接收和使用针对特定信号或针对两个或更多个信号的比特分配信息(536)。


15.根据前述权利要求中的一项所述的多信号编码器,
其中,所述自适应联合信号处理器(200)被配置为自适应地选择用于联合编码的信号对,或者其中,所述自适应联合信号处理器(200)被配置用于针对每个所选择的信号对来确定频带方式中/边编码模式、全频带中/边编码模式或全频带左/右编码模式,并且其中,所述输出接口(400)被配置用于将所选择的编码模式作为边信息(532)指示在所述经编码的多信号音频信号中。


16.根据前述权利要求中的一项所述的多信号编码器,
其中,所述自适应联合信号处理器(200)被配置用于:当以中/边模式或以左/右模式进行编码时,基于每个频带中的估计比特率来形成频带方式中/边决定与左/右决定的对比,并且其中,最终联合编码模式是基于频带方式中/边与左/右决定的对比的结果确定的。


17.根据前述权利要求中的一项所述的多信号编码器,其中,所述自适应联合信号处理器(200)被配置用于执行(260)频谱带复制处理或智能间隙填充处理,以用于确定用于所述频谱带复制处理或所述智能间隙填充处理的参数化边信息,并且其中,所述输出接口(400)被配置用于将频谱带复制或智能间隙填充边信息(532)作为附加边信息包括在经编码的信号中。


18.根据权利要求18所述的多信号编码器,
其中,所述自适应联合信号处理器(200)被配置用于对经编码的信号对执行立体声智能间隙填充处理,并且附加地,对要被单独地编码的至少一个信号执行单信号智能间隙填充处理。


19.根据前述权利要求中的一项所述的多信号编码器,
其中,所述至少三个音频信号包括低频增强信号,并且其中,所述自适应联合信号处理器(200)被配置为应用信号掩码,所述信号掩码指示自适应联合信号处理器(200)将针对哪些信号是激活的,并且其中,所述信号掩码指示所述低频增强信号将不会在所述至少三个经预处理的音频信号的成对处理中使用。


20.根据权利要求1至5中一项所述的多信号编码器,其中,所述自适应联合信号处理器(200)被配置为计算信号的MDCT频谱的能量来作为关于该信号的能量的信息,或者
计算所述至少三个经预处理的音频信号的MDCT频谱的平均能量来作为关于所述至少三个经预处理的音频信号的平均能量的信息。


21.根据权利要求1至5中的一项所述的多信号编码器,
其中,所述自适应联合信号处理器(200)被配置用于基于特定信号的能量信息和关于所述至少三个音频信号的平均能量的能量信息来计算(213)每个信号的缩放因子,
其中,所述自适应联合信号处理器(200)被配置用于量化(214)所述缩放比例,以获得经量化的缩放比例值,所述经量化的缩放比例值被用来导出用于包括在经编码的信号中的每个信号的缩放比例的边信息,以及
其中,所述自适应联合信号处理器(200)被配置为从所述经量化的缩放比例值中导出经量化的缩放比例,其中,在被用于经缩放的信号与另一对应缩放的信号的成对处理之前,经预处理的音频信号使用所述经量化的缩放比例进行缩放。


22.根据前述权利要求中的一项所述的多信号编码器,
其中,所述自适应联合信号处理器(200)被配置用于计算(221)可能的信号对的归一化信号间互相关值,以便决定和选择哪个信号对具有最高程度的相似度,并且因此适用于被选择作为所述至少三个经预处理的音频信号中用于成对处理的一对,
其中,每个信号对的归一化互相关值被存储在互相关向量中,以及
其中,所述自适应联合信号处理器(200)被配置用于通过将先前帧的互相关向量与当前帧的互相关向量进行比较(222、223)来确定是否要保留一个或多个先前帧的信号对选择,并且其中,在当前帧的互相关向量与先前帧的互相关向量之间的差小于预定义阈值时,保留(225)先前帧的信号对选择。


23.根据前述权利要求中的一项所述的多信号编码器,
其中,所述信号预处理器(100)被配置用于使用从多个不同窗口长度中选择的某个窗口长度来执行时频转换,
其中,所述自适应联合信号处理器(200)被配置为在比较经预处理的...

【专利技术属性】
技术研发人员:埃伦尼·福托普楼马库斯·马特拉斯萨沙·迪克戈兰·马尔科维奇帕拉维·马本斯里坎斯·科塞斯特凡·拜尔萨沙·迪施于尔根·赫勒
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1