当前位置: 首页 > 专利查询>奥兰治专利>正文

确定要应用于多声道音频信号的校正、相关编码和解码制造技术

技术编号:33524963 阅读:17 留言:0更新日期:2022-05-19 01:34
本发明专利技术涉及一种用于确定要对多声道声音信号进行的一组校正(Corr.)的方法,其中,该组校正是基于表示原始多声道信号的空间图像的信息(Inf.B)和表示已经进行编码并且然后解码的原始多声道信号的空间图像的信息(Inf.B)来确定的。本发明专利技术还涉及一种实施该确定方法的解码方法和编码方法,并且涉及相关联的编码设备和解码设备。和解码设备。和解码设备。

【技术实现步骤摘要】
【国外来华专利技术】确定要应用于多声道音频信号的校正、相关编码和解码


[0001]本专利技术涉及空间化声音数据的编码/解码,具体地在立体混响背景下(下文也表示为“高保真立体声(ambisonic)”)。

技术介绍

[0002]目前在移动电话中使用的编码器/解码器(下文称为“编解码器”)是单声道的(要呈现在单个扬声器上的单个信号声道)。3GPP EVS(“增强型语音服务”)编解码器使得能够提供“超HD”音质(也称为“高清加”或HD+语音),其中,为以32kHz或48kHz采样的信号提供超宽带(SWB)音频带或者为以48kHz采样的信号提供全带(FB)音频带;音频带宽在SWB模式(9.6千比特/秒到128千比特/秒)下为14.4kHz到16kHz并且在FB模式(16.4千比特/秒到128千比特/秒)下为20kHz。
[0003]由运营商提供的会话服务中下一质量演变应该由沉浸式服务组成,该沉浸式服务使用如配备有多个麦克风的智能手机、或者远程呈现或360
°
视频空间化音频会议或视频会议设备、或者甚至具有比简单的2D立体声呈现更加沉浸式的空间化3D声音呈现的“实时”音频内容共享设备等终端。随着用音频头戴式耳机在移动电话上进行收听的运用日益广泛以及先进的音频设备(如3D麦克风、具有声学天线的语音助手、虚拟现实头戴式耳机等附件)的出现,捕获并呈现空间化声音场景以提供沉浸式通信体验如今已经足够普遍。
[0004]为此,未来的3GPP标准“IVAS”(“沉浸式语音和音频服务”)计划通过接受至少以下所列的空间化声音格式(及其组合)作为编解码器输入格式来扩展EVS编解码器以实现沉浸:
[0005]立体声或5.1多声道(基于声道的)格式,其中,每个声道馈入一个扬声器(例如立体声中的L和R或5.1中的L、R、Ls、Rs和C);
[0006]对象(基于对象的)格式,其中,声音对象被描述为与描述该对象的属性(空间中的位置、源空间宽度等)的元数据相关联的音频信号(通常是单声道的),
[0007]高保真立体声(基于场景的)格式,该格式描述了给定点的声场,该声场通常由球形麦克风捕获或在球谐函数域中合成。
[0008]以下典型地关注的是通过示例性实施例以高保真立体声格式对声音进行编码(以下结合本专利技术呈现的至少一些方面还能够应用于除了高保真立体声以外的格式)。
[0009]高保真立体声是用于记录(声学意义上的“编码”)空间化声音的方法和用于再现(声学意义上的“解码”)的系统。(1阶)高保真立体声麦克风包括布置在球面网格(例如正四面体的顶点)上的至少四个振膜舱(典型地为心型或亚心型)。与这些振膜舱相关联的音频声道被称为“A格式”。该格式被转换成“B格式”,其中,声场分解为以W、X、Y、Z表示的四个分量(球谐函数),这四个分量与四个重合的虚拟麦克风相对应。分量W与声场的全向捕获相对应,而更具方向性的分量X、Y和Z类似于沿着三个正交空间轴定向的压力梯度麦克风。高保真立体声系统在录音和呈现分开并且分离的意义上是一种灵活的系统。其允许对任何配置的扬声器(例如双耳、5.1或7.1.4全向声道(具有仰角)“环绕”声)进行(声学意义上的)解
码。高保真立体声方法可以一般化为B格式的四个以上声道,并且这种一般化表示通常被称为“HOA”(“高阶高保真立体声”)。将声音分解成更多的球谐函数改善了在扬声器上呈现时的空间呈现精准度。
[0010]M阶高保真立体声信号包括K=(M+1)2个分量,并且1阶(如果M=1)中有通常被称为FOA(一阶高保真立体声)的四个分量W、X、Y和Z。还有所谓的“平面”高保真立体声变体(W、X、Y),该“平面”高保真立体声变体分解在通常是水平面的平面上定义的声音。在这种情况下,分量的数量是K=2M+1个声道。1阶高保真立体声(4个声道:W、X、Y、Z)、平面1阶高保真立体声(3个声道:W、X、Y)和更高阶高保真立体声在下文中均不加区分地被称为“高保真立体声”以便于阅读,所呈现的处理操作可独立于平面或非平面类型以及高保真立体声分量的数量而应用。
[0011]在下文中,“高保真立体声信号”将是赋予具有一定数量的高保真立体声分量的B格式的预定阶信号的名称。这也包括混合情况,其中,例如在2阶中只有8个声道(而非9个)——更准确地说,在2阶中有4个1阶声道(W、X、Y、Z)加通常5个声道(通常表示为R、S、T、U、V),并且可能例如忽略高阶声道之一(例如R)。
[0012]要由编码器/解码器处理的信号采用连续的声音样本块的形式,以下称为“帧”或“子帧”。
[0013]此外,在下文中,数学符号遵循以下惯例:
[0014]标量:s或N(小写字母用于变量或大写字母用于常量)
[0015]运算符Re(.)表示复数的实部
[0016]向量:u(小写字母,粗体)
[0017]矩阵:A(大写字母,粗体)
[0018]符号A
T
和A
H
分别指示A的转置和埃尔米特转置(转置和共轭)。
[0019]在长度为L的时间间隔i=0,

,L

1内定义的一维离散时间信号s(i)用以下行向量表示
[0020]s=[s(0),...,s(L

1)]。
[0021]还可以写为:s=[s0,

,s
L
‑1]以避免使用圆括号。
[0022]在长度为L的时间间隔i=0,...,L

1内定义并具有K个维度的多维离散时间信号b(i)用以下大小为L
×
K的矩阵表示:
[0023][0024]还可以表示为:B=[B
ij
],i=0,

K

1,j=0

L

1以避免使用圆括号。
[0025]具有笛卡尔坐标(x,y,z)的3D点可以转换成球面坐标其中,r是距原点的距离,θ是方位角并且是仰角。在不失一般性的情况下,此处使用了仰角相对于水平面(0xy)定义的数学惯例;本专利技术可以容易地被适配成其他定义,包括在物理学中使用的方位角相对于轴线Oz定义的惯例。
[0026]此外,此处没有提示从现有高保真立体声技术中已知的关于高保真立体声分量(包括ACN高保真立体声声道数量、SID单一指数命名、FuMA弗斯

马哈姆(Furse

Malham))的
阶数以及高保真立体声分量(SN3D、N3D、maxN)的归一化的惯例。更多细节可以见于例如可在线获得的资源:https://en.wikipedia.org/wiki/Ambisonic_data_exchange_formats
[0027]按照惯例,高保真立体声信号的第一分量通常对应于全向分量W。
[0028]用于编码高保真立体声信号的最简单的方法在于使用单声道编码器并且将其并行应用于所有声道,其中根据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于确定要对多声道声音信号进行的一组校正(Corr.)的方法,其中,该组校正是根据表示原始多声道信号的空间图像的信息(Inf.B)和表示原始的经编码并且然后经解码的多声道信号的空间图像的信息来确定的。2.如权利要求1所述的方法,其中,该组校正由频率子带确定。3.一种用于对多声道声音信号进行解码的方法,该方法包括以下步骤:接收(350)包括来自原始多声道信号的经编码音频信号和表示该原始多声道信号的空间图像的信息的比特流;对接收到的经编码音频信号进行解码(370)并获得经解码多声道信号;对表示该原始多声道信号的空间图像的信息进行解码(360);确定(375)表示该经解码多声道信号的空间图像的信息;使用如权利要求1和2中任一项所述的确定方法来确定(380)要对该经解码信号进行的一组校正;使用所确定的该组校正来校正(390)该经解码多声道信号。4.一种用于对多声道声音信号进行编码的方法,该方法包括以下步骤:对来自原始多声道信号的音频信号进行编码(611);确定(621)表示该原始多声道信号的空间图像的信息;对该经编码音频信号进行本地解码(612)并获得经解码多声道信号;确定(615)表示该经解码多声道信号的空间图像的信息;使用如权利要求1和2中任一项所述的确定方法来确定(630)要对该经解码多声道信号进行的一组校正;对所确定的该组校正进行编码(640)。5.如权利要求3所述的解码方法或如权利要求4所述的编码方法,其中,表示空间图像的信息是协方差矩阵,并且确定该组校正还包括以下步骤:获得包括与一组虚拟扬声器相关联的加权向量的加权矩阵;根据该获得的加权矩阵和该原始多声道信号的协方差矩阵来确定该原始多声道信号的空间图像;根据该获得的加权矩阵和所确定的经解码多声道信号的协方差矩阵来确定该经解码多声道信号的空间图像;计算该原始多声道信号的空间图像与该经解码多声道信号的空间图像之间在该组虚拟扬声器中的扬声器的方向上的比率,以获得一组增益。6.如权利要求3所述的解码方法,其中,接收到的表示该原始多声道信号的空间图像的信息是该原始多声道信号的空间图像,并且确定该组校正还包括以下步骤:获得包括与一组虚拟扬声器相关联的加权向量的加权矩阵;根据该获得的加权矩阵和表示所确定的经解码多声道信号的空间图像的信息来确定该经解码多声道信号的空间图像;计算该原始多声道信号的空间图像与该经解码多声道信号的空间图像之间在该组虚拟扬声器中的扬声器的方向上的比率...

【专利技术属性】
技术研发人员:PC马埃S拉戈特J丹尼尔
申请(专利权)人:奥兰治
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1