信号处理装置、方法及程序制造方法及图纸

技术编号:37200327 阅读:22 留言:0更新日期:2023-04-20 22:56
本技术涉及能够提高编码效率的信号处理装置、方法及程序。信号处理装置包括:校正单元,被配置为基于包括在音频对象的元数据中的增益值校正音频对象的音频信号;以及量化单元,被配置为基于校正的信号计算听觉心理参数并量化音频信号。本技术可应用于编码装置。本技术可应用于编码装置。本技术可应用于编码装置。

【技术实现步骤摘要】
【国外来华专利技术】信号处理装置、方法及程序


[0001]本技术涉及信号处理装置、信号处理方法和程序,并且更具体地,涉及能够提高编码效率的信号处理装置、信号处理方法和程序。

技术介绍

[0002]在现有技术中,已知作为国际标准的运动图像专家组(MPEG)

D统一语音和音频编码(USAC)标准或使用MPEG

D USAC标准作为核心编码器的MPEG

H 3D音频标准的编码等(例如,参见NPL1至NPL3)。
[0003][引用列表][0004][非专利文献][0005][NPL 1][0006]ISO/IEC 23003

3,MPEG

D USAC
[0007][NPL 2][0008]ISO/IEC 23008

3,MPEG

H 3D Audio
[0009][NPL 3][0010]ISO/IEC 23008

3:2015/AMENDMENT3,MPEG

H 3D Audio Phase 2。

技术实现思路

[0011][技术问题][0012]在MPEG

H 3D音频标准等中处理的3D音频中,可利用每个对象的元数据(例如,表示声音材料(对象)的位置、距离和对象的增益的水平和垂直角度)再现三维声音的方向、距离、传播等。为此,在3D音频中,与现有技术的立体再现相比,能够以更大的存在感再现音频。
[0013]然而,为了传输由3D音频实现的大量对象的数据,需要能够以更高的压缩效率以高速解码大量音频信道的编码技术。即,需要改善编码效率。
[0014]鉴于这种情况设计本技术并且能够提高编码效率。
[0015][问题的解决方案][0016]根据本技术的第一方面的信号处理装置包括:校正单元,被配置为基于音频对象的元数据中包括的增益值校正音频对象的音频信号;以及量化单元,被配置为基于通过校正获得的信号计算听觉心理参数并且量化音频信号。
[0017]根据本技术的第一方面的信号处理方法或程序包括:基于包括在音频对象的元数据中的增益值校正音频对象的音频信号;基于通过校正获得的信号计算听觉心理参数;以及量化音频信号。
[0018]在本技术的第一方面中,基于音频对象的元数据中包括的增益值来校正音频对象的音频信号,基于通过校正获得的信号来计算听觉心理参数,并且对音频信号进行量化。
[0019]根据本技术的第二方面的信号处理装置包括:修改单元,被配置为基于音频对象
的元数据中包括的增益值来修改音频对象的增益值和音频信号;以及量化单元,被配置为量化通过修改获得的经修改的音频信号。
[0020]根据本技术的第二方面的信号处理方法或程序包括基于包括在音频对象的元数据中的增益值修改音频对象的增益值和音频信号,并量化通过修改获得的经修改的音频信号。
[0021]在本技术的第二方面,基于包括在音频对象的元数据中的增益值修改音频对象的增益值和音频信号,并量化通过修改获得的经修改的音频信号。
[0022]根据本技术的第三方面的信号处理装置包括:量化单元,被配置为基于包括音频对象的增益值和位置信息中的至少一项的元数据、音频对象的音频信号以及与多个音频对象之间的听觉掩模相关的听觉心理模型来计算听觉心理参数,并基于听觉心理参数对音频信号进行量化。
[0023]根据本技术的第三方面的信号处理方法或程序包括:基于包括音频对象的增益值和位置信息中的至少一项的元数据、音频对象的音频信号、以及与多个音频对象之间的听觉掩模相关的听觉心理模型,计算听觉心理参数,以及基于听觉心理参数对音频信号进行量化。
[0024]在本技术的第三方面中,基于,包括音频对象的增益值和位置信息中的至少一项的元数据、所述音频对象的音频信号、以及与多个音频对象之间的听觉掩模相关的听觉心理模型,计算听觉心理参数,并且基于听觉心理参数对音频信号进行量化。
[0025]根据本技术的第四方面的信号处理装置包括:量化单元,被配置为基于音频对象的音频信号和指示音频对象的声源的类型的标记信息,使用针对标记信息指示的声源的类型确定的调整参数和算法中的至少一项,对音频对象的音频信号进行量化。
[0026]根据本技术的第四方面的信号处理方法或程序包括:基于音频对象的音频信号和指示音频对象的声源的类型的标记信息,使用针对标记信息指示的声源的类型确定的调整参数和算法中的至少一项对音频对象的音频信号进行量化。
[0027]在本技术的第四方面,基于音频对象的音频信号和指示音频对象的声源的类型的标记信息,使用针对标记信息指示的声源的类型确定的调整参数和算法中的至少一项对音频对象的音频信号进行量化。
附图说明
[0028]图1是示出MPEG

H 3D音频中的编码的示图。
[0029]图2是示出MPEG

H 3D音频中的编码的示图。
[0030]图3是示出了值范围的实例的示图。
[0031]图4是示出编码装置的配置实例的示图。
[0032]图5是示出编码处理的流程图。
[0033]图6是示出编码装置的配置实例的示图。
[0034]图7是示出编码处理的流程图。
[0035]图8是示出编码装置的配置实例的示图。
[0036]图9是示出增益值的修改的示图。
[0037]图10是示出根据增益值的修改的音频信号的修改的示图。
[0038]图11是示出根据增益值的修改的音频信号的修改的示图。
[0039]图12是示出编码处理的流程图。
[0040]图13是示出粉红噪声的听觉特性的示图。
[0041]图14是示出使用听觉特性表对增益值进行校正的示图。
[0042]图15是示出听觉特性表的实例的示图。
[0043]图16是示出听觉特性表的实例的示图。
[0044]图17是示出听觉特性表的实例的示图。
[0045]图18是示出增益校正值的插值的实例的示图。
[0046]图19是示出编码装置的配置实例的示图。
[0047]图20是示出编码处理的流程图。
[0048]图21是示出编码装置的配置实例的示图。
[0049]图22是示出编码处理的流程图。
[0050]图23是示出元数据的配置的语法实例的示图。
[0051]图24是示出编码装置的配置实例的示图。
[0052]图25是示出编码处理的流程图。
[0053]图26是示出编码装置的配置实例的示图。
[0054]图27是示出编码处理的流程图。
[0055]图28是示出编码装置的配置实例的示图。
[0056]图29是示出编码处理的流程图。
[0057]图30是示出计算机的配置实例的示图。
具体实施方式
[0058]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种信号处理装置,包括:校正单元,被配置为基于音频对象的元数据中包括的增益值,校正所述音频对象的音频信号;以及量化单元,被配置为基于通过校正获得的信号来计算听觉心理参数并且量化所述音频信号。2.根据权利要求1所述的信号处理装置,其中,所述校正单元基于所述增益值在时域中校正所述音频信号。3.根据权利要求2所述的信号处理装置,进一步包括:时间

频率转换单元,被配置为对通过所述校正单元进行校正而获得的校正的音频信号执行时间

频率转换,其中所述量化单元基于通过所述时间

频率转换获得的频谱信息计算所述听觉心理参数。4.根据权利要求1所述的信号处理装置,进一步包括:时间

频率转换单元,被配置为对所述音频信号执行时间

频率转换,其中所述校正单元基于所述增益值校正通过所述时间

频率转换获得的频谱信息,并且所述量化单元基于通过对所述校正单元进行校正而获得的校正的频谱信息来计算所述听觉心理参数。5.根据权利要求1所述的信号处理装置,进一步包括:增益校正单元,被配置为基于与声音的到达方向相关的听觉特性校正所述增益值,其中所述校正单元基于校正的增益值来校正所述音频信号。6.根据权利要求5所述的信号处理装置,其中,所述增益校正单元基于针对由所述元数据中包括的位置信息指示的位置的听觉特性,校正所述增益值。7.根据权利要求6所述的信号处理装置,进一步包括:听觉特性表保持单元,被配置为保持听觉特性表,在所述听觉特性表中,所述音频对象的位置与所述增益校正值彼此相关联,所述增益校正值是针对所述音频对象的位置的、并且用于基于所述增益值的所述听觉特性执行校正。8.根据权利要求7所述的信号处理装置,其中,在与所述位置信息指示的位置对应的所述增益校正值不在所述听觉特性表中的情况下,所述增益校正单元基于与所述位置信息指示的位置附近的多个位置相关联的增益校正值执行插值处理,获得所述位置信息指示的位置的增益校正值,将与所述位置信息指示的位置最近的位置相关联的增益校正值设定为所述位置信息指示的位置的增益校正值,或者将与所述位置信息指示的位置附近的多个位置相关联的增益校正值的平均值设定为所述位置信息指示的位置的增益校正值。9.根据权利要求8所述的信号处理装置,其中,所述插值处理是使用VBAP的插值处理。10.一种信号处理方法,包括:使信号处理装置基于包含在音频对象的元数据中的增益值,校正所述音频对象的音频信号,并且基于通过校正获得的信号计算听觉心理参数并量化所述音频信号。11.一种程序,使计算机执行包括以下步骤的处理:基于包括在音频对象的元数据中的增益值,校正所述音频对象的音频信号;以及
基于通过校正获得的信号来计算听觉心理参数并量化所述音频信号。12.一种信号处理装置,包括:修改单元,被配置为基于音频对象的元数据中包括的增益值,修改音频对象的增益值和音频信号;以及量化单元,被配置为量化通过修改获得的修改的音频信号。13.根据权利要求12所述的信号处理装置,其中,在所述增益值是落在预定范围之外的值的情况下,所述修改单元执行修改。14.根据权利要求12所述的信号处理装置,进一步包括:校正单元,被配置为基于通过修改获得的修改的增益值,校正所述修改的音频信号,其中,所述量化单元基于通过校正所述修改的音频信号获得的信号,量化所述修改的音频信号。15.根据权利要求12所述的信号处理装置,进一步包括:元编码器,被配置为对包括通过修改获得的修改的增益值的元数据进行量化和编码;编码单元,被配置为编码量化的修改的音频信号;以及多路复用单元,被配置为多路复用编码的元数据和编码的修改的音频信号。16.根据权利要求12所述的信号处理装置,其中,所述修改单元基于所述增益值与通过修改获得的修改的增益值之间的差值,修改所述音频信号。17.一种信号处理方法,包括:使信号处理装置基于包括在音频对象的元数据中的增益值,修改音频信号和所述音频对象的增益值,并量化通过修改获得的修改的音频信号。18.一种程序,使计算机...

【专利技术属性】
技术研发人员:河野明文知念徹本间弘幸辻实及川芳明
申请(专利权)人:索尼集团公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1