信号处理装置、方法及程序制造方法及图纸

技术编号：37200327 阅读：22 留言：0更新日期：2023-04-20 22:56

本技术涉及能够提高编码效率的信号处理装置、方法及程序。信号处理装置包括：校正单元，被配置为基于包括在音频对象的元数据中的增益值校正音频对象的音频信号；以及量化单元，被配置为基于校正的信号计算听觉心理参数并量化音频信号。本技术可应用于编码装置。本技术可应用于编码装置。本技术可应用于编码装置。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】信号处理装置、方法及程序

[0001]本技术涉及信号处理装置、信号处理方法和程序，并且更具体地，涉及能够提高编码效率的信号处理装置、信号处理方法和程序。

技术介绍

[0002]在现有技术中，已知作为国际标准的运动图像专家组(MPEG)
‑
D统一语音和音频编码(USAC)标准或使用MPEG
‑
D USAC标准作为核心编码器的MPEG
‑
H 3D音频标准的编码等(例如，参见NPL1至NPL3)。
[0003][引用列表][0004][非专利文献][0005][NPL 1][0006]ISO/IEC 23003
‑
3，MPEG
‑
D USAC
[0007][NPL 2][0008]ISO/IEC 23008
‑
3，MPEG
‑
H 3D Audio
[0009][NPL 3][0010]ISO/IEC 23008
‑
3：2015/AMENDMENT3，MPEG
‑
H 3D Audio Phase 2。

技术实现思路

[0011][技术问题][0012]在MPEG
‑
H 3D音频标准等中处理的3D音频中，可利用每个对象的元数据(例如，表示声音材料(对象)的位置、距离和对象的增益的水平和垂直角度)再现三维声音的方向、距离、传播等。为此，在3D音频中，与现有技术的立体再现相比，能够以更大的存在感再现音频。
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种信号处理装置，包括：校正单元，被配置为基于音频对象的元数据中包括的增益值，校正所述音频对象的音频信号；以及量化单元，被配置为基于通过校正获得的信号来计算听觉心理参数并且量化所述音频信号。2.根据权利要求1所述的信号处理装置，其中，所述校正单元基于所述增益值在时域中校正所述音频信号。3.根据权利要求2所述的信号处理装置，进一步包括：时间
‑
频率转换单元，被配置为对通过所述校正单元进行校正而获得的校正的音频信号执行时间
‑
频率转换，其中所述量化单元基于通过所述时间
‑
频率转换获得的频谱信息计算所述听觉心理参数。4.根据权利要求1所述的信号处理装置，进一步包括：时间
‑
频率转换单元，被配置为对所述音频信号执行时间
‑
频率转换，其中所述校正单元基于所述增益值校正通过所述时间
‑
频率转换获得的频谱信息，并且所述量化单元基于通过对所述校正单元进行校正而获得的校正的频谱信息来计算所述听觉心理参数。5.根据权利要求1所述的信号处理装置，进一步包括：增益校正单元，被配置为基于与声音的到达方向相关的听觉特性校正所述增益值，其中所述校正单元基于校正的增益值来校正所述音频信号。6.根据权利要求5所述的信号处理装置，其中，所述增益校正单元基于针对由所述元数据中包括的位置信息指示的位置的听觉特性，校正所述增益值。7.根据权利要求6所述的信号处理装置，进一步包括：听觉特性表保持单元，被配置为保持听觉特性表，在所述听觉特性表中，所述音频对象的位置与所述增益校正值彼此相关联，所述增益校正值是针对所述音频对象的位置的、并且用于基于所述增益值的所述听觉特性执行校正。8.根据权利要求7所述的信号处理装置，其中，在与所述位置信息指示的位置对应的所述增益校正值不在所述听觉特性表中的情况下，所述增益校正单元基于与所述位置信息指示的位置附近的多个位置相关联的增益校正值执行插值处理，获得所述位置信息指示的位置的增益校正值，将与所述位置信息指示的位置最近的位置相关联的增益校正值设定为所述位置信息指示的位置的增益校正值，或者将与所述位置信息指示的位置附近的多个位置相关联的增益校正值的平均值设定为所述位置信息指示的位置的增益校正值。9.根据权利要求8所述的信号处理装置，其中，所述插值处理是使用VBAP的插值处理。10.一种信号处理方法，包括：使信号处理装置基于包含在音频对象的元数据中的增益值，校正所述音频对象的音频信号，并且基于通过校正获得的信号计算听觉心理参数并量化所述音频信号。11.一种程序，使计算机执行包括以下步骤的处理：基于包括在音频对象的元数据中的增益值，校正所述音频对象的音频信号；以及
基于通过校正获得的信号来计算听觉心理参数并量化所述音频信号。12.一种信号处理装置，包括：修改单元，被配置为基于音频对象的元数据中包括的增益值，修改音频对象的增益值和音频信号；以及量化单元，被配置为量化通过修改获得的修改的音频信号。13.根据权利要求12所述的信号处理装置，其中，在所述增益值是落在预定范围之外的值的情况下，所述修改单元执行修改。14.根据权利要求12所述的信号处理装置，进一步包括：校正单元，被配置为基于通过修改获得的修改的增益值，校正所述修改的音频信号，其中，所述量化单元基于通过校正所述修改的音频信号获得的信号，量化所述修改的音频信号。15.根据权利要求12所述的信号处理装置，进一步包括：元编码器，被配置为对包括通过修改获得的修改的增益值的元数据进行量化和编码；编码单元，被配置为编码量化的修改的音频信号；以及多路复用单元，被配置为多路复用编码的元数据和编码的修改的音频信号。16.根据权利要求12所述的信号处理装置，其中，所述修改单元基于所述增益值与通过修改获得的修改的增益值之间的差值，修改所述音频信号。17.一种信号处理方法，包括：使信号处理装置基于包括在音频对象的元数据中的增益值，修改音频信号和所述音频对象的增益值，并量化通过修改获得的修改的音频信号。18.一种程序，使计算机...

【专利技术属性】
技术研发人员：河野明文，知念徹，本间弘幸，辻实，及川芳明，
申请(专利权)人：索尼集团公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人