信息处理装置和方法、再现装置和方法、以及程序制造方法及图纸

技术编号:30745998 阅读:19 留言:0更新日期:2021-11-10 11:55
本技术涉及一种信息处理装置和方法、再现装置和方法以及程序,其被配置为能够更容易地执行增益校正。该信息处理装置包括:增益校正值决定单元,根据观众观看的音频对象的方向确定用于增益校正音频对象的音频信号的增益值的校正值。本技术可以应用于增益决定装置和再现装置。现装置。现装置。

【技术实现步骤摘要】
【国外来华专利技术】信息处理装置和方法、再现装置和方法、以及程序


[0001]本技术涉及信息处理装置和方法、再现装置和方法以及程序,特别涉及能够更容易地执行增益校正的信息处理装置和方法、再现装置和方法以及程序。

技术介绍

[0002]传统上,运动图像专家组(MPEG)

H 3D音频标准是已知的(例如,参见非专利文献1和非专利文献2)。
[0003]通过MPEG

H 3D音频标准等处理的3D音频,可以再现三维声音方向、距离、扩展等,并且可以执行与传统立体声再现相比具有更真实感的音频再现。
[0004]现有技术文献
[0005]非专利文献
[0006]非专利文献1:ISO/IEC 23008

3,MPEG

H 3D Audio
[0007]非专利文献2:ISO/IEC 23008

3:2015/AMENDMENT3,MPEG

H 3D Audio Phase 2

技术实现思路

[0008]技术问题
[0009]然而,使用3D音频,内容(3D音频内容)的生产时间成本增加。
[0010]例如,在3D音频中,对象的位置信息(即声源的位置信息)的维数要高于立体声(3D音频是三维的,而立体声是二维的)。因此,使用3D音频,特别地,在决定构成每个对象的元数据的参数(诸如指示对象的位置的水平角和垂直角、距离、以及对象的增益)的工作中,时间成本增加。
[0011]此外,与立体声内容相比,3D音频内容在内容和创建者方面的数量都少得多。因此,目前高质量的3D音频内容的数量较少。
[0012]另一方面,作为听觉特性,对声音响度的感知取决于声音的到达方向。即,即使是同一对象的声音,声音在听觉感知中的响度在对象位于收听者前面的情况和对象位于收听者侧面的情况下、以及在对象位于收听者上方的情况和对象位于收听者下方的情况下发生变化。因此,需要根据这种听觉特性进行增益校正。
[0013]由此,期望更容易地执行增益校正,并且因此,能够在短时间内生成足够质量的3D音频内容。
[0014]本技术是考虑到这种情况而提出,并且能够更容易地执行增益校正。
[0015]问题的解决方案
[0016]本技术的第一方面的信息处理装置包括:增益校正值决定单元,该增益校正值决定单元根据从收听者观看音频对象的方向,决定用于对音频对象的音频信号执行增益校正的增益值的校正值。
[0017]本技术的第一方面的信息处理方法或程序包括:根据从收听者观看音频对象的方向,决定用于对音频对象的音频信号执行增益校正的增益值的校正值的步骤。
[0018]在本技术的第一方面,根据从收听者观看音频对象的方向来决定用于对音频对象的音频信号执行增益校正的增益值的校正值。
[0019]本技术的第二方面的再现装置包括:增益校正单元,该增益校正单元基于指示音频对象的位置的位置信息,决定用于对音频对象的音频信号执行增益校正的增益值的校正值,该校正值取决于从收听者观看音频对象的方向,并且基于由校正值校正的增益值对音频信号执行增益校正;以及渲染器处理单元,该渲染器处理单元基于通过增益校正获得的音频信号执行渲染处理,并且生成用于再现音频对象的声音的多个声道的再现信号。
[0020]本技术的第二方面的再现方法或程序包括:基于指示音频对象的位置的位置信息,决定用于对音频对象的音频信号执行增益校正的增益值的校正值的步骤,该校正值取决于从收听者观看音频对象的方向;基于由校正值校正的增益值对音频信号执行增益校正的步骤;基于通过增益校正获得的音频信号执行渲染处理的步骤;以及生成用于再现音频对象的声音的多个声道的再现信号的步骤。
[0021]在目前技术的第二个方面,基于指示音频对象的位置的位置信息,决定用于对音频对象的音频信号执行增益校正的增益值的校正值,该校正值取决于从收听者观看音频对象的方向;基于由校正值校正后的增益值对音频信号执行增益校正;基于通过增益校正获得的音频信号执行渲染处理,并且生成用于再现音频对象的声音的多个声道的再现信号。
附图说明
[0022]图1是说明关于声音的到达方向的听觉特性的视图。
[0023]图2是说明关于声音的到达方向的听觉特性的视图。
[0024]图3是说明关于声音的到达方向的听觉特性的视图。
[0025]图4是示出信息处理装置的配置示例的视图。
[0026]图5是示出听觉特性表的示例的视图。
[0027]图6是示出听觉特性表的示例的视图。
[0028]图7是说明增益值决定处理的流程图。
[0029]图8是示出内容创建工具的显示画面示例的视图。
[0030]图9是示出内容创建工具的显示画面示例的视图。
[0031]图10是示出内容创建工具的显示画面示例的视图。
[0032]图11是示出内容创建工具的显示画面示例的视图。
[0033]图12是示出信息处理装置的配置示例的视图。
[0034]图13是说明表生成处理的流程图。
[0035]图14是示出语音处理装置的配置示例的视图。
[0036]图15是说明再现信号生成处理的流程图。
[0037]图16是示出听觉特性表的示例的视图。
[0038]图17是示出增益听觉特性信息的语法示例的视图。
[0039]图18是示出语音处理装置的配置示例的视图。
[0040]图19是示出计算机的配置示例的视图。
具体实施方式
[0041]下面将参考附图来说明应用本技术的实施例。
[0042]<第一实施例>
[0043]<关于本技术>
[0044]本技术通过根据从收听者观看的对象的方向确定增益校正值,使得能够更容易地执行增益校正,并且因此使得能够更容易地,即在短时间内创建足够高质量的3D音频内容。
[0045]特别地,本技术具有以下特征(F1)到(F5)。
[0046]特征(F1):根据关于声像的定位位置的三维听觉特性来决定对象的增益校正值。
[0047]特征(F2):在通过表格等给出听觉特性的情况下,基于相邻位置的增益校正值,通过插值处理等计算关于无数据的定位位置的增益校正值。
[0048]特征(F3):在自动混合中,增益信息从单独决定的位置信息决定。
[0049]特征(F4):提供了设置和调整关于对象位置的增益校正值的用户界面。
[0050]特征(F5):与相对于收听位置的对象位置的变化相关联地应用与三维听觉特性对应的增益校正值。
[0051]首先,将解释基于人的三维听觉特性的增益参数的决定。
[0052]图1示出了当执行粉红噪声的增益校正时的增益校正量,使得当从不同方向再现相同的粉红噪声时,收听者感觉到在听觉上的声音的响度是相同的,参本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种信息处理装置,包括:增益校正值决定单元,根据从收听者观看音频对象的方向,决定用于对所述音频对象的音频信号执行增益校正的增益值的校正值。2.根据权利要求1所述的信息处理装置,其中,所述增益校正值决定单元基于所述收听者关于声音到来方向的三维听觉特性来决定所述校正值。3.根据权利要求1所述的信息处理装置,其中,所述增益校正值决定单元基于所述收听者的朝向决定所述校正值。4.根据权利要求1所述的信息处理装置,其中,所述增益校正值决定单元决定所述校正值,使得与所述音频对象存在于所述收听者前面的情况相比,在所述音频对象存在于所述收听者后面的情况下所述校正值变大。5.根据权利要求1所述的信息处理装置,其中,所述增益校正值决定单元决定所述校正值,使得与所述音频对象存在于所述收听者前面的情况相比,在所述音频对象存在于所述收听者侧面的情况下所述校正值变小。6.根据权利要求1所述的信息处理装置,其中,所述增益校正值决定单元通过基于与另一方向对应的校正值的插值处理获得与预定方向对应的校正值,来决定与所述预定方向对应的所述校正值。7.根据权利要求6所述的信息处理装置,其中,所述增益校正值决定单元执行矢量基幅平移VBAP作为所述插值处理。8.根据权利要求7所述的信息处理装置,其中,所述增益校正值决定单元通过线性值或分贝值获得所述校正值。9.一种信息处理方法,其中,信息处理装置,根据从收听者观看音频对象的方向,决定用于对音频对象的音频信号执行增益校正的增益值的校正值。10.一种程序,使计算机执行包括以下步骤的处理:根据从收听者观看音频对象的方向,决定用于对所述音频对象的音频信号执行增益校正的增益值的校正值。11.一种再现装置,包括:增益校正单元,基于指示音频对象的位置的位置信息,决定用于对所述音频对象的音频信号执行增益校正的增益值的校正值,所述校正值取决于从收听者观看所述音频对象的方向,并且基于由所述校正值校正的所述增益值对所述音频信号执行所述增益校正,以及渲...

【专利技术属性】
技术研发人员:辻实知念徹山本优树中井彬人
申请(专利权)人:索尼集团公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1