当前位置: 首页 > 专利查询>索尼公司专利>正文

用于处理声音的装置、方法及程序制造方法及图纸

技术编号:17310695 阅读:54 留言:0更新日期:2018-02-19 11:05
本技术涉及能够获取更高质量的声音的用于处理声音的装置、方法和程序。该获取单元获取对象的音频信号和元数据。该向量计算单元基于指示声像的扩展且包括在对象的元数据中的水平方向角和竖直方向角来计算表示指示声像的扩展的区域内的位置的扩展向量。该增益计算单元基于扩展向量通过VBAP来计算每个扬声器的音频信号的VBAP增益。该特征可以应用于声音处理装置。

A device, method, and program for processing sound

The technology relates to devices, methods and programs for obtaining sound of higher quality for processing sound. The acquisition unit gets the audio signal and metadata of the object. The vector computing unit calculates the expansion vector representing the location in the extended area of the indicated audio based on the indication of the expansion of the voice and the horizontal and vertical angles in the metadata of the object. The gain calculation unit calculates the VBAP gain of the audio signal of each speaker based on the extension vector through the VBAP. The feature can be applied to the sound processing device.

【技术实现步骤摘要】
【国外来华专利技术】用于处理声音的装置、方法及程序
本技术涉及音频处理装置、方法及程序,并且更具体地涉及通过其能够获得更高质量的声音的音频处理装置、方法及程序。
技术介绍
通常,作为使用多个扬声器来控制声像的定位的技术,已知VBAP(基于向量的幅值相移)(例如,参考NPL1)。在VBAP中,通过从三个扬声器输出声音,声像可以被定位在由这三个扬声器限定的三角形的内侧的一个任意点处。然而,在现实世界中,认为声像不是定位于一个点处,而是定位于具有一定扩散程度的部分空间中。例如,当从声带产生人声时,认为声音的振动传播到脸部、身体等,因此认为声音是从作为整个人体的部分空间发出的。作为如上所述将声音定位在这种部分空间中的技术,即,作为延伸声像的技术,通常已知MDAP(多方向幅值相移)(例如,参考NPL2)。此外,MDAP也用于MPEG-H3D(运动图像专家组-高质量三维)音频标准的渲染处理单元(例如,参考NPL3)。[引用列表][非专利文献(NPL)][NPL1]VillePulkki,“VirtualSoundSourcePositioningUsingVectorBaseAmplitudePanning”,美国电化学协会期刊,第45卷,第6期,第456-466页,1997年[NPL2]Ville-Pulkki,“UniformSpreadingofAmplitudePannedVirtualSources”,会议记录1999,关于信号处理对于音频和声学的应用的IEEE研讨会,新帕尔茨,纽约,1999年10月17-20日[NPL3]ISO/IECJTC1/SC29/WG11N14747,2014年8月,札幌,日本,“TextofISO/IEC23008-3/DIS,3DAudio”
技术实现思路
[技术问题]然而,上述技术不能获得足够高质量的声音。例如,在MPEG-H3D音频标准中,指示声像的扩散程度的信息(被称为扩展)包括在音频对象的元数据中,并且基于该扩展执行用于延伸声像的处理。然而,在延伸声像的处理中,存在声像的扩散相对于音频对象的位置的中心在上下方向和左右方向上对称的约束。因此,不能执行考虑到来自音频对象的声音的方向性(径向方向)的处理,从而不能获得足够高质量的声音。鉴于上述情况作出了本技术,使得可以获得更高质量的声音。[问题的解决方案]根据本技术的一个方面的音频处理装置包括:获取单元,被配置成获取包括指示音频对象的位置的位置信息和由至少二维或更多维的向量构成并表示声像距该位置的扩散的声像信息的元数据;向量计算单元,被配置成基于表示由声像信息确定的声像的扩散的区域的水平方向角和竖直方向角来计算指示该区域中的位置的扩展向量;以及增益计算单元,被配置成基于扩展向量来计算提供给位于由位置信息指示的位置附近的两个或更多个声音输出单元的音频信号中的每个音频信号的增益。向量计算单元可以基于水平方向角与竖直方向角之间的比率来计算扩展向量。向量计算单元可以计算预先确定的数量的扩展向量。向量计算单元可以计算任意可变数量的扩展向量。声像信息可以是指示该区域的中心位置的向量。声像信息可以是指示声像距该区域的中心的扩散程度的二维或更多维的向量。声像信息可以是指示从位置信息指示的位置观看到的区域的中心位置的相对位置的向量。增益计算单元可以计算关于声音输出单元中的每个声音输出单元的每个扩展向量的增益,计算针对声音输出单元中的每个声音输出单元的扩展向量所计算的增益的相加值,将相加值量化成关于声音输出单元中的每个声音输出单元的两个或更多个值的增益,以及基于量化的相加值来计算关于声音输出单元中的每个声音输出单元的最终增益。增益计算单元可以选择要用于计算增益网格的数量,网格中的每个网格是由声音输出单元中的三个声音输出单元包围的区域,并且增益计算单元基于对网格的数量的选择结果和扩展向量来计算扩展向量中的每个扩展向量的增益。增益计算单元可以选择要用于计算增益的网格的数量、是否要执行量化以及量化时的所述相加值的量化数量,并且响应于选择结果来计算最终增益。增益计算单元可以基于音频对象的数量来选择要用于计算增益的网格的数量、是否要执行量化以及量化数量。增益计算单元可以基于音频对象的重要性程度来选择要用于计算增益的网格的数量、是否要执行量化以及量化数量。增益计算单元可以选择要用于计算增益的网格的数量,使得要用于计算增益的网格的数量随着音频对象的位置位于更靠近重要性程度高的音频对象而增加。增益计算单元可以基于音频对象的音频信号的声压来选择要用于计算增益的网格的数量、是否要执行量化以及量化数量。增益计算单元可以响应于对网格数量的选择结果来选择包括位于彼此不同高度处的声音输出单元的多个声音输出单元中的三个或更多个声音输出单元,并且基于由所选择的声音输出单元形成的一个或多个网格来计算增益。根据本技术的一个方面的音频处理方法或程序包括以下步骤:获取包括指示音频对象的位置的位置信息和由至少二维或更多维的向量构成并且表示声像距该位置的扩散的声像信息的元数据;基于表示由声像信息确定的声像的扩散的区域的水平方向角和竖直方向角来计算指示该区域中的位置的扩展向量;基于扩展向量来计算提供给位于位置信息指示的位置附近的两个或更多个声音输出单元的音频信号中的每个音频信号的增益。在本技术的一个方面中,获取包括指示音频对象的位置的位置信息和由至少二维或更多维的向量构成并且表示声像距该位置的扩散的声像信息的元数据。然后,基于表示由声像信息确定的声像的扩散的区域的水平方向角和竖直方向角来计算指示该区域中的位置的扩展向量。此外,基于扩展向量来计算提供给位于位置信息指示的位置附近的两个或更多个声音输出单元的音频信号中的每个音频信号的增益。[专利技术的有益效果]利用本技术的一个方面,可以获得更高质量的声音。应当注意,这里描述的效果不一定是限制性的,而是可以表现出本公开中所描述的效果中的任一效果。附图说明图1是示出了VBAP的图。图2是示出了声像的位置的图。图3是扩展向量的图。图4是示出了扩展中心向量法的图。图5是示出了扩散辐射向量法的图。图6是示出了音频处理装置的配置的示例的图。图7是示出了再现处理的流程图。图8是示出了扩展向量计算处理的流程图。图9是示出了基于扩展三维向量进行的扩展向量计算处理的流程图。图10是示出了基于扩展中心向量进行的扩展向量计算处理的流程图。图11是示出了基于扩展端向量进行的扩展向量计算处理的流程图。图12是示出了基于扩展辐射向量进行的扩展向量计算处理的流程图。图13是示出了基于扩展向量位置信息进行的扩展向量计算处理的流程图。图14是示出了网格的数量的切换的图。图15是示出了网格的数量的切换的图。图16是示出了网格的形成的图。图17是示出了音频处理装置的配置的示例的图。图18是示出了再现处理的流程图。图19是示出了音频处理装置的配置的示例的图。图20是示出了再现处理的流程图。图21是示出了VBAP增益计算处理的流程图。图22是示出了计算机的配置的示例的图。具体实施方式在下文中,参考附图描述应用本技术的实施方式。<第一实施方式><VBAP和延伸声像的处理>当获取音频对象的音频信号和诸如音频对象的位置信息的元数据来进行渲染时,本技本文档来自技高网
...
用于处理声音的装置、方法及程序

【技术保护点】
一种音频处理装置,包括:获取单元,被配置成获取包括指示音频对象的位置的位置信息以及由至少二维或更多维的向量构成并且表示声像距所述位置的扩散的声像信息的元数据;向量计算单元,被配置成基于表示由所述声像信息确定的声像的扩散的区域的水平方向角和竖直方向角来计算指示所述区域中的位置的扩展向量;以及增益计算单元,被配置成基于所述扩展向量来计算提供给位于所述位置信息指示的位置附近的两个或更多个声音输出单元的音频信号中的每个音频信号的增益。

【技术特征摘要】
【国外来华专利技术】2015.06.24 JP 2015-126650;2015.07.28 JP 2015-148681.一种音频处理装置,包括:获取单元,被配置成获取包括指示音频对象的位置的位置信息以及由至少二维或更多维的向量构成并且表示声像距所述位置的扩散的声像信息的元数据;向量计算单元,被配置成基于表示由所述声像信息确定的声像的扩散的区域的水平方向角和竖直方向角来计算指示所述区域中的位置的扩展向量;以及增益计算单元,被配置成基于所述扩展向量来计算提供给位于所述位置信息指示的位置附近的两个或更多个声音输出单元的音频信号中的每个音频信号的增益。2.根据权利要求1所述的音频处理装置,其中,所述向量计算单元基于所述水平方向角与所述竖直方向角之间的比率来计算所述扩展向量。3.根据权利要求1所述的音频处理装置,其中,所述向量计算单元计算预先确定的数量的扩展向量。4.根据权利要求1所述的音频处理装置,其中,所述向量计算单元计算任意可变数量的扩展向量。5.根据权利要求1所述的音频处理装置,其中,所述声像信息是指示所述区域的中心位置的向量。6.根据权利要求1所述的音频处理装置,其中,所述声像信息是指示所述声像距所述区域的中心的扩散程度的二维或更多维的向量。7.根据权利要求1所述的音频处理装置,其中,所述声像信息是指示从所述位置信息指示的位置观看到的所述区域的中心位置的相对位置的向量。8.根据权利要求1所述的音频处理装置,其中,所述增益计算单元:计算关于所述声音输出单元中的每个声音输出单元的每个扩展向量的增益,计算针对所述声音输出单元中的每个声音输出单元的扩展向量所计算的增益的相加值,将所述相加值量化成关于所述声音输出单元中的每个声音输出单元的两个或更多个值的增益,以及基于量化的相加值来计算关于所述声音输出单元中的每个声音输出单元的最终增益。9.根据权利要求8所述的音频处理装置,其中,所述增益计算单元选择要用于计算所述增益的网格的数量,所述网格中的每个网格是由所述声音输出单元中的三个声音输出单元包围的区域,并且所述增益计算单元基于对网格的数量的选择结果和所述扩展向量来计算所述扩展向量中的每个扩展向...

【专利技术属性】
技术研发人员:山本优树知念彻辻实
申请(专利权)人:索尼公司
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1