用于处理声音的装置、方法及程序制造方法及图纸

技术编号：17310695 阅读：54 留言：0更新日期：2018-02-19 11:05

本技术涉及能够获取更高质量的声音的用于处理声音的装置、方法和程序。该获取单元获取对象的音频信号和元数据。该向量计算单元基于指示声像的扩展且包括在对象的元数据中的水平方向角和竖直方向角来计算表示指示声像的扩展的区域内的位置的扩展向量。该增益计算单元基于扩展向量通过VBAP来计算每个扬声器的音频信号的VBAP增益。该特征可以应用于声音处理装置。

A device, method, and program for processing sound

The technology relates to devices, methods and programs for obtaining sound of higher quality for processing sound. The acquisition unit gets the audio signal and metadata of the object. The vector computing unit calculates the expansion vector representing the location in the extended area of the indicated audio based on the indication of the expansion of the voice and the horizontal and vertical angles in the metadata of the object. The gain calculation unit calculates the VBAP gain of the audio signal of each speaker based on the extension vector through the VBAP. The feature can be applied to the sound processing device.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于处理声音的装置、方法及程序
本技术涉及音频处理装置、方法及程序，并且更具体地涉及通过其能够获得更高质量的声音的音频处理装置、方法及程序。
技术介绍
通常，作为使用多个扬声器来控制声像的定位的技术，已知VBAP(基于向量的幅值相移)(例如，参考NPL1)。在VBAP中，通过从三个扬声器输出声音，声像可以被定位在由这三个扬声器限定的三角形的内侧的一个任意点处。然而，在现实世界中，认为声像不是定位于一个点处，而是定位于具有一定扩散程度的部分空间中。例如，当从声带产生人声时，认为声音的振动传播到脸部、身体等，因此认为声音是从作为整个人体的部分空间发出的。作为如上所述将声音定位在这种部分空间中的技术，即，作为延伸声像的技术，通常已知MDAP(多方向幅值相移)(例如，参考NPL2)。此外，MDAP也用于MPEG-H3D(运动图像专家组-高质量三维)音频标准的渲染处理单元(例如，参考NPL3)。[引用列表][非专利文献(NPL)][NPL1]VillePulkki,“VirtualSoundSourcePositioningUsingVectorBaseAmplitudePanning”,美国电化学协会期刊，第45卷，第6期，第456-466页，1997年[NPL2]Ville-Pulkki,“UniformSpreadingofAmplitudePannedVirtualSources”,会议记录1999，关于信号处理对于音频和声学的应用的IEEE研讨会，新帕尔茨，纽约，1999年10月17-20日[NPL3]ISO/IECJTC1/SC29/WG11N14747...
用于处理声音的装置、方法及程序

【技术保护点】
一种音频处理装置，包括：获取单元，被配置成获取包括指示音频对象的位置的位置信息以及由至少二维或更多维的向量构成并且表示声像距所述位置的扩散的声像信息的元数据；向量计算单元，被配置成基于表示由所述声像信息确定的声像的扩散的区域的水平方向角和竖直方向角来计算指示所述区域中的位置的扩展向量；以及增益计算单元，被配置成基于所述扩展向量来计算提供给位于所述位置信息指示的位置附近的两个或更多个声音输出单元的音频信号中的每个音频信号的增益。

【技术特征摘要】
【国外来华专利技术】2015.06.24 JP 2015-126650;2015.07.28 JP 2015-148681.一种音频处理装置，包括：获取单元，被配置成获取包括指示音频对象的位置的位置信息以及由至少二维或更多维的向量构成并且表示声像距所述位置的扩散的声像信息的元数据；向量计算单元，被配置成基于表示由所述声像信息确定的声像的扩散的区域的水平方向角和竖直方向角来计算指示所述区域中的位置的扩展向量；以及增益计算单元，被配置成基于所述扩展向量来计算提供给位于所述位置信息指示的位置附近的两个或更多个声音输出单元的音频信号中的每个音频信号的增益。2.根据权利要求1所述的音频处理装置，其中，所述向量计算单元基于所述水平方向角与所述竖直方向角之间的比率来计算所述扩展向量。3.根据权利要求1所述的音频处理装置，其中，所述向量计算单元计算预先确定的数量的扩展向量。4.根据权利要求1所述的音频处理装置，其中，所述向量计算单元计算任意可变数量的扩展向量。5.根据权利要求1所述的音频处理装置，其中，所述声像信息是指示所述区域的中心位置的向量。6.根据权利要求1所述的音频处理装置，其中，所述声像信息是指示所述声像距所述区域的中心的扩散程度的二维或更多维的向量。7.根据权利要求1所述的音频处理装置，其中，所述声像信息是指示从所述位置信息指示的位置观看到的所述区域的中心位置的相对位置的向量。8.根据权利要求1所述的音频处理装置，其中，所述增益计算单元：计算关于所述声音输出单元中的每个声音输出单元的每个扩展向量的增益，计算针对所述声音输出单元中的每个声音输出单元的扩展向量所计算的增益的相加值，将所述相加值量化成关于所述声音输出单元中的每个声音输出单元的两个或更多个值的增益，以及基于量化的相加值来计算关于所述声音输出单元中的每个声音输出单元的最终增益。9.根据权利要求8所述的音频处理装置，其中，所述增益计算单元选择要用于计算所述增益的网格的数量，所述网格中的每个网格是由所述声音输出单元中的三个声音输出单元包围的区域，并且所述增益计算单元基于对网格的数量的选择结果和所述扩展向量来计算所述扩展向量中的每个扩展向...

【专利技术属性】
技术研发人员：山本优树，知念彻，辻实，
申请(专利权)人：索尼公司，
类型：发明
国别省市：日本,JP

全部详细技术资料下载我是这个专利的主人