空间音频下混频制造技术

技术编号：23904146 阅读：67 留言：0更新日期：2020-04-22 12:31

空间音频对象中的音频数据信道与一个或多个所记录声音的方向和位置中的一者或多者相关联，这些信道将被再现为空间声音。可视化空间声音对象表示空间声音的快照/缩略图。为了(通过体验快照或缩略图)预览空间声音，用户操纵可视化空间声音对象的取向，并且渲染这些信道的加权下混频，以供作为空间预览声音输出，例如，将单个输出音频信号提供给空间音频渲染器；在预览声音中，被取向为朝向用户的一个或多个信道受到的突显超过被取向为背离用户的信道受到的突显。也描述了其他方面并要求对其他方面进行保护。

Spatial audio down mixing

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】空间音频下混频本非临时专利申请要求2017年9月29日提交的美国临时专利申请62/566,228的较早提交日期的权益。
该
整体涉及用于音频处理的计算机化数据处理系统和方法，并且具体地，涉及空间音频处理。
技术介绍
在增强现实(AR)、虚拟现实(VR)和混合现实(MR)应用(由本文所使用的术语“模拟现实”或SR所涵盖)中产生三维(3D)声音效果通常被用来增强媒体内容。被设计为产生3D声音的空间音频格式的示例包括MPEG-H(运动图像专家组)3D音频标准、HOA(高阶高保真度立体声响复制)空间音频技术和DOLBYATMOS环绕声技术。例如，声音设计者通过操纵空间音频对象中包含的声音来增添3D声音效果，从而增强SR应用中的场景，其中声音是能够受到虚拟定位以供空间音频系统在SR应用程序创建的虚拟3D空间的任何位置回放的环境声音和/或离散声音。
技术实现思路
本文所述的空间音频下混频的实施方案使增强现实/虚拟现实/混合现实(SR)应用程序开发者以及由SR应用程序创建的SR体验中的收听者能够通过音频数据预览声音，其中该音频数据中对声音进行了编码并且该音频数据能够被创作到SR应用程序中。在一个实施方案中，其中记录或编码了声音的音频数据被存储为保留一个或多个所记录声音的空间特征的空间音频对象。在一个实施方案中，空间音频对象包含表示一个或多个所记录声音的多个音频数据信道，每个信道与所记录声音的来源的方向和位置(距离)中的任何一者或多者相关联。需注意，可存在与给定方向或位置相关联的两个或更多个...

【技术保护点】
1.一种用于处理空间音频的计算机实现的方法，所述方法包括：/n接收被编码为保留一个或多个所记录声音的空间特征的空间音频对象，其中，所述空间音频对象包括表示所述一个或多个所记录声音的多个音频数据信道，每个信道与方向和位置中的任何一者或多者相关联；/n呈现所述空间音频对象的视觉表示，其中，所述多个音频数据信道中的每者基于其相应的方向或位置与所述视觉表示的一部分相关联；/n基于所述视觉表示的取向对所述多个音频数据信道中的每个信道进行加权，其中，与所述视觉表示的被取向为朝向预先确定对象的一部分相关联的信道受到的加权高于与所述视觉表示的被取向为背离所述预先确定对象的一部分相关联的信道受到的加权；/n对所述加权音频数据信道进行下混频；以及/n基于所述下混频加权信道呈现声音。/n

【技术特征摘要】
【国外来华专利技术】20170929 US 62/566,2281.一种用于处理空间音频的计算机实现的方法，所述方法包括：
接收被编码为保留一个或多个所记录声音的空间特征的空间音频对象，其中，所述空间音频对象包括表示所述一个或多个所记录声音的多个音频数据信道，每个信道与方向和位置中的任何一者或多者相关联；
呈现所述空间音频对象的视觉表示，其中，所述多个音频数据信道中的每者基于其相应的方向或位置与所述视觉表示的一部分相关联；
基于所述视觉表示的取向对所述多个音频数据信道中的每个信道进行加权，其中，与所述视觉表示的被取向为朝向预先确定对象的一部分相关联的信道受到的加权高于与所述视觉表示的被取向为背离所述预先确定对象的一部分相关联的信道受到的加权；
对所述加权音频数据信道进行下混频；以及
基于所述下混频加权信道呈现声音。

2.根据权利要求1所述的计算机实现的方法，其中呈现所述视觉表示包括：
显示所述视觉表示，其中所述视觉表示包括与所述视觉表示的所述部分中的一个相对应的图像，所述图像表示由所述多个信道中的一个或多个信道表示的占主导的所记录声音，所述一个或多个信道与所述视觉表示的所述部分中的所述一个部分相关联。

3.根据前述权利要求中任一项所述的计算机实现的方法，其中，对所述加权音频数据信道进行下混频包括将所述加权信道中的每者取向为与相应加权信道的初始取向相对的方向，并且对所述重新取向的加权信道进行下混频。

4.根据前述权利要求中任一项所述的计算机实现的方法，其中，基于所述下混频加权信道来呈现声音会将所述声音模拟为源自对应于所述视觉表示的位置。

5.根据前述权利要求中任一项所述的计算机实现的方法，还包括：
接收用户输入，所述用户输入用以相对于所述用户来重新取向所述视觉表示，使得所述视觉表示的不同部分对所述用户可见。

6.根据权利要求5所述的计算机实现的方法，其中，所述视觉表示的对所述用户可见的所述不同部分包括表示由与所述视觉表示的所述不同部分相关联的信道表示的占主导的所记录声音的图像。

7.根据前述权利要求中任一项所述的计算机实现的方法，其中，基于所述视觉表示的所述取向对所述多个音频数据信道中的每个信道进行加权是基于所述虚拟表示的更新取向重复执行的。

8.根据前述权利要求中任一项所述的计算机实现的方法，其中，呈现所述视觉表示包括显示表面具有多个图像的属于球体或多面体中的一者的球体，其中，每个图像是所述视觉表示的所述不同部分并且表示由与所述不同部分相关...

【专利技术属性】
技术研发人员：C·T·尤班克，M·S·康诺利，S·E·平托，
申请(专利权)人：苹果公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人