音频处理制造技术

技术编号:26654315 阅读:45 留言:0更新日期:2020-12-09 00:59
根据示例性实施例,提供了一种渲染空间音频信号的方法,该空间音频信号表示在包括一个或多个音频对象的可选视点音频环境中的声场,其中,每个音频对象与相应的音频内容和在该音频环境中的相应位置相关联,该方法包括:接收该音频环境中被选择的收听位置和定向的指示;基于一个或多个预定义交互准则,检测关于第一音频对象的交互;响应于所述被检测的交互,修改第一音频对象和与其相连接的一个或多个其他音频对象;以及导出至少包括以下项的空间音频信号:与在该声场的第一空间位置的修改后的第一音频对象相关联的音频内容,该第一空间位置对应于修改后的第一音频对象在该音频环境中相对于所述被选择的收听位置和定向的位置;以及与在该声场的相应的其他空间位置的修改后的一个或多个其他音频对象相关联的音频内容,该相应的其他空间位置对应于修改后的一个或多个其他音频对象在该音频环境中相对于所述被选择的收听位置和定向的位置。

【技术实现步骤摘要】
【国外来华专利技术】音频处理
本专利技术的示例和非限制性实施例涉及渲染自由视点音频以呈现给用户。具体地,本专利技术的各种实施例涉及实现由自由视点音频环境内的用户与音频源之间的交互引起的渲染给用户的声场的改变。
技术介绍
自由视点音频通常允许用户在虚拟音频环境中四处移动和改变他/她的定向(即,旋转位置),以及根据他/她在其中的位置和定向体验为虚拟音频环境定义的声场。虽然在本公开中主要使用术语“自由视点音频”来指代这种虚拟音频环境,但是相同的音频概念也可被称为自由收听点音频、六自由度(6DoF)音频或体积音频。在一些示例中,自由视点音频可被提供为仅音频环境,例如,作为独立的虚拟音频系统或作为增强现实(AR)或混合现实(MR)环境的一部分。在其他示例中,自由视点音频可被提供为诸如虚拟现实(VR)环境的视听环境的一部分。通常,虚拟音频环境的声场可以依赖于为虚拟音频环境定义的多个音频源或音频对象。一般来说,给定的音频源/对象由相应的音频内容(例如作为一个或多个数字音频信号而提供)定义,并由分配给该给定的音频源/对象的元数据补充,其中元数据可以定义音频内容和/或给定的本文档来自技高网...

【技术保护点】
1.一种用于渲染空间音频信号的方法,所述空间音频信号表示在包括一个或多个音频对象的可选视点音频环境中的声场,其中,每个音频对象与相应的音频内容和在所述音频环境中的相应位置相关联,所述方法包括:/n接收所述音频环境中被选择的收听位置和定向的指示;/n基于一个或多个预定义交互准则,检测关于第一音频对象的交互;/n响应于所述被检测的交互,修改所述第一音频对象和与其相连接的一个或多个其他音频对象;以及/n导出至少包括以下项的所述空间音频信号:/n与在所述声场的第一空间位置的修改后的第一音频对象相关联的音频内容,所述第一空间位置对应于所述修改后的第一音频对象在所述音频环境中相对于所述被选择的收听位置和定...

【技术特征摘要】
【国外来华专利技术】20180302 GB 1803408.21.一种用于渲染空间音频信号的方法,所述空间音频信号表示在包括一个或多个音频对象的可选视点音频环境中的声场,其中,每个音频对象与相应的音频内容和在所述音频环境中的相应位置相关联,所述方法包括:
接收所述音频环境中被选择的收听位置和定向的指示;
基于一个或多个预定义交互准则,检测关于第一音频对象的交互;
响应于所述被检测的交互,修改所述第一音频对象和与其相连接的一个或多个其他音频对象;以及
导出至少包括以下项的所述空间音频信号:
与在所述声场的第一空间位置的修改后的第一音频对象相关联的音频内容,所述第一空间位置对应于所述修改后的第一音频对象在所述音频环境中相对于所述被选择的收听位置和定向的位置;以及
与在所述声场的相应的其他空间位置的修改后的一个或多个其他音频对象相关联的音频内容,所述相应的其他空间位置对应于所述修改后的一个或多个其他音频对象在所述音频环境中相对于所述被选择的收听位置和定向的位置。


2.根据权利要求1所述的方法,其中,所述检测包括:检测所述第一音频对象与所述一个或多个其他音频对象之间的交互。


3.根据权利要求1所述的方法,其中,所述检测包括:检测所述第一音频对象与所述被选择的收听位置和定向之间的交互。


4.根据权利要求3所述的方法,其中,检测所述第一音频对象与所述被选择的位置和定向之间的交互包括应用以下交互准则中的一个:
检测所述被选择的位置与所述第一音频对象的位置之间的距离低于预定义阈值距离;
检测所述被选择的位置与所述第一音频对象的位置之间的距离低于预定义阈值距离,以及检测所述被选择的定向朝向所述第一音频对象的位置;
检测所述被选择的位置与被连接到所述第一音频对象的另一音频对象的位置之间的距离低于所述预定义阈值距离;
检测所述被选择的位置与被连接到所述第一音频对象的另一音频对象的位置之间的距离低于所述预定义阈值距离,以及检测被选择的定向朝向所述另一音频对象的位置。


5.根据权利要求1至4中任一项所述的方法,其中,音频对象与相应的元数据相关联,所述元数据包括内容部分和格式部分,其中,所述内容部分包括所述音频内容,所述格式部分包括一个或多个渲染参数,所述一个或多个渲染参数定义依赖于所述音频对象在所述音频环境中相对于所述被选择的收听位置和定向的位置的所述音频内容的期望渲染。


6.根据权利要求1至5中任一项所述的方法,其中,所述修改包括:
响应于所述被检测的交互,识别要被应用于所述第一音频对象的第一修改,并对所述第一音频对象应用所述第一修改;
响应于所述被检测的交互,识别要被修改的一个或多个其他音频对象,识别要被应用于相应的其他音频对象的一个或多个其他修改,并对所述相应的其他音频对象应用所述一个或多个其他修改。


7.根据权利要求6所述的方法,其中,所述第一修改和所述一个或多个其他修改中的每一个包括以下中的一个:
激活所述第一音频对象和所述一个或多个其他音频对象中的相应的音频对象;
去激活所述第一音频对象和所述一个或多个其他音频对象中的相应的音频对象;
改变源自所述第一音频对象和所述一个或多个其他音频对象中的相应的音频对象的音频内容的相对幅度;
改变所述第一音频对象和所述一个或多个音频对象中的相应的音频对象在所述音频环境中的位置。


8.根据权利要求1至7中任一项所述的方法,其中,所述第一音频对象与第一交互元数据相关联,并且其中,所述一个或多个其他音频对象与相应的其他交互元数据相关联,其中,
所述第一交互元数据包括所述一个或多个预定义交互准则的定义、要被应用于所述第一音频对象的第一修改的定义、以及第一其他音频对象的标识;以及
第一其他交互元数据包括要被应用于所述第一其他音频对象的第一其他修改的定义。


9.根据权利要求1至7中任一项所述的方法,其中,所述音频环境包括与控制元数据相关联的音频控制对象,其中,所述第一音频对象与第一交互元数据相关联,并且其中,所述一个或多个其他音频对象与相应的其他交互元数据相关联,其中,
所述控制元数据包括所述一个或多个预定义交互准则的定义、以及所述第一音频对象的标识;
所述第一交互元数据包括要被应用于所述第一音频对象的第一修改的定义、以及第一其他音频对象的标识;以及
第一其他交互元数据包括要被应用于所述第一其他音频对象的第一其他修改的定义。


10.根据权利要求8或9所述的方法,其中,
所述第一其他交互元数据包括第二其他音频对象的标识;以及
第二其他交互元数据包括要被应用于所述第二其他音频对象的第二其他修改的定义。


11.根据权利要求1至7中任一项所述的方法,其中,所述第一音频对象与第一...

【专利技术属性】
技术研发人员:L·拉克索宁
申请(专利权)人:诺基亚技术有限公司
类型:发明
国别省市:芬兰;FI

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1