感兴趣空间的分层描述制造技术

技术编号：38201515 阅读：12 留言：0更新日期：2023-07-21 16:44

本公开的各方面提供了用于音频处理的方法和装置。在一些示例中，用于媒体处理的装置包括处理电路。处理电路接收与音频场景中的感兴趣空间的分层描述关联的音频输入。感兴趣空间包括多个子空间。分层描述包括第一层和第二层。第一层具有公共节点，公共节点具有第一值，第一值是多个子空间中的两个或更多个子空间的公共属性值。第二层具有分别与多个子空间中的每个子空间关联的单独节点。处理电路基于分层描述来确定感兴趣空间的多个子空间，并响应于音频场景的主体的位置在感兴趣空间中而基于音频输入来渲染音频输出。于音频输入来渲染音频输出。于音频输入来渲染音频输出。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】感兴趣空间的分层描述
[0001]相关申请的交叉引用
[0002]本公开要求于2022年5月23日提交的题为“LAYERED DESCRIPTION OF SPACE OF INTEREST”的美国专利申请第17/751425号的优先权，该美国专利申请要求于2021年7月1日提交题为“Layered Description of Space of Interest”的第63/217442号美国临时申请的优先权的权益，在先申请的公开内容全部通过引用并入本文。

[0003]本公开描述了总体上与音频处理相关的实施例。

技术介绍

[0004]本文所提供的背景描述是出于总体上呈现本公开的内容的目的。在
技术介绍
部分以及本说明书的各个方面中所描述的目前已署名的专利技术人的工作所进行的程度，并不表明其在本申请提交时作为现有技术，且从未明示或暗示其被承认为本公开的现有技术。
[0005]在虚拟现实或增强现实的应用中，为了使用户具有存在在应用的虚拟世界中的感觉，应用的虚拟场景中的音频被感知为在真实世界中，声音来自关联的虚拟场景的虚拟人物。在一些示例中，用户在现实世界中的物理运动被感知为在应用的虚拟场景中具有匹配的运动。此外，重要的是，用户可以使用被感知为真实的并且与用户在现实世界中的体验相匹配的音频来与虚拟场景进行交互。

技术实现思路

[0006]本公开的各方面提供了用于音频处理的方法和装置。在一些示例中，用于媒体处理的装置包括处理电路。处理电路接收与针对音频场景中的感兴趣空间的分层描述关联的音频...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种设备中的媒体处理的方法，包括：接收与针对音频场景中的感兴趣空间的分层描述关联的音频输入，所述感兴趣空间包括多个子空间，所述分层描述包括第一层和第二层，所述第一层具有公共节点，所述公共节点具有第一值，所述第一值是所述多个子空间中的两个或更多个子空间的公共属性值，而所述第二层具有分别与所述多个子空间中的每个子空间关联的单独节点；由所述设备的处理器，基于所述分层描述来确定所述感兴趣空间的所述多个子空间；以及由所述处理器响应于所述音频场景的主体的位置在所述感兴趣空间中而基于所述音频输入来渲染音频输出。2.根据权利要求1所述的方法，其中，所述多个子空间是由至少位置属性、方向属性和尺寸属性定义的矩形框。3.根据权利要求1所述的方法，其中，所述公共节点标识针对属性的名称，且所述第一值是所述属性的属性值，并且所述确定所述多个子空间包括：从所述第一层中的所述公共节点检索所述第一值作为针对所述多个子空间中的子空间的所述属性的属性值。4.根据权利要求1所述的方法，其中，所述公共节点标识属性的名称和所述属性的子字段的索引，所述第一值是针对所述属性的所述子字段的子字段属性值，并且所述确定所述多个子空间包括：从所述第一层中的所述公共节点检索所述第一值，作为针对所述多个子空间中的子空间的所述属性的所述子字段的所述子字段属性值。5.根据权利要求1所述的方法，其中，具有所述第一值的所述公共节点对于所述多个子空间是公共的，并且所述确定所述多个子空间还包括：从所述第一层中的所述公共节点检索所述第一值作为针对所述多个子空间中的每个子空间的属性的属性值。6.根据权利要求1所述的方法，其中，具有所述第一值的所述公共节点对于所述多个子空间的子集是公共的，并且所述确定所述多个子空间还包括：响应于与第一子空间关联的第一单独节点缺少针对属性的值，从所述第一层中的所述公共节点检索所述第一值作为所述第一子空间的所述属性的属性值；以及响应于与和第二子空间关联的第二单独节点中的属性关联的第二值的存在，从所述第二单独节点检索与针对所述第二子空间的所述属性关联的第二值。7.根据权利要求1所述的方法，其中，具有所述第一值的所述公共节点对于所述多个子空间的子集是公共的，并且所述确定所述多个子空间还包括：响应于与第一子空间关联的第一单独节点缺少属性的值，从所述第一层中的所述公共节点，检索所述第一值作为所述第一子空间的所述属性的属性值；从与第二子空间关联的第二单独节点，检索与所述第二子空间的所述属性关联的差值；以及基于所述第一值和所述差值计算针对所述第二子空间的所述属性的第二值。8.根据权利要求1所述的方法，还包括：接收携带所述音频输入和所述感兴趣空间的分层描述的比特流作为所述音频输入的
元数据；以及解码所述比特流以获得所述音频输入和所述感兴趣空间的分层描述。9.根据权利要求1所述的方法，还包括：响应于所述音频场景的主体的位置位于所述感兴趣空间之外，忽略所述音频输入而不进行渲染。10.一种媒体处理装置，包括处理电路，所述处理电路被配置为：接收与针对音频场景中的感兴趣空间的分层描述关联的音频输入，所述感兴趣空间包括多个子空间，所述分层描述包括第一层和第二层，所述第一层具有公共节点，所述公共节点具有第一值，所述第一值是所述多个子空间中的两个或更多个子空间的公共属性值，而所述第二层具有分别与所述多个子空间中的每个子空间关联的单独节...

【专利技术属性】
技术研发人员：田军，许晓中，刘杉，
申请(专利权)人：腾讯美国有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人