表示音频场景的感兴趣空间的方法和装置制造方法及图纸

技术编号：36287531 阅读：33 留言：0更新日期：2023-01-13 09:59

本公开的各方面提供了表示音频场景的感兴趣空间的方法、装置和非易失性计算机可读存储介质。一种装置包括：处理电路，所述处理电路对所述音频场景的音频场景数据进行解码，所述音频场景数据包括(i)用于表示所述音频场景的多个项的音频内容，以及(ii)指示所述多个项的子集的类型的第一语法元素，所述多个项的子集表示所述音频场景的感兴趣空间。所述处理电路基于所述第一语法元素中指示的所述多个项的子集的类型，确定用于所述多个项的子集的所述音频内容的一部分。所述处理电路呈现所述音频内容的所述确定的部分。内容的所述确定的部分。内容的所述确定的部分。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】表示音频场景的感兴趣空间的方法和装置
通过引用并入本文
[0001]本申请要求于2021年9月29日提交的、申请号为17/489,212、名称为“表示音频场景的感兴趣空间的方法和装置”的美国专利申请的优先权，其要求于2021年5月5日提交的、申请号为63/184,571、名称为“表示音频场景的感兴趣空间”的美国临时申请的优先权。在先申请的全部公开内容通过引用整体并入本文。

[0002]本公开描述总体上涉及音频场景表示的实施例。

技术介绍

[0003]本文所提供的背景描述旨在总体上呈现本公开的背景。在
技术介绍
部分以及本说明书的各个方面中所描述的目前已署名的专利技术人的工作所进行的程度，并不表明其在本公开提交时作为现有技术，且从未明示或暗示其被承认为本公开的现有技术。
[0004]感兴趣区域(ROI，region of interest)是为特定目的识别的数据集内的样本区域。ROI的概念通常用于许多应用领域，例如医学成像、地理信息系统、计算机视觉、光学特征识别等。
[0005]虽然ROI可用于一维...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种表示音频场景的感兴趣空间的方法，其特征在于，所述方法包括：对所述音频场景的音频场景数据进行解码，所述音频场景数据包括(i)用于表示所述音频场景的多个项的音频内容，以及(ii)指示所述多个项的子集的类型的第一语法元素，所述多个项的子集表示所述音频场景的感兴趣空间；基于所述第一语法元素中指示的所述多个项的子集的类型，确定用于所述多个项的子集的所述音频内容的一部分；以及呈现所述音频内容的所述确定的部分。2.根据权利要求1所述的方法，其特征在于，所述第一语法元素指示所述多个项的子集的类型是与收听者空间相关联的类型、与音频声道配置相关联的类型、或与音频对象配置相关联的类型中的一种。3.根据权利要求1所述的方法，其特征在于，所述音频场景数据包括指示所述多个项的子集的数量的第二语法元素。4.根据权利要求3所述的方法，其特征在于，所述第二语法元素指示所述多个项的子集的数量大于1，并且所述音频场景数据包括第三语法元素，所述第三语法元素指示所述多个项的子集中的每个项的标识索引。5.根据权利要求2所述的方法，其特征在于，所述第一语法元素指示所述多个项的子集的类型是与所述收听者空间相关联的类型，并且所述音频场景数据包括第四语法元素，所述第四语法元素指示是否发信号通知所述收听者空间的子类型。6.根据权利要求5所述的方法，其特征在于，所述第四语法元素指示发信号通知所述收听者空间的子类型，并且所述音频场景数据包括指示所述收听者空间的子类型的第五语法元素。7.根据权利要求5所述的方法，其特征在于，所述第四语法元素指示不发信号通知所述收听者空间的子类型，并且所述收听者空间的子类型是基于视频场景确定的。8.根据权利要求5所述的方法，其特征在于，所述收听者空间的子类型是与所述音频场景的最佳点相关联的类型或与听觉空间相关联的类型中的一种。9.一种表示音频场景的感兴趣空间的装置，其特征在于，所述装置包括：处理电路，被配置为：对所述音频场景的音频场景数据进行解码，所述音频场景数据包括(i)用于表示所述音频场景的多个项的音频内容，以及(ii)指示所述多个项的子集的类型的第一语法元素，所述多个项的子集表示所述音频场景的感兴趣空间；基于所述第一语法元素中指示的所述多个项的子集的类型，确定用于所述多个项的子集的所述音频内容的一部分；以及呈现所述音频内容的所述确定的部分。10.根据权利要求9所述的装置，其特征在于，所述第一语法元素指示所述多个项的子集的类型是与收听者空间相关联的类型...

【专利技术属性】
技术研发人员：田军，刘杉，许晓中，
申请(专利权)人：腾讯美国有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人