用于处理音频数据的方法和装置、介质及设备制造方法及图纸

技术编号:13038199 阅读:33 留言:0更新日期:2016-03-23 10:16
弥漫性或空间上的大音频对象可被识别以进行特殊处理。去相关过程可以对对应于大音频对象的音频信号执行,以产生去相关的大音频对象音频信号。这些去相关的大音频对象音频信号可以与对象位置关联,对象位置可以是固定的或随时间变化的位置。例如,去相关的大音频对象音频信号可以被渲染到虚拟或实际扬声器位置。这种渲染过程的输出可以被输入到场景简化过程。去相关、关联和/或场景简化过程可以在编码音频数据的过程之前执行。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】空间上的弥漫性或大音频对象的处理对相关申请的交叉引用本申请要求于2013年7月31日提交的西班牙专利申请N0.P201331193和2013年10月2日提交的美国临时申请N0.61/885,805的优先权,每个申请的全部内容都通过弓I用被结合于此。
本公开内容涉及处理音频数据。更具体而言,本公开内容涉及处理对应于弥漫性(d i f f us e)或空间上的大音频对象的音频数据。
技术介绍
自1927年在电影中引入声音开始,用来捕获运动画面声轨的艺术意图并且再现这种内容的技术一直稳步发展。在20世纪70年代,杜比(Dolby)推出了利用3个屏幕通道和一个单环绕声道编码和分布混合的成本有效手段。在20世纪90年代,杜比利用5.1通道格式将数字声音带到电影院,该5.1通道格式提供分立的左、中、右屏幕通道,左和右环绕声阵列以及用于低频效果的低音炮通道。在2010年推出的杜比环绕7.1通过将现有的左和右环绕通道分为四个“区”,增加了环绕通道的数量。电影院和家庭影院音频重放系统正变得越来越多功能和复杂。家庭影院音频重放系统包括越来越多数量的扬声器。随着通道数量增加并且喇叭布局从平面二维(2D)阵列变迀到包括仰角(elevat1n)的三维(3D)阵列,在重放环境中再现声音正成为更加复杂的过程。改进的音频处理方法将是期望的。
技术实现思路
提供了用于处理弥漫性或空间上的大音频对象的改进方法。如本文所使用的,术语“音频对象”指音频信号(本文也称为“音频对象信号”)和无需参照任何特定的重放环境就可被创建或“创作”的关联的元数据。关联的元数据可以包括音频对象位置数据、音频对象增益数据、音频对象尺寸数据、音频对象轨迹数据,等等。如本文所使用的,术语“清染”指将音频对象变换成用于特定重放环境的扬声器馈送信号的过程。渲染过程可以至少部分地根据关联的元数据并根据重放环境数据来执行。重放环境数据可以包括重放环境中扬声器数量的指示和重放环境内每个扬声器的位置的指示。空间上的大音频对象不是要被感知为点声源,而是应当被感知为覆盖大的空间区域。在一些情况下,大音频对象应当被感知为围绕听者。这种音频效果可能无法仅仅通过平移(panning)来实现,而是可能需要另外的处理。为了创建令人信服的空间对象尺寸,或空间弥漫性,重放环境中显著比例的扬声器信号应当相互独立,或至少不相关(例如,就一阶交叉相关或协方差而言是独立的)。足够复杂的渲染系统,诸如用于剧院的渲染系统,可以能够提供这种去相关。但是,不太复杂的渲染系统,诸如要用于家庭影院系统的那些,可能不能够提供足够的去相关。本文所描述的一些实施方式可以涉及识别弥漫性或空间上的大音频对象以进行特殊处理。去相关过程可以对对应于大音频对象的音频信号执行,以产生去相关的大音频对象音频信号。这些去相关的大音频对象音频信号可以与对象位置关联,对象位置可以是静止的或随时间变化的位置。关联过程可以独立于实际重放扬声器配置。例如,去相关的大音频对象音频信号可以被渲染到虚拟扬声器位置。在一些实施方式中,这种渲染过程的输出可以被输入到场景简化过程。因此,本公开内容的至少一些方面可以在可以涉及接收包括音频对象的音频数据的方法中实现。音频对象可以包括音频对象信号和关联的元数据。元数据可以至少包括音频对象尺寸数据。该方法可以涉及,基于音频对象尺寸数据,确定音频对象尺寸大于阈值尺寸的大音频对象并且对大音频对象的音频信号执行去相关过程,以产生去相关的大音频对象音频信号。该方法可以涉及将去相关的大音频对象音频信号与对象位置关联。关联过程可以独立于实际重放扬声器配置。实际重放扬声器配置可以最终被用来向重放环境的扬声器渲染去相关的大音频对象音频信号。该方法可以涉及接收用于大音频对象的去相关元数据。去相关过程可以至少部分地根据该去相关元数据来执行。该方法可以涉及编码从关联过程输出的音频数据。在一些实施方式中,编码过程可以不涉及编码用于大音频对象的去相关元数据。对象位置可以包括对应于接收的音频对象的至少一些音频对象位置数据的位置。至少一些对象位置可以是固定的。但是,在一些实施方式中,至少一些对象位置可以随时间变化。关联过程可以涉及根据虚拟扬声器位置渲染去相关的大音频对象音频信号。在一些例子中,接收过程可以涉及接收对应于扬声器位置的一个或多个音频床(bed)信号。该方法可以涉及混合接收的音频床信号或接收的音频对象信号当中至少一些与去相关的大音频对象音频信号。该方法可以涉及输出去相关的大音频对象音频信号,作为另外的音频床信号或音频对象信号。该方法可以涉及向去相关的大音频对象音频信号应用电平调节过程。在一些实施方式中,大音频对象元数据可以包括音频对象位置元数据并且电平调节过程可以至少部分地依赖于大音频对象的音频对象尺寸元数据和音频对象位置元数据。该方法可以涉及在执行去相关过程之后衰减或删除大音频对象的音频信号。但是,在一些实施方式中,该方法可以涉及在执行去相关过程之后保留对应于大音频对象的点源贡献的音频信号。大音频对象元数据可以包括音频对象位置元数据。在一些这样的实施方式中,该方法可以涉及计算来自由大音频对象位置数据和大音频对象尺寸数据定义的音频对象面积或体积内的虚拟源的贡献。该方法还可以涉及至少部分地基于计算的贡献为多个输出通道当中每一个确定音频对象增益值的集合。该方法可以涉及混合去相关的大音频对象音频信号与用于在空间上与该大音频对象分开的距离为阈值量的音频对象的音频信号。在一些实施方式中,该方法可以涉及在去相关过程之后执行音频对象群集过程。在一些这样的实施方式中,音频对象群集过程可以在关联过程之后执行。该方法可以涉及评估音频数据,以确定内容类型。在一些这样的实施方式中,去相关过程可以根据内容类型被有选择地执行。例如,要执行的去相关的量可以依赖于内容类型。去相关过程可以涉及延迟、全通滤波器、伪随机滤波器和/或混响(reverberat1n)算法。在本文中公开的方法可以经由硬件、固件、存储在一个或多个非暂态介质中的软件和/或其组合来实现。例如,本公开内容的至少一些方面可以在包括接口系统和逻辑系统的装置中实现。接口系统可以包括用户接口和/或网络接口。在一些实施方式中,该装置可以包括存储器系统。接口系统可以包括逻辑系统与存储器系统之间的至少一个接口。逻辑系统可以包括至少一个处理器,诸如通用单芯片或多芯片处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件,和/或其组合。在一些实施方式中,逻辑系统可以能够经由接口系统接收包括音频对象的音频数据。音频对象可以包括音频对象信号和关联的元数据。在一些实施方式中,元数据至少包括音频对象尺寸数据。逻辑系统可以能够基于音频对象尺寸数据确定音频对象尺寸大于阈值尺寸的大音频对象并且对大音频对象的音频信号执行去相关过程,以产生去相关的大音频对象音频信号。逻辑系统可以能够将去相关的大音频对象音频信号与对象位置关联。关联过程可以独立于实际重放扬声器配置。例如,关联过程可以涉及根据虚拟扬声器位置渲染去相关的大音频对象音频信号。实际重放扬声器配置可以最终被用来向重放环境的扬声器渲染去相关的大音频对象音频信号。本文档来自技高网...

【技术保护点】
一种方法,包括:接收包括音频对象的音频数据,音频对象包括音频对象信号和关联的元数据,元数据至少包括音频对象尺寸数据;基于音频对象尺寸数据,确定音频对象尺寸大于阈值尺寸的大音频对象;对大音频对象的音频信号执行去相关过程,以产生去相关的大音频对象音频信号;以及将去相关的大音频对象音频信号与对象位置关联,该关联过程独立于与实际重放扬声器配置。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:D·J·布瑞巴特芦烈N·R·清格斯A·玛蒂奥斯索尔
申请(专利权)人:杜比实验室特许公司杜比国际公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1