音频内容的与呈现独立的母带处理制造技术

技术编号:32613499 阅读:68 留言:0更新日期:2022-03-12 17:41
一种用于生成经母带处理的音频内容的方法,该方法包括获得包括数个(M1个)的音频信号的输入音频内容,获得输入音频内容的渲染呈现,该渲染呈现包括数个(M2个)的音频信号,获得通过对渲染呈现进行母带处理而生成的母带处理呈现,将母带处理呈现与渲染呈现进行比较以确定母带处理呈现与渲染呈现之间的差异的一个或多个指示,基于差异的指示来修改输入音频内容的音频信号中的一个或多个以生成母带处理音频内容。通过这种方法,可以使用传统的、通常是立体声的、基于通道的母带处理工具来提供包括基于对象的沉浸式音频内容在内的任何输入音频内容的母带处理版本。输入音频内容的母带处理版本。输入音频内容的母带处理版本。

【技术实现步骤摘要】
【国外来华专利技术】音频内容的与呈现独立的母带处理
[0001]相关应用的交叉引用
[0002]本申请要求2019年7月9日提交的西班牙申请第P201930637号以及2019年10月7日提交的美国临时专利申请第62/911,844号的优先权,这些申请的内容通过引用结合于此。


[0003]本专利技术涉及对多通道、沉浸式和/或基于对象的音频内容(例如Dolby Atmos)的母带处理(mastering),并且具体而言,涉及对先前未被下混合和/或渲染为特定回放呈现(例如立体声,5.1等)的内容的母带处理。
[0004]背景内容
[0005]音乐制作和发行通常包括以下级:
[0006]·
音乐曲目的创作、录制和/或制作。在这一级,捕获或生成音频资产,并创建或提炼作品。
[0007]·
混音:在这一级,调整电平、音色和音效,以创建一个美观愉悦的混音,其中所有乐器和音效都得到适当的平衡。该过程提供了对各个录音、轨道、乐器和音干(如果有)的访问,各个录音、轨道、乐器和音干(如果有)然后可以被单独地修改或作为子组被修改。
[0008]·
母带处理:在这一级,根据整体音色、响度和动态的变化对混音内容的下混进行修改。这些属性被修改以改善整体混音(孤立地),改善专辑中轨道之间的电平和音色的一致性,使录制适合特定的发行媒体(有损编解码器、唱片、CD)等。
[0009]母带处理级传统上是在混音的基于通道的呈现(例如混音的立体声或5.1演绎或缩混)上执行的。此外,母带处理过程中采用的典型处理器包括均衡器、(多频带)压缩器、峰值限制器和/或非线性过程,例如仿真磁带或管饱和、峰值限制和/或削波等。这些处理器可以被实现为在数字音频工作站(DAW)或专用硬件上运行的数字进程。可替代地或者附加地,它们可以被实现为模拟硬件。
[0010]母带处理过程传统上由母带处理工程师承担,然而最近自动母带处理工具被引入,例如作为云服务。
[0011]传统的母带处理过程和所涉及的工具在内容的基于通道的呈现(例如,适合于特定的再现布局,诸如两个扬声器或耳机)上工作。此外,可用于该过程的大多数工具将仅对于有限数量的通道(通常是立体声、5.1或7.1)工作。
[0012]这种传统的工作流程和工具集对于其他格式的音频内容,例如包括多个信号(音频通道和/或空间音频对象)并且还没有被下混合或呈现为缩减的通道集的内容,提出了挑战。这种内容的一个例子是具有大量通道的基于通道的音频,这些通道可以包括高度通道。包括这种高度通道的基于通道的音频内容通常被称为“基于通道的沉浸式音频”。对具有大量通道的基于通道的音频的母带处理通常应用于混合成有限数量的通道(立体声、5.1或7.1)的下混。
[0013]除了传统的音频通道之外,基于对象的沉浸式音频还包括作为与(动态)空间位置相关联的音频信号的音频对象。基于对象的沉浸式音频内容以回放期间在再现侧执行渲染
过程的形式分发。因此,需要以沉浸式或基于对象的格式(例如,在分发之前)来执行对该内容的母带处理,而对于这一点,目前没有或几乎没有工具存在。
[0014]基于对象的沉浸式音频内容可以渲染为适用于大量不同再现系统(单通道、立体声、5.1、7.1、7.1.2、5.1.4扬声器设置、条形音箱和耳机)的呈现。由于时间和精力的限制,单独对每种再现设置的内容进行母带处理几乎是不可能的,或者极其昂贵和耗时。
[0015]沉浸式音频(基于通道或基于对象的)内容可以由超过100个对象和/或床通道组成,因此,难以设置同时应用于所有这些元素的通用过程,这样的通用过程可能导致高的中央处理器(CPU)负载,因此是非常不希望的,并且是不可扩展的。这在母带处理工程师希望使用模拟硬件的情况下尤其如此,模拟硬件必须实时使用,并且由于有限的硬件可用性和高的对象或通道计数,模拟硬件通常需要顺序处理对象。
[0016]沉浸式和/或基于对象的音频内容正变得越来越广泛地用于目标回放系统,例如电影院、家用音频系统和耳机。因此,希望提供一种更加高效和灵活的方法来对沉浸式音频内容进行母带处理。此外,音频内容的其他示例将受益于改进的母带处理过程。
[0017]专利技术概述
[0018]本专利技术的第一方面涉及一种用于生成经母带处理的音频内容的方法,该方法包括获得包括数个(M1个)的音频信号的输入音频内容,获得所述输入音频内容的渲染呈现,所述渲染呈现包括数个(M2个)的音频信号,获得通过对所述渲染呈现进行母带处理而生成的母带处理呈现,将所述母带处理呈现与所述渲染呈现进行比较以确定所述母带处理呈现与所述渲染呈现之间的差异的一个或多个指示,基于差异的指示来修改输入音频内容的音频信号中的一个或多个,以生成经母带处理的音频内容。
[0019]与现有技术的母带处理过程相比,所提出的方法的优点包括:
[0020]传统的、典型的立体声、基于通道的母带处理工具可在与母带处理工程师所习惯的工作流程相同的工作流程中使用,以便提供包括基于对象的沉浸式音频内容在内的任何输入音频内容的母带处理版本。
[0021]与基于特定再现布局的传统母带处理方法不同,本专利技术的各方面允许创建经母带处理的音频资产,该音频资产可以被渲染至任何扬声器布局、移动设备或耳机。
[0022]根据本专利技术各方面的母带处理过程可以应用于内容的一个或数个特定呈现,而不必独立地为每个扬声器设置进行母带处理(即,一次母带处理,在任何地方播放)。
[0023]母带处理过程可以是全自动的(例如作为云服务或基于人工智能)或人工的(由母带处理工程师进行)。
[0024]渲染呈现是适于在音频再现系统上再现(回放)的呈现,与输入音频内容相比,渲染呈现通常具有较少的信号(M1>M2),但是在某些情况下可能具有相同数量的音频信号,或者甚至更多的音频信号。
[0025]输入音频内容可以是多通道内容,例如5.1或7.1。输入音频内容可以包括3D音频信息,例如基于通道或基于对象的沉浸式音频。
[0026]渲染呈现可以是立体声呈现、双耳呈现或任何其他合适的呈现。
[0027]在一些实施例中,差异指示表示所述母带处理呈现和渲染呈现的时频片中的能量水平,并且修改被设计成使得输入音频内容的信号的各时频片中的能量均衡。
[0028]例如,可以根据下式计算信号x
n,b,c
[k]n的时频片的能量水平
[0029][0030]其中n是时间段索引,b是频带索引,c是通道索引,k是样本索引。
[0031]修改输入音频内容的步骤包括应用片特定增益,该片特定增益表示分别在所述母带处理呈现和所述渲染呈现中的相应片的能量水平之间的比率(平方根)。
附图说明
[0032]将参照附图更详细地描述本专利技术,附图示出了本专利技术的当前优选实施例。
[0033]图1是示出本专利技术实施例的概述的框图。
[0034]图2是示出基于分析和合成滤波器组的本专利技术实施例的框图。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于生成经母带处理的音频内容的方法,该方法包括:获得包括数个(M1个)的音频信号的输入音频内容;获得所述输入音频内容的渲染呈现,所述渲染呈现包括数个(M2个)的音频信号;获得通过对所述渲染呈现进行母带处理而生成的母带处理呈现;将所述母带处理呈现与所述渲染呈现进行比较以确定所述母带处理呈现与所述渲染呈现之间的差异的一个或多个指示;基于差异的指示来修改输入音频内容的音频信号中的一个或多个,以生成经母带处理的音频内容。2.根据权利要求1所述的方法,其中获得渲染呈现包括将所述输入音频内容渲染为数量减少的音频信号,使得M1>M2。3.根据权利要求2所述的方法,其中渲染呈现是立体声呈现。4.根据权利要求2或3所述的方法,其中所述输入音频内容是多通道内容,例如5.1或7.1。5.根据权利要求1或2所述的方法,其中,所述输入音频内容包括3D音频信息。6.根据权利要求5所述的方法,其中所述输入音频内容包括至少一个音频对象,每个音频对象包括与空间位置相关联的音频信号,并且渲染呈现包括所述至少一个音频对象的时变渲染。7.根据权利要求1所述的方法,其中,所述母带处理呈现和所述渲染呈现之间的差异的指示对于所述渲染呈现中的不同音频信号或音频信号集被独立地确定,并且输入音频内容的音频信号中的一个或多个根据其贡献于的所述渲染呈现中的一个或多个音频信号被修改。8.根据权利要求1所述的方法,还包括使用一个或多个处理器对所述渲染呈现应用母带处理过程的步骤,所述一个或多个处理器实现以下一个或多个:压缩器、多频带压缩器、均衡器、动态均衡器、峰值限制器和非线性处理设备,其中所述一个或多个处理器可以是模拟的、数字的或两者的组合。9.根据权利要求8所述的方法,还包括将自动母带处理算法应用于所述渲染呈现的步骤。10.根据前述权利要求中任一项所述的方法,其中各个步骤至少部分地在数字音频工作站(DAW)中运行。11.根据前述权利要求中任一项所述的方法,其中输入音频内容、渲染呈现和母带处理呈现被上传到基于云的服务中,并且其中比较和修改的步骤由所述基于云的服务执行。12.根据前述权利要求中任一项所述的方法,其中差异指示表示所母带处理呈现和渲染呈现的时频片中的能量水平,并且其中所述修改使输入音频内容的信号的各时频片中的能量均衡。13.根据权利要求12所述的方法,其中所述修改使输入音频内容的信号的各时频片中的能量的分布特性均衡,所述分布特性是分布的平均值、中值、方差、分位数或任何高阶矩。14.根据权利要求12或13所述的方法,其中比较步骤包括:确定第一组增益,该第一组增益表示所述母带处理呈现和所述渲染呈现的相应时频片
中的能量水平的比率,所述时频片具有时间和频率分辨率之间的...

【专利技术属性】
技术研发人员:D
申请(专利权)人:杜比国际公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1