用于生成自适应音频内容的方法、系统和装置制造方法及图纸

技术编号：10821245 阅读：159 留言：0更新日期：2014-12-26 02:31

本发明专利技术的实施例涉及自适应音频内容生成。具体而言，公开了一种用于生成自适应音频内容的方法，该方法包括：从基于声道的源音频内容中提取至少一个音频对象，以及至少部分地基于该至少一个音频对象生成自适应音频内容。还公开了相应的系统和计算机程序产品。

全部详细技术资料下载

【技术实现步骤摘要】
自适应音频内容生成
本专利技术总体上涉及音频信号处理，更具体地，涉及自适应音频内容生成。
技术介绍
目前的音频内容通常按照基于声道（channel based)的格式来生成和保存。例如，立体声、环绕5. 1、环绕7. 1都是得到广泛应用的基于声道的音频内容格式。随着多媒体技术的不断发展，诸如三维（3D)电影和电视之类的多媒体数字内容正在变得日益流行。然而，传统的基于声道的音频格式通常难以有效地创建与之相适应的具有沉浸感的、逼真的音频内容。因此，期望多声道音频系统能够相应地得到扩展，从而创建更为富有沉浸感的立体声声场。实现这一目标的重要途径之一是使用自适应（adaptive)音频内容。与传统基于声道的音频内容相比，自适应音频内容不仅包括音频声道，而且还包括音频对象（audio object)。在此使用的术语音频对象是指在所定义的一段持续时间中而存在的各种音频元素或声源。音频对象可以是动态的或者静态的。音频对象可以是在声场中充当声源的人、动物或者任何其他物体。可选地，音频对象还可以具有关联的元数据，例如用于描述对象的位置、速度、大小等方面的信息。音频对象的使用使得自适应音频内容具有很高的沉浸感和良好的听觉效果，并且允许调音师等操作者方便地控制和调整音频对象。而且，借助于对音频对象的操作，可以准确地控制离散的声音元素，而无需考虑具体的回放扬声器配置。同时，自适应音频内容可以进一步包括称为静态环境声（audio bed) 的基于声道的部分和/或任何其他音频元素。在此使用的术语静态环境声或简称环境声是指将在...

【技术保护点】
一种用于生成自适应音频内容的方法，所述方法包括：从基于声道的源音频内容中提取至少一个音频对象；以及至少部分地基于所述至少一个音频对象而生成所述自适应音频内容。

【技术特征摘要】
1. 一种用于生成自适应音频内容的方法，所述方法包括：从基于声道的源音频内容中提取至少一个音频对象；以及至少部分地基于所述至少一个音频对象而生成所述自适应音频内容。2. 根据权利要求1所述的方法，其中提取所述至少一个音频对象包括：将所述源音频内容分解为指向性音频信号和发散性音频信号；以及从所述指向性音频信号中提取所述至少一个音频对象。3. 根据权利要求2所述的方法，其中分解所述源音频信号内容包括：对所述源音频内容执行信号分量分解；以及通过分析分解出的信号分量来计算发散概率。4. 根据权利要求1到3中任一项所述的方法，其中提取所述至少一个音频对象包括：对于所述源音频内容中的多个帧中的每一个帧，通过频谱合成来识别和聚集存在相同音频对象的声道；以及跨所述多个帧对识别和聚集的所述声道执行时间合成，以便沿时间合成所述至少一个音频对象。5. 根据权利要求4所述的方法，其中识别和聚集所述存在相同音频对象的声道包括：对于所述多个帧中的每一个帧，将频率范围划分为多个子频带；以及基于所述多个子频带之间的包络和频谱形状中至少一个的相似性，来识别和聚集所述存在相同音频对象的声道。6. 根据权利要求1到5中任一项所述的方法，还包括：从所述源音频内容生成基于声道的静态环境声，并且其中生成所述自适应音频内容包括基于所述至少一个音频对象和所述静态环境声来生成所述自适应音频内容。7. 根据权利要求6所述的方法，其中生成所述静态环境声包括：将所述源音频内容分解为指向性音频信号和发散性音频信号；以及从所述发散性音频信号生成所述静态环境声。8. 根据权利要求6到7中任一项所述的方法，其中生成所述静态环境声包括：通过对所述源音频内容执行环境上混音来创建至少一个高度声道；以及从所述源音频内容的声道和所述至少一个高度声道生成所述静态环境声。9. 根据权利要求1到8中任一项所述的方法，还包括：估计与所述自适应音频内容相关联的元数据。10. 根据权利要求9所述的方法，其中生成所述自适应音频内容包括编辑与所述自适应音频内容相关联的所述元数据。11. 根据权利要求10所述的方法，其中编辑所述元数据包括控制所述自适应音频内容的增益。12. 根据权利要求1到11中任一项所述的方法，其中生成所述自适应音频内容包括：对所述至少一个音频对象执行后处理，所述后处理包括以下至少一个：分离所述至少一个音频对象中的至少部分重叠的音频对象；修改与所述至少一个音频对象相关联的属性；以及交互地操控所述至少一个音频对象。13. -种用于生成自适应音频内容的系统，所述系统包括：音频对象提取器，被配置为从基于声道的源音频内容中提取至少一个音频对象；以及自适应音频生成器，被配置为至少部分地基于所述至少一个音频对象生成所述自适应音频内容。14. 根据权利要求13所述的系统，还包括：信号分解器，被配置为将所述源音频内容分解为指...

【专利技术属性】
技术研发人员：王珺，芦烈，胡明清，D·J·布里巴特，N·R·辛格斯，
申请(专利权)人：杜比实验室特许公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人