元数据保留的音频对象聚类制造技术

技术编号:28849064 阅读:29 留言:0更新日期:2021-06-11 23:51
本发明专利技术的实施例涉及元数据保留的音频对象聚类。公开了一种用于元数据保留的音频对象聚类的方法。该方法包括基于与多个音频对象相关联的元数据中的待保留信息,将多个音频对象分类到多个类别中。该方法还包括将预定数目的簇指派给类别,以及根据指派来将这些类别中的每个类别中的音频对象分配到簇中的至少一个簇。还公开了相应的系统和计算机程序产品。

【技术实现步骤摘要】
元数据保留的音频对象聚类本申请是申请日为2014年12月11日、申请号为201410765578.6,专利技术名称为“元数据保留的音频对象聚类”的专利技术专利申请的分案申请。
本专利技术总体上涉及音频内容处理,更具体地,涉及允许元数据被保留的音频对象聚类的方法和系统。
技术介绍
基于对象的音频的出现显著地增加了音频数据量以及在高端回放系统内渲染该数据的复杂度。例如,影院声轨可以包括许多不同的声音元素,这些声音元素对应于屏幕上的图像、对白、噪声和音效,该音效源自屏幕上的不同位置,并且这些声轨还与背景音乐和环境效果相结合以创建整体的听觉体验。精确回放要求声音应该以如下方式再现:该方式就声源位置、强度、运动和深度而言尽可能接近地对应于屏幕上所显示的内容。基于对象的音频表现出在传统的基于通道的音频系统上的显著改进,该基于通道的音频系统以扬声器馈送(speakerfeeds)的形式发送音频内容至收听环境中的单个扬声器,并且因此就特定音频对象的空间回放而言是相对受限的。数字影院的引入和三维(“3D”)内容的发展创建了新的声音标准,诸如音频的本文档来自技高网...

【技术保护点】
1.一种用于对编码音频信号进行解码的方法,包括:/n接收所述编码音频信号并且从所述编码音频信号确定至少一个音频对象;/n基于与所述至少一个音频对象相关联的元数据中待保留的渲染模式信息,将所述至少一个音频对象分类到至少一个类别,其中所述元数据包括与所述音频对象的重要度相关的信息;/n针对每个类别,基于所述元数据确定至少一个簇;以及/n基于针对所述至少一个簇的与所述渲染模式相关联的所述元数据,渲染所述至少一个音频对象。/n

【技术特征摘要】
1.一种用于对编码音频信号进行解码的方法,包括:
接收所述编码音频信号并且从所述编码音频信号确定至少一个音频对象;
基于与所述至少一个音频对象相关联的元数据中待保留的渲染模式信息,将所述至少一个音频对象分类到至少一个类别,其中所述元数据包括与所述音频对象的重要度相关的信息;
针对每个类别,基于所述元数据确定至少一个簇;以及
基于针对所述至少一个簇的与所述渲染模式相关联的所述元数据,渲染所述至少一个音频对象。


2.一种用于对编码音频信号进行解码的系统,包括:
接收器...

【专利技术属性】
技术研发人员:D·J·布里巴尔特陈连武芦烈N·R·齐英戈斯
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1