用于回放更高阶立体混响音频信号的方法和设备技术

技术编号：9174183 阅读：230 留言：0更新日期：2013-09-19 23:30

立体混响表示的优势在于声场的再现可以单独地适配于近乎任何给定的扬声器位置排列。虽然促进空间音频的灵活通用的表示非常独立于扬声器设置，与不同尺寸屏幕上的音频回放的组合可以变得分散，因为空间声音回放未被相应地适配。本发明专利技术允许面向空间声场音频的回放通过应用在EP11305845.7中公开的空间弯曲处理对其链接的可见对象的系统性适配。在内容再现中使用的屏幕的基准尺寸（或从基准聆听位置的观看角度）被编码并作为元数据与内容一起被传输，或者解码器知道目标屏幕相对于固定基准屏幕尺寸的实际尺寸。解码器以如下方式弯曲声场：根据目标屏幕的尺寸和基准屏幕的尺寸的比率，压缩或拉伸屏幕方向上的全部声音对象。

全部详细技术资料下载

【技术实现步骤摘要】
用于回放更高阶立体混响音频信号的方法和设备
本专利技术涉及用于回放指定给视频信号的更高阶立体混响（Higher-OrderAmbisonics）音频信号的方法和设备，该视频信号是对原始和不同的屏幕而生成的但是将被呈现在当前屏幕上。
技术介绍
一种存储和处理球形麦克风阵列的三维声场的方式是更高阶立体混响（HOA）表示。立体混响使用标准正交球形函数用于描述位于原点或空间中基准点（也称为蜜点）及其附近的区域中的声场。如此描述的精度通过立体混响阶N来确定，其中，有限数的立体混响系数描述声场。球形阵列的最大立体混响阶通过麦克风精盒（microphonecapsule）的数量来限制，所述数量必须等于或大于立体混响系数的数量O=(N+1)2。这样的立体混响表示的优势在于声场的再现可以单独地适配于近乎任何给定扬声器位置排列。
技术实现思路
虽然促进空间音频的灵活通用的表示非常独立于扬声器设置，与不同尺寸屏幕上的音频回放的组合可以变得分散，因为空间声音回放未被相应地适配。立体和环绕声基于离散扬声器声道，并且涉及视频显示关于在哪里放置扬声器存在非常特定的规则。例如，在影院环境下，在屏幕的中央放置中央扬声器，而在屏幕的左侧和右侧放置左扬声器和右扬声器。因而，扬声器设置固有地随屏幕变动：对于小屏幕，扬声器彼此更接近，而对于巨屏，它们则远离。这样的优势是混音可以以非常连贯的方式完成：有关屏幕上的可视对象的声音对象可以可靠地放置在左声道、中央声道和右声道。因此，听众的体验在混音级上匹配声音艺术家的创造性意图。但是这样的优势同时也是基于声道系统的劣势：对于改变扬声器设置，灵活度非常有限。该...
用于回放更高阶立体混响音频信号的方法和设备

【技术保护点】
一种用于回放指定给视频信号的原始更高阶立体混响音频信号的方法，上述视频信号是对原始和不同的屏幕而生成的但是将被呈现在当前屏幕上，所述方法包括如下步骤：?解码所述更高阶立体混响音频信号以提供解码的音频信号；?接收或建立从所述原始屏幕和所述当前屏幕在它们的宽度并且可能在它们的高度并且可能在它们的弯曲度之间的差异得出的再现适配信息；?通过在空间域中弯曲它们来适配所述解码的音频信号，其中，所述再现适配信息控制所述弯曲，从而对于当前屏幕的观众和所述适配的解码的音频信号的听众，由所述适配的解码的音频信号表示的至少一个音频对象的感知位置匹配所述屏幕上的相关视频对象的感知位置；?对扬声器重现和输出适配的解码的音频信号。

【技术特征摘要】
2012.03.06 EP 12305271.41.一种用于回放被记为更高阶立体混响HOA并且被指定给视频信号的原始更高阶立体混响音频信号的方法，所述视频信号将被呈现在当前屏幕上但是是对原始屏幕生成的，该原始屏幕不同于该当前屏幕，所述方法包括如下步骤：-解码(83，93)更高阶立体混响信号的输入更高阶立体混响系数的输入向量Ain，以便使用更高阶立体混响模式矩阵ψ1的逆通过计算来提供针对规则布置的扬声器位置的空间域中的解码的音频信号sin；-接收或建立从所述原始屏幕和所述当前屏幕在它们的宽度并且可能在它们的高度并且可能在它们的弯曲度之间的差异得出的再现适配信息(90)；-通过计算Aout＝ψ2sin在空间域中将所述解码(93)的音频信号弯曲(94)并编码为适配的输出更高阶立体混响系数的输出向量Aout，来适配所述解码(93)的音频信号，其中根据弯曲函数相对于模式矩阵ψ1修改模式矩阵ψ2的模式向量，通过该弯曲函数，所述原始屏幕的原始扬声器位置的角度在更高阶立体混响系数输出向量Aout中被映射为当前屏幕的目标扬声器位置的目标角，并且原始扬声器位置的剩余的角被相应地移位，并且其中所述再现适配信息(90)控制所述弯曲函数；-对扬声器重现和输出(95)适配的更高阶立体混响信号(91)，其中所述重现包括更高阶立体混响解码。2.如权利要求1的方法，其中，所述更高阶立体混响音频信号包含指定给对应视频对象的多个音频对象，并且其中，对于所述当前屏幕观众和听众，所述音频对象的角度或距离将分别不同于所述原始屏幕上的所述视频对象的角度或距离。3.如权利要求1或2的方法，其中，携带所述原始更高阶立体混响信号的位流也包括所述再现适配信息(90)。4.如权利要求1或2的方法，其中，除了所述弯曲之外，执行通过增益函数(g(φ))进行的加权，从而获得每个孔径角的结果的同类声音幅度。5.如权利要求1或2的方法，其中，解码(93)更高阶立体混响信号的两个完整系数集合，第一音频信号表示与可视对象相关的对象，第二音频信号表示独立或环境声音，其中，仅第一解码的音频信号经历通过弯曲的对实际屏幕布局的适配而第二解码的音频信号未被处理，且其中，在回放之前，所适配的第一解码的音频信号和未适配的第二解码的音频信号被组合。6.如权利要求5的方法，其中，所述第一和第二音频信号的更高阶立体混响阶不同。7.如权利要求1或2的方法，其中，动...

【专利技术属性】
技术研发人员：P贾克斯，J贝姆，WG雷德曼，
申请(专利权)人：汤姆逊许可公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人