HOA内容的显示屏相关调适制造技术

技术编号:15531069 阅读:43 留言:0更新日期:2017-06-04 17:55
本发明专利技术描述用于译码高阶立体混响音频数据的技术,所述高阶立体混响音频数据包括与具有大于一的阶数的球面谐波基函数对应的至少一个高阶立体混响HOA系数。本发明专利技术描述用于调整HOA声场以在混合音频/视频再现情形中潜在改善声波元素对可视分量的空间对准的技术。在一个实例中,用于呈现HOA音频信号的装置包含一或多个处理器,所述一或多个处理器被配置成基于参考显示屏的一或多个视场FOV参数和观看窗的一或多个FOV参数在一或多个扬声器上呈现所述HOA音频信号。

HOA content display related adjustments

The invention describes a method for decoding high order stereo reverberation audio data technology, including with the spherical harmonics function corresponds to the order of a number larger than the high order stereo reverberation audio data of at least one of the higher order HOA stereo reverberation coefficient. Techniques for adjusting the HOA sound field to potentially improve spatial alignment of acoustic elements to visual components in a mixed audio / video reproduction case are described. In one instance, apparatus for presenting HOA audio signal contains one or more processors, the one or more processor configured to display one or more reference field based on FOV parameter and viewing window of one or more FOV parameters in one or more speakers on the presentation of the HOA audio signal.

【技术实现步骤摘要】
【国外来华专利技术】HOA内容的显示屏相关调适本申请主张在2014年10月10日提交的第62/062,761号美国临时专利申请的权益,所述临时专利申请的全部内容以引用的方式并入本文中。
本专利技术涉及音频数据,并且更具体地说,涉及高阶立体混响音频数据的编码。
技术介绍
高阶立体混响(HOA)信号(往往由多个球面谐波系数(SHC)或其它层级元素表示)为声场的三维表示。所述HOA或SHC表示可以以与用于重放从SHC信号呈现的多声道音频信号的本地扬声器几何布置无关的方式表示所述声场。所述SHC信号也可促进向后兼容性,因为所述SHC信号可被呈现为众所周知的且被广泛采用的多声道格式(例如,5.1音频声道格式或7.1音频声道格式)。因此,所述SHC表示可实现也适应向后兼容性的对声场的更好表示。
技术实现思路
一般来说,描述用于编码高阶立体混响音频数据的技术。高阶立体混响音频数据可包括与具有大于一的阶数的球面谐波基函数对应的至少一个高阶立体混响(HOA)系数。本专利技术描述用于调整HOA声场以在混合音频/视频再现情形中潜在改善声波元素与可视分量的空间对准的技术。在一个实例中,用于呈现高阶立体混响(HOA)音频信号的装置包括一或多个处理器,其被配置成基于参考显示屏的一或多个视场(FOV)参数和观看窗的一或多个FOV参数在一或多个扬声器上呈现所述HOA音频信号。在另一实例中,呈现高阶立体混响(HOA)音频信号的方法包括基于参考显示屏的一或多个视场(FOV)参数和观看窗的一或多个FOV参数在一或多个扬声器上呈现所述HOA音频信号。在另一实例中,用于呈现高阶立体混响(HOA)音频信号的设备包括用于接收所述HOA音频信号的装置,和用于基于参考显示屏的一或多个视场(FOV)参数和观看窗的一或多个FOV参数在一或多个扬声器上呈现所述HOA音频信号的装置。在另一实例中,计算机可读存储媒体存储指令,在由一或多个处理器执行时,所述指令致使所述一或多个处理器呈现高阶立体混响(HOA)音频信号,包含基于参考显示屏的一或多个视场(FOV)参数和观看窗的一或多个FOV参数在一或多个扬声器上呈现所述HOA音频信号。在附图和以下描述中阐述所述技术的一或多个方面的细节。所述技术的其它特征、目标和优点将从描述和附图以及权利要求而显而易见。附图说明图1为说明具有各种阶数和子阶数的球面谐波基函数的简图。图2为说明可执行本专利技术中所描述的技术的各种方面的系统的简图。图3为更详细说明可执行本专利技术中所描述的技术的各种方面的图2的实例中所示的音频编码装置的一个实例的框图。图4为更详细说明图2的所述音频解码装置的框图。图5为说明音频编码装置执行本专利技术中所描述的基于向量的合成技术的各种方面中的示范性操作的流程图。图6为说明音频解码装置在执行本专利技术中所描述的所述技术的各种方面中的示范性操作的流程图。图7A示出可用于基于参考显示屏大小和观看窗大小将初始方位角映射到修改后的方位角的实例映射函数。图7B示出可用于基于参考显示屏大小和观看窗大小将初始仰角映射到修改后的仰角的实例映射函数。图8示出作为第一实例的参考显示屏和观看窗的效果的所述声场的所希望的显示屏相关扩展效果的向量场。图9A和9B示出计算出的HOA效果矩阵的实例。图10示出效果矩阵如何可被预呈现并施加于扩音器呈现矩阵的实例。图11示出如果所述效果矩阵可产生高阶内容(例如,6阶),则在该阶中的呈现矩阵如何可被乘法运算以预计算在所述初始阶(在这里,为3阶)中的所述最终呈现矩阵的实例。图12A示出可用于基于参考显示屏大小和观看窗大小将初始方位角映射到修改后的方位角的实例映射函数。图12B示出可用于基于参考显示屏大小和观看窗大小将初始仰角映射到修改后的仰角的实例映射函数。图12C示出计算出的HOA效果矩阵。图13示出用于作为参考显示屏和观看窗的效果的所述声场的所希望的显示屏相关扩展效果的向量场。图14A示出可用于基于参考显示屏大小和观看窗大小将初始方位角映射到修改后的方位角的实例映射函数。图14B示出可用于基于参考显示屏大小和观看窗大小将初始仰角映射到修改后的仰角的实例映射函数。图14C示出计算出的HOA效果矩阵。图15示出用于作为参考显示屏和观看窗的效果的所述声场的所希望的显示屏相关扩展效果的向量场。图16A示出可用于基于参考显示屏大小和观看窗大小将初始方位角映射到修改后的方位角的实例映射函数。图16B示出可用于基于参考显示屏大小和观看窗大小将初始仰角映射到修改后的仰角的实例映射函数。图16C示出计算出的HOA效果矩阵。图17示出用于作为参考显示屏和观看窗的效果的所述声场的所希望的显示屏相关扩展效果的向量场。图18A示出可用于基于参考显示屏大小和观看窗大小将初始方位角映射到修改后的方位角的实例映射函数。图18B示出可用于基于参考显示屏大小和观看窗大小将初始仰角映射到修改后的仰角的实例映射函数。图18C示出计算出的HOA效果矩阵。图19示出用于作为参考显示屏和观看窗的效果的所述声场的所希望的显示屏相关扩展效果的向量场。图20A-20C为说明被配置成实现本专利技术的所述技术的音频呈现装置的实例实施方案的框图。图21为说明音频解码装置在执行本专利技术中所描述的基于显示屏的调适技术中的实例操作的流程图。具体实施方式环绕声的演进现今已使得许多输出格式可用于娱乐。此些消费型环绕声格式的实例大部分为基于“声道”的,这是因为其以某些几何坐标隐含地指定到扩音器的馈入。消费型环绕声格式包含流行的5.1格式(其包含以下六个声道:左前(FL)、右前(FR)、中心或前中心、左后或左环绕、右后或右环绕,以及低频效果(LFE))、发展中的7.1格式、包含高度扬声器的各种格式,例如7.1.4格式和22.2格式(例如,用于与超高清电视标准一起使用)。非消费型格式可以跨越任何数量的扬声器(成对称和非对称几何布置),其往往被称为“环绕阵列”。此阵列的一个实例包含被安置在截角二十面体的拐角上的坐标上的32个扩音器。至未来MPEG编码器的输入任选地为三个可能格式中的一者:(i)传统的基于声道的音频(如上文所论述),其意图通过在预先指定的位置的扩音器进行播放;(ii)基于对象的音频,其涉及具有包含其位置坐标(除了其它信息之外)的相关联元数据的用于单个音频对象的离散脉冲代码调制(PCM)数据;以及(iii)基于场景的音频,其涉及使用球面谐波基函数的系数(也称为“球面谐波系数”或SHC、“高阶立体混响”或HOA和“HOA系数”)来表示声场。所述未来MPEG编码器可在由国际标准化组织/国际电工委员会(ISO)/(IEC)JTC1/SC29/WG11/N13411在2013年1月在瑞士日内瓦发布的标题为“对3D音频的建议的要求(CallforProposalsfor3DAudio)”的文献中更详细地描述,并且该文献可在网址http://mpeg.chiariglione.org/sites/default/files/files/standards/parts/docs/w13411.zip获得。在市场中存在各种基于“环绕声”声道的格式。它们的范围(例如)从所述5.1家庭影院系统(其在使起居室享有立体声方面已获得最大成功)到由NHK(日本广播协会或日本广播公司)所开发的22.2系统。内容创建者(例如本文档来自技高网...
HOA内容的显示屏相关调适

【技术保护点】
一种用于呈现高阶立体混响HOA音频信号的装置,所述装置包括:一或多个处理器,所述一或多个处理器被配置成:基于参考显示屏的一或多个视场FOV参数和观看窗的一或多个FOV参数在一或多个扬声器上呈现所述HOA音频信号。

【技术特征摘要】
【国外来华专利技术】2014.10.10 US 62/062,761;2015.10.08 US 14/878,9481.一种用于呈现高阶立体混响HOA音频信号的装置,所述装置包括:一或多个处理器,所述一或多个处理器被配置成:基于参考显示屏的一或多个视场FOV参数和观看窗的一或多个FOV参数在一或多个扬声器上呈现所述HOA音频信号。2.根据权利要求1所述的装置,其中,为在所述一或多个扬声器上呈现所述HOA音频信号,所述一或多个处理器另外被配置成:确定用于所述经编码音频数据的呈现器;以及基于所述观看窗的所述一或多个FOV参数和所述参考显示屏的所述一或多个FOV参数修改所述呈现器。3.根据权利要求2所述的装置,其中,为确定用于所述经编码音频数据的所述呈现器,所述一或多个处理器另外被配置成基于扬声器配置确定所述呈现器。4.根据权利要求2所述的装置,其中,所述呈现器包括呈现格式和用于将所述经编码音频数据转换为再现格式的算法中的一或多者。5.根据权利要求2所述的装置,其中,为修改所述呈现器,所述一或多个处理器另外被配置成:基于所述参考显示屏的所述一或多个FOV参数和所述观看窗的所述一或多个FOV参数,确定用于修改扬声器的角度的角度映射函数;以及基于所述角度映射函数,修改所述一或多个扬声器的第一扬声器的角度以生成所述第一扬声器的经修改角度。6.根据权利要求2所述的装置,其中,所述一或多个处理器另外被配置成:响应于用户起始的缩放功能,确定缩放观看窗的一或多个FOV参数;以及基于所述参考显示屏的所述一或多个FOV参数和所述经缩放观看窗的所述一或多个FOV参数修改所述呈现器。7.根据权利要求6所述的装置,其中,为修改所述呈现器,所述一或多个处理器另外被配置成:响应于用户起始的缩放操作获得缩放因子;基于所述缩放因子和所述观看窗的所述一或多个FOV参数确定经缩放观看窗的一或多个FOV参数;基于所述经缩放观看窗的所述一或多个FOV参数和所述参考显示屏的所述一或多个FOV参数,确定用于修改扬声器的角度的角度映射函数;以及基于所述角度映射函数,修改所述一或多个扬声器的第一扬声器的角度以生成所述第一扬声器的经修改角度。8.根据权利要求6所述的装置,其中,为确定所述经缩放观看窗的所述一或多个FOV参数,所述一或多个处理器另外被配置成基于所述观看窗的一或多个方位角和所述缩放因子确定所述经缩放观看窗的一或多个方位角,并确定所述经缩放观看窗的所述一或多个FOV参数,所述一或多个处理器另外被配置成基于所述观看窗的一或多个仰角和所述缩放因子确定所述经缩放观看窗的一或多个仰角。9.根据权利要求1所述的装置,其中,用于所述参考显示屏的所述一或多个FOV参数包括用于所述参考显示屏的一或多个方位角或用于所述参考显示屏的一或多个仰角中的至少一者。10.根据权利要求1所述的装置,其中,用于所述观看窗的所述一或多个FOV参数包括用于所述观看窗的一或多个方位角或用于所述观看窗的一或多个仰角中的至少一者。11.根据权利要求1所述的装置,其中,所述一或多个处理器另外被配置成基于响应于用户起始的缩放操作所获得的缩放因子呈现所述HOA音频信号。12.根据权利要求1所述的装置,其中,用于所述参考显示屏的所述一或多个FOV参数包括所述参考显示屏的中心的位置和所述观看窗的中心的位置。13.根据权利要求12所述的装置,其中,所述一或多个处理器另外被配置成:基于所述参考显示屏的所述一或多个FOV参数确定所述参考显示屏的所述中心;以及基于所述观看窗的所述一或多个FOV参数确定所述观看窗的所述中心。14.根据权利要求12所述的装置,其中,为在所述一或多个扬声器上呈现所述HOA音频信号,所述一或多个处理器另外被配置成:确定用于...

【专利技术属性】
技术研发人员:N·G·彼得斯M·J·莫雷尔D·森
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1