用于回放多个音频源的双声道渲染装置和方法制造方法及图纸

技术编号：21179001 阅读：32 留言：0更新日期：2019-05-22 12:47

本公开涉及用于多个移动音频源的快速双声道渲染的设计。本公开采用可以是基于对象的、基于信道的或两者的混合的音频源信号、相关联的元数据、用户头部跟踪数据以及双声道房间脉冲响应(BRIR)数据库来生成耳机回放信号。本公开应用逐帧双声道渲染模块，其采用BRIR的参数化分量来渲染移动源。另外，本公开在渲染过程中应用分层源聚类和缩混以降低计算复杂度。

Dual-channel rendering device and method for playback of multiple audio sources

The present disclosure relates to the design of fast dual-channel rendering for multiple mobile audio sources. The present disclosure generates headphone playback signals using an object-based, channel-based or hybrid audio source signal, associated metadata, user head tracking data, and a dual-channel room impulse response (BRIR) database. The present disclosure applies a frame-by-frame dual-channel rendering module, which uses the parametric components of BRIR to render mobile sources. In addition, the present disclosure applies hierarchical source clustering and shrunken mixing in the rendering process to reduce computational complexity.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于回放多个音频源的双声道渲染装置和方法
本公开涉及用于耳机回放(playback)的数字音频信号的有效渲染(render)。
技术介绍
空间音频是指沉浸式音频再现系统，允许听众感知高度的音频环绕。这种环绕感包括在方向和距离上对音频源的空间位置的感觉，使得听众将声音场景感知为好像他们处于自然声音环境中。通常有三种用于空间音频再现系统的录音格式。格式取决于音频内容制作站点使用的录制和混音方法。第一种格式是最熟知的基于信道的，其中音频信号的每个信道被指派为在再现站点的特定扬声器上回放。第二种格式称为基于对象的，其中可以由多个虚拟源(也称为对象)描述空间声音场景。每个音频对象可以由具有相关联的元数据的声音波形表示。第三种格式称为基于环绕声(Ambisonic)，其可以视为表示声场的球形扩展的系数信号。随着诸如移动电话、平板电脑等个人便携式设备的激增以及虚拟/增强现实的新兴应用，通过耳机渲染沉浸式空间音频变得越来越必要和有吸引力。双声道化是将输入的空间音频信号(例如，基于信道的信号、基于对象的信号或基于环绕声的信号)转换为耳机回放信号的过程。实质上，实际环境中的自然声音场景是由一对人耳感知的。这推断出，如果这些回放信号接近人类在自然环境中感知的声音，则耳机回放信号应该能够将空间声场渲染得尽可能地自然。双声道渲染的典型示例记录在MPEG-H3D音频标准[参见NPL1]中。图1示出了将基于信道的和基于对象的输入信号渲染到MPEG-H3D音频标准中的双声道馈送的流程图。给定虚拟扬声器布局配置(例如，5.1、7.1或22.2)，基于信道的信号1...L1和基于对象的信号1...

【技术保护点】
1.一种在给定多个音频源信号的情况下利用相关联的元数据和双声道房间脉冲响应BRIR数据库生成双声道耳机回放信号的方法，其中所述音频源信号能够是基于信道的、基于对象的、或者是两种信号的混合，所述方法包括：计算相对于用户头部的位置和面向方向的、所述音频源的瞬时相对于头部位置；根据所述音频源的所述瞬时相对于头部位置，以分层方式对所述源信号进行分组；对要用于渲染的BRIR进行参数化；将要渲染的每个源信号划分为多个块和帧；对标识有分层分组结果的、经参数化的BRIR序列求平均；以及对标识有所述分层分组结果的、经划分的源信号进行缩混。

【技术特征摘要】
【国外来华专利技术】2016.10.28 JP 2016-2118031.一种在给定多个音频源信号的情况下利用相关联的元数据和双声道房间脉冲响应BRIR数据库生成双声道耳机回放信号的方法，其中所述音频源信号能够是基于信道的、基于对象的、或者是两种信号的混合，所述方法包括：计算相对于用户头部的位置和面向方向的、所述音频源的瞬时相对于头部位置；根据所述音频源的所述瞬时相对于头部位置，以分层方式对所述源信号进行分组；对要用于渲染的BRIR进行参数化；将要渲染的每个源信号划分为多个块和帧；对标识有分层分组结果的、经参数化的BRIR序列求平均；以及对标识有所述分层分组结果的、经划分的源信号进行缩混。2.根据权利要求1所述的方法，其中，在给定源元数据和用户头部跟踪数据的情况下，对于所述源信号的每个时间帧/块，立即计算所述相对于头部的源位置。3.根据权利要求1所述的方法，其中，在给定对于每个帧所计算的瞬时相对的源位置的情况下，以具有不同分组分辨率的多个层来分...

【专利技术属性】
技术研发人员：江原宏幸，吴恺，SH尼奥，
申请(专利权)人：松下电器美国知识产权公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人