音频处理方法和音频处理设备技术

技术编号:15127930 阅读:163 留言:0更新日期:2017-04-10 06:49
诸如上混器的音频处理系统能够分离N个输入音频信号的散射部分和非散射部分。上混器能够检测瞬时音频信号条件的情况。在瞬时音频信号条件的情况期间,上混器能够向输出M个音频信号的散射信号扩展处理添加信号自适应控制。上混器可以随时间改变散射信号扩展处理,使得在瞬时音频信号条件的情况期间,音频信号的散射部分可以基本上仅被分布至空间上靠近输入通道的输出通道。在非瞬时音频信号条件的情况期间,音频信号的散射部分可以以基本均匀的方式分布。

【技术实现步骤摘要】
【国外来华专利技术】相关申请的交叉引用本申请要求2013年10月3日提交的美国临时专利申请号61/886,554和2013年11月22日提交的美国临时专利申请号61/907,890的优先权,通过引用将这两个专利申请中的每个专利申请的全部内容并入本文。
本公开内容涉及处理音频数据。特别地,本公开内容涉及在上混(upmixing)处理期间处理包括散射音频信号和定向音频信号二者的音频数据。
技术介绍
被称为上混的处理包括从较小数量N个音频信号通道来获得某个数量M个音频信号通道。能够上混的一些声音处理设备(其在本文中可以被称作“上混器(upmixer)”)可以,例如,能够基于2个输入音频通道输出3,5,7,9或更多个音频通道。一些上混器可能能够分析两个输入信号通道的相位和幅度,以确定其所代表的声场意图如何向听者传达定向印象。这样的上混设备的一个示例是Gundry在“ANewActiveMatrixDecoderforSurroundSound”(第19届AES大会,2001年5月)中描述的ProII解码器。输入音频信号可以包括散射音频数据和/或定向音频数据。就定向音频数据而言,上混器应能够产生用于多个通道的输出信号,以向听者提供具有表观位置(apparentlocation)和/或方向的一个或多个听觉成分的感觉。某些音频信号(如与枪声对应的音频信号)可以是非常定向的。散射音频信号(如与风、雨、环境噪声等对应的音频信号)可以具有很少的或没有明显方向性。当处理还包括散射音频信号的音频数据时,应向听者提供与散射音频信号对应的包围(enveloping)散射声场的感知。
技术实现思路
提供了一种用于处理散射音频信号的改进方法。一些实施方式涉及从N个音频信号得出M个散射音频信号以呈现散射声场的方法,其中,M大于N且大于2。N个音频信号中的每个音频信号对应于空间位置。方法可以涉及接收N个音频信号、得出N个音频信号的散射部分、以及检测瞬时音频信号条件的情况。方法可以涉及处理N个音频信号的散射部分以得出M个散射音频信号。在瞬时音频信号条件的情况期间,处理可以涉及:将N个音频信号的散射部分以较大的比例分布至M个散射音频信号中的、与相对较靠近N个音频信号的空间位置的空间位置对应的一个或多个散射音频信号,以及以较小的比例分布至M个散射音频信号中的、与相对较远离N个音频信号的空间位置的空间位置对应的一个或多个散射音频信号。方法可以涉及检测非瞬时音频信号条件的情况。在非瞬时音频信号条件的情况期间,处理可以涉及:将N个音频信号的散射部分以基本均匀的方式分布至M个散射音频信号。处理可以涉及:向N个音频信号的散射部分应用混合矩阵,以得出M个散射音频信号。混合矩阵可以是可变分布矩阵。可变分布矩阵可以从更适于在非瞬时音频信号条件期间使用的非瞬时矩阵和更适于在瞬时音频信号条件期间使用的瞬时矩阵来得出。在一些实现方式中,瞬时矩阵可以从非瞬时矩阵得出。瞬时矩阵的每个元素可以表示相应非瞬时矩阵元素的比例缩放。在一些实现方式中,比例缩放可以根据输入通道位置和输出通道位置之间的关系而定。方法可以涉及确定瞬时控制信号值。在一些实现方式中,可以通过至少部分地基于瞬时控制信号值在瞬时矩阵和非瞬时矩阵之间进行内插来得出可变分布矩阵。瞬时控制信号值可以是时变的。在一些实现方式中,瞬时控制信号值可以以连续的方式从最小值到最大值变化。替选地,瞬时控制信号值可以以一系列离散值从最小值到最大值变化。在一些实现方式中,确定可变分布矩阵可以涉及:根据瞬时控制信号值来计算可变分布矩阵。然而,确定可变分布矩阵可以涉及:从存储装置检索所存储的可变分布矩阵。方法可以涉及:响应于N个音频信号得出瞬时控制信号值。方法可以涉及将N个音频信号中的每个音频信号变换至B个频带;以及针对B个频带中的每个频带单独地执行得出、检测以及处理。方法可以涉及:对N个音频信号的非散射部分进行平移,以形成M个非散射音频信号;以及将M个散射音频信号与M个非散射音频信号进行组合,以形成M个输出音频信号。在一些实现方式中,方法可以涉及:从N个音频信号的散射部分得出K个中间信号,其中,K大于或等于一,并且小于或等于M-N。每个中间音频信号可以与N个音频信号的散射部分心理声学去相关。如果K大于一,则每个中间音频信号可以与所有其他中间音频信号心理声学去相关。在一些实现方式中,得出K个中间信号可以涉及去相关处理,所述去相关处理可以包括以下中的一个或多个:延迟、全通滤波器、伪随机滤波器或混响算法。可以响应于K个中间信号以及N个散射信号而得出M个散射音频信号。本公开的一些方面可以以包括接口系统和逻辑系统的设备来实现。逻辑系统可以包括一个或多个处理器,如通用单芯片或多芯片处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其他可编程逻辑器件、分立门或晶体管逻辑、分立硬件部件和/或其组合。接口系统可以包括用户接口或网络接口中的至少一个。设备可以包括存储器系统。接口系统包括逻辑系统和存储器系统之间的至少一个接口。逻辑系统可以经由接口系统接收N个输入音频信号。N个音频信号中的每个音频信号对应于空间位置。逻辑系统可以得出N个音频信号的散射部分,以及检测瞬时音频信号条件的情况。逻辑系统可以处理N个音频信号的散射部分以得出M个散射音频信号,其中,M大于N并且大于2。在瞬时音频信号条件的情况期间,处理可以涉及:将N个音频信号的散射部分以较大的比例分布至M个散射音频信号中的、与相对较靠近N个音频信号的空间位置的空间位置对应的一个或多个散射音频信号,并且以较小的比例分布至M个散射音频信号中的、与相对较远离N个音频信号的空间位置的空间位置对应的一个或多个散射音频信号。逻辑系统可以检测非瞬时音频信号条件的情况。在非瞬时音频信号条件的情况期间,处理可以涉及:将N个音频信号的散射部分以基本均匀的方式分布至M个散射音频信号。处理可以涉及:向N个音频信号的散射部分应用混合矩阵,以得出M个散射音频信号。混合矩阵可以是可变分布矩阵。可变分布矩阵可以从更适于在非瞬时音频信号条件期间使用的非瞬时矩阵和更适于在瞬时音频信号条件期间使用的瞬时矩阵而得出。在一些实现方式中,瞬时矩阵从非瞬时矩阵得出。瞬时矩阵的每个元素可以表示相应非瞬时矩阵元素的比例缩放。在一些实现方式中,比例缩放可以根据输入通道位置和输出通<本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/62/CN105612767.html" title="音频处理方法和音频处理设备原文来自X技术">音频处理方法和音频处理设备</a>

【技术保护点】
一种用于从N个音频信号得出M个散射音频信号以呈现散射声场的方法,其中M大于N并且大于2,其中所述方法包括:接收所述N个音频信号,其中所述N个音频信号中的每个音频信号对应于空间位置;得出所述N个音频信号的散射部分;检测瞬时音频信号条件的情况;以及处理所述N个音频信号的散射部分以得出所述M个散射音频信号,其中,在瞬时音频信号条件的情况期间,所述处理包括:将所述N个音频信号的散射部分以较大的比例分布至所述M个散射音频信号中的、与相对较靠近所述N个音频信号的空间位置的空间位置对应的一个或多个散射音频信号,并且以较小的比例分布至所述M个散射音频信号中的、与相对较远离所述N个音频信号的空间位置的空间位置对应的一个或多个散射音频信号。

【技术特征摘要】
【国外来华专利技术】2013.10.03 US 61/886,554;2013.11.22 US 61/907,8901.一种用于从N个音频信号得出M个散射音频信号以呈现散射声场
的方法,其中M大于N并且大于2,其中所述方法包括:
接收所述N个音频信号,其中所述N个音频信号中的每个音频信号
对应于空间位置;
得出所述N个音频信号的散射部分;
检测瞬时音频信号条件的情况;以及
处理所述N个音频信号的散射部分以得出所述M个散射音频信号,
其中,在瞬时音频信号条件的情况期间,所述处理包括:将所述N个音
频信号的散射部分以较大的比例分布至所述M个散射音频信号中的、与
相对较靠近所述N个音频信号的空间位置的空间位置对应的一个或多个
散射音频信号,并且以较小的比例分布至所述M个散射音频信号中的、
与相对较远离所述N个音频信号的空间位置的空间位置对应的一个或多
个散射音频信号。
2.根据权利要求1所述的方法,还包括检测非瞬时音频信号条件的
情况,其中,在非瞬时音频信号条件的情况期间,所述处理涉及将所述N
个音频信号的散射部分以基本均匀的方式分布至所述M个散射音频信
号。
3.根据权利要求2所述的方法,其中,所述处理涉及:向所述N个
音频信号的散射部分应用混合矩阵,以得出所述M个散射音频信号。
4.根据权利要求3所述的方法,其中,所述混合矩阵是从更适于在
非瞬时音频信号条件期间使用的非瞬时矩阵和更适于在瞬时音频信号条
件期间使用的瞬时矩阵得出的可变分布矩阵。
5.根据权利要求4所述的方法,其中,所述瞬时矩阵是从所述非瞬
时矩阵得出的。
6.根据权利要求5所述的方法,其中,所述瞬时矩阵的每个元素表
示相应非瞬时矩阵元素的比例缩放。
7.根据权利要求6所述的方法,其中,所述比例缩放根据输入通道
位置和输出通道位置之间的关系而定。
8.根据权利要求4所述的方法,还包括确定瞬时控制信号值,其中,

\t通过至少部分地基于所述瞬时控制信号值在所述瞬时矩阵和所述非瞬时
矩阵之间进行内插来得出所述可变分布矩阵。
9.根据权利要求8所述的方法,其中,所述瞬时控制信号值是时变
的。
10.根据权利要求8所述的方法,其中,所述瞬时控制信号值能够以
连续的方式从最小值到最大值变化。
11.根据权利要求8所述的方法,其中,所述瞬时控制信号值能够以
一系列离散值从最小值到最大值变化。
12.根据权利要求8至11中任一项所述的方法,其中,确定所述可
变分布矩阵涉及:根据所述瞬时控制信号值,计算所述可变分布矩阵。
13.根据权利要求8至11中任一项所述的方法,其中,确定所述可
变分布矩阵涉及:从存储装置检索所存储的可变分布矩阵。
14.根据权利要求8至13中任一项所述的方法,还包括:
响应于所述N个音频信号得出所述瞬时控制信号值。
15.根据权利要求1至14中任一项所述的方法,还包括:
将所述N个音频信号中的每个音频信号变换至B个频带;以及
针对所述B频带中的每个频带单独地执行得出、检测以及处理。
16.根据权利要求1至15中任一项所述的方法,还包括:
对所述N个音频信号的非散射部分进行平移,以形成M个非散射音
频信号;以及
将所述M个散射音频信号与所述M个非散射音频信号进行组合以形
成M个输出音频信号。
17.根据权利要求1至16中任一项所述的方法,其中,所述方法还
包括:
从所述N个音频信号的散射部分得出K个中间信号,使得每个中间
音频信号与所述N个音频信号的散射部分心理声学去相关,并且如果K
大于一,则使得每个中间音频信号与所有其他中间音频信号心理声学去相
关,其中,K大于或等于一,并且小于或等于M-N。
18.根据权利要求17所述的方法,其中,得出所述K个中间信号涉
及去相关处理,所述去相关处理包括延迟、全通滤波器、伪随机滤波器或

\t混响算法中的一个或多个。
19.根据权利要求17或18所述的方法,其中,响应于所述K个中间
信号以及所述N个散射信号,得出所述M个散射音频信号。
20.一种设备,包括:
接口系统;以及
逻辑系统,所述逻辑系统能够:
经由所述接口系统接收N个输入音频信号,其中所述N个音频
信号中的每个音频信号对应于空间位置;
得出所述N个音频信号的散射部分;
检测瞬时音频信号条件的情况;以及
处理所述N个音频信号的散射部分以得出所述M个散射音频信
号,其中,M大于N并且大于2,并且其中,在瞬时音频信号条件的情
况期间,所述处理包括:将所述N个音频信号的散射部分以较大的比例
分布至所述M个散射音频信号中的、与相对较靠近所述N个音频信号的
空间位置的空间位置对应的一个或多个散射音频信号,并且以较小的比例
分布至所述M个散射音频信号中的、与相对较远离所述N个音频信号的
空间位置的空间位置对应的一个或多个散射音频信号。
21.根据权利要求20所述的设备,其中,所述逻辑系统能够检测非
瞬时音频信号条件的情况,以及其中,在非瞬时音频信号条件的情况期间,
所...

【专利技术属性】
技术研发人员:艾伦·J·泽费尔特马克·S·文顿C·菲利普·布朗
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1