多信道信号的非线性逆编码制造技术

技术编号:12661457 阅读:57 留言:0更新日期:2016-01-06 20:13
音频信号的上混或编码装置,具有:以线性逆编码方式从输入信号确定第一信道和第二信道的逆编码装置;特征在于第一信道中连接在逆编码装置后面的第一增益(50001);或者第一信道中连接在逆编码装置后面的第一增益(60001),以及第二信道中连接在逆编码装置后面的有别于第一增益(60001)的第二增益(60002)。

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
从低阶信号(信道数量较少)获取高阶信号(输出信道数量较高)是音频技术的重要部分,将其称作“上混”(Upmixing)。对于属于现有技术的心理声学编码方法来说,高带宽多信道信号的高效编码是一大挑战。尤其如日本NHK电台开发的三维系统Hamasaki22.2之类的格式需要很高的持久空间比特率(SpatialBitrates)。如果要将此类三维系统嵌入到现有的数据之中,或者对解码系统运算性能的要求使得只有很少容量可供音频数据的解码和播放使用(低计算复杂度系统,LowComputationalComplexitySystems),那么属于现有技术的心理声学编码方法就会失灵。关于心理声学编码方法尤其是关于空间编码方法的专利申请和公开说明书数不胜数,因此不必予以赘述。共同特征仍然是持久的空间比特率,必须将其传输给解码器,以便能够提取相应的多信道信号。本专利技术能为音频编码提供仅仅根据少量参数有效定义空间音频信号的扩展方法,与已知的心理声学编码方法尤其是空间编码方法相比,不必将这些参数连续添加到数据流之中。系统工作尤其不依赖于选择适合于压缩音频数据的编解码器(“基音频编码器(BaseAudioCoder)”)。此类编解码器可以改写例如有效的或者正在工作的标准,这些标准均为众所周知的MP3、AAC、HE-AAC或者USAC。以下将“逆编码”理解为利用了EP1850629、WO2009138205、WO2011009649、WO2011009650、WO2012016992或者WO2012032178专利申请书的权利要求所述的一种或多种方法或者一种或多种装置的技术过程。在此引用上述文献作为参考。所谓“逆编码”尤其是通过功能相关的增益和延迟的特殊应用而生成空间音频信号的技术过程。EP1850629、WO2009138205、WO2011009649、WO2011009650、WO2012016992或者WO2012032178中所述的系统尤其基于有效产生虚幻声源的均匀能量密度原理。尤其在EP1850629、WO2009138205、WO2011009649、WO2011009650、WO2012016992或者WO2012032178中可生成各个信道没有不同调制的空间音频信号。需要这种均匀调制来实现均匀形成虚幻声源。这例如与WO2012032178的附图6F、附图7F和附图8F针对5.1环绕声信号所示的一样也适用于多信道信号的逆编码。例如从ITU-RBS.775-1可知所谓的下混方法(参见附图21)。所涉及的是一种用来减少信道数量的加法方案,可部分减小特定信道的电平,例如减小-3dB(相当于将信号电平乘以因数或者乘以0.7071)或减小-6dB(相当于将信号电平乘以因数0.5000)。此类加法方案可以具有用于特殊信道的其它电平,也可以根据信号分析(属于现有技术的卡洛变换(Karhunen-Loeve-Transformation(KLT))或者主成分分析(PrincipalComponentAnalysis(PCA))或者利用EP1850629、WO2009138205、WO2011009649、WO2011009650、WO2012016992和WO2012032178所述的代数不变式确定或优化这些电平,或者也可以给其充实更多的特殊技术部件:例如如Faller和Schillebeeckx就在130thAESConventioninLondoninP4-5(ImprovedITUandMatrixSurroundDownmixing)建议使用现有技术已知的90°滤波器。总的来说,此类下混方法就是在音频信道数量较少(“低阶信号”)的播放系统上播放音频信道数量较高的信号(“高阶信号”)的基础,并且还可提供减小音频信号带宽的前提条件,正如MPEGSurround之类标准的音频编码中已知的音频信号一样。此类下混方法可以是自适应的,其方法是使得特殊信道的电平随时间变化而变化(“自适应下混”),或者使得特殊信道的电平随时间变化保持不变并且因此是非自适应的(“自动下混”)。尤其可以优化用于直接播放下混信号的此类下混方法,这些下混方法纯粹用于减小音频信号的带宽。与市面上常见的与5.1或7.1一样将扬声器排列在一个平面中的环绕声布置相比,文献中也公开了将扬声器设置在该平面之外的扬声器布置布置。这些均部分表达了自己的标准,如日本NHK电台开发的三维系统Hamasaki22.2,大多数当今已知的多信道方法源自于此。总体来看所涉及的均为高度复杂的系统,可观察到相邻扬声器之间会形成无数的虚幻声源。诸如5.1或7.1之类的环绕声信号或者三维系统的逆编码总体上必然导致通常具有均匀调制并且因此而具有不自然高能量密度的扬声器信号。当然按照现有技术,需要有这样的能量密度才能形成相应的虚幻声源。因此我们将这样的方法称作“线性逆编码”。WO2011009649尤其描述了一种在线性逆编码装置或方法的范围内将两个全景电位器连接在MS-矩阵(MS-Matrix)后面,其中每个全景电位器均可形成两个母线信号。这种布置结构允许任意提高或降低相关度,并且可导致扬声器之间立体基线上的听觉声源宽度提高或降低。当然,如果第一全景电位器起作用,就会以之前确定的比例将MS-矩阵的第一输出信号提供给第一母线信号的两个信道。同样,如果第二全景电位器起作用,就会以之前确定的比例将MS-矩阵的第二输出信号提供给第二母线信号的两个信道。
技术实现思路
出乎意料而且与先前的经验相反,根据本专利技术发现一方面可以从音频信号或者从利用任意技术部件产生的下混信号得出的信号中选择用于线性逆编码的输入信号,以便产生附加信道以及相对于基本信号或者下混信号产生高阶信号(“上混”或者“编码”),另一方面可以播放通过线性逆编码产生的具有不同电平的音频信道,其中这些电平可以完全或者部分从所用音频信道的电平或者从用于下混的电平中得出,或者也可以完全或部分独立于这些进行确定。可选择根据不同调制的输出信道进行逆编码。在这两者情况下,如果发生此类技术步骤,我们谈到的就是“非线性逆编码”。因此非线性逆编码在形成略有变化的虚幻声源时没有均匀的能量密度,这与用来产生虚幻声源的相邻扬声器之间的立体基线应当尽可能均匀的要求相矛盾。当然这种不均匀的能量密度有助于产生自然的听觉印象,该听觉印象在输入信道数量增多时逐渐近似于透明。人的听觉在输入信道数量增多时对透明度...
<a href="http://www.xjishu.com/zhuanli/21/CN105229730.html" title="多信道信号的非线性逆编码原文来自X技术">多信道信号的非线性逆编码</a>

【技术保护点】
音频信号的上混或编码装置,其具有:用于通过线性逆编码从输入信号确定第一信道和第二信道的逆编码装置;其特征在于所述第一信道中连接在所述逆编码装置后面的第一增益(50001);或者所述第一信道中连接在所述逆编码装置后面的第一增益(60001)以及所述第二信道中连接在所述逆编码装置后面的与所述第一增益(60001)不同的第二增益(60002)。

【技术特征摘要】
【国外来华专利技术】2012.11.09 CH 2300/121.音频信号的上混或编码装置,其具有:
用于通过线性逆编码从输入信号确定第一信道和第二信道的逆编码装置;
其特征在于
所述第一信道中连接在所述逆编码装置后面的第一增益(50001);或者
所述第一信道中连接在所述逆编码装置后面的第一增益(60001)以及所
述第二信道中连接在所述逆编码装置后面的与所述第一增益(60001)不同的第
二增益(60002)。
2.根据权利要求1所述的上混或编码装置,所述上混或编码装置构造成在
没有与所述第二信道组合的情况下输出或者继续处理利用所述第一增益
(50001,60001)放大的第一信道,并且/或者在没有与所述第一信道组合的情况
下输出或者继续处理利用所述第二增益(60002)放大的第二信道。
3.根据权利要求1~2中任一项所述的上混或编码装置,其中根据用来产
生所述输入信道的至少一个下混的参数选择所述第一增益(50001,60001)和/
或者所述第二增益(60002)。
4.根据权利要求1~2中任一项所述的上混或编码装置,所述上混或编码
装置具有优化装置,所述优化装置构造为根据所述第一信道和/或者所述第二信
道调整所述第一增益(50001,60001)和/或者所述第二增益(60002)的值。
5.根据权利要求1~3中任一项所述的上混或编码装置,其中固定地设置
所述第一增益(50001,60001)和/或者所述第二增益(60002)。
6.根据权利要求5所述的上混或编码装置,其中所述第一增益(50001,
60001)的值对应于0.5或者7.根据权利要求1~6中任一项所述的上混或编码装置,所述上混或编码
装置具有在所述第一信道和所述第二信道中连接在所述逆编码装置以及所述第
一增益后面的电平修正装置,所述电平修正装置构造为根据用来产生所述输入
信道的至少一个下混的参数或者根据所接收的电平调整所述第一信道和所述第
二信道的电平。
8.根据权利要求3、5、6或7中任一项所述的上混或编码装置,其中通过
加权相加产生基于多信道信号的两个信号构成的所述输入信号,并且所述至少
一个下混的参数相当于所述两个信号或所述输出信号的加权。
9.根据权利要求1、2、3或7中任一项所述的上混或编码装置,所述上混
或编码装置具有用来接收所述输入信号以及第一值和/或者第二值的接收装置,
其中根据所接收的第一值调整所述第一增益,并且/或者根据所接收的第二值调
整所述第二增益。
10.根据权利要求1~9中任一项所述的上混或编码装置,其中所述逆编码
装置构造为根据利用所述输入信号接收的参数来确定所述第一信道和所述第二
信道。
11.根据权利要求1~10中任一项所述的上混或编码装置,其中所述逆编
码装置构造为根据声源和麦克风的主轴线之间的角度、虚拟左侧张角、虚拟右
侧张角以及所述输入信号的方向特性来确定所述逆编码装置的至少一个第一增
益和所述逆编码装置的至少一个延迟,并且根据所述逆编码装置的至少一个延
迟和至少一个增益来确定第一中间信号和第二中间信号,并且根据所述第一中
间信号和所述第二中间信号来确定所述第一信道和所述第二信道。
12.根据权利要求11所述的上混或编码装置,其中所述逆编码装置构造为
根据至少一个加权因数分别通过所述第一和所述第二中间信号的加权相加和/或
者加权相减产生所述第一信道和所述第二信道。
13.根据权利要求11或12所述的上混或编码装置,其中所述逆编码装置
构造为根据所述声源和所述麦克风的主轴线之间的角度、所述左侧张角、所述
右侧张角以及所述方向特性确定两个延迟,并且通过共同的时间因数(s)修正
所述两个延迟。
14.根据权利要求11~13中任一项所述的上混或编码装置,其中在所述声
源和所述麦克风的主轴线之间的所述角度、所述左侧张角、所述右侧张角和/或
者所述方向特性恒定不变。
15.根据权利要求1~14中任一项所述的上混或编码装置,所述上混或编
码装置具有优化装置,所述优化装置用于确定适合于所述第一增益(50001,
60001)和/或者所述第二增益(60002)和/或者线性逆编码参数的值。
16.根据权利要求15所述的上混或编码装置,其中所述优化装置构造为确
定从所述下混重建的两个信道或者基于下混的两个信号的相关度,并且根据所
述相关度确定所述第一增益(50001,60001)和/或者所述第二增益(60002)和
/或者线性逆编码参数的值。
17.根据权利要求16所述的上混或编码装置,其中所述优化装置构造为根
据目标相关度确定所述第一增益(50001,60001)和/或者所述第二增益(60002)
和/或者线性逆编码参数的值。
18.根据权利要求19所述的上混或编码装置,其中所述优化装置构造为根
据所述两个信道的特性、第一下混信道的特性、基于所述第一下混信道的两个
信号的特性并且/或者根据基于所述第一下混信道的多信道信号的信道的特性确
定目标相关度。
19.根据权利要求18所述的上混或编码装置,其中所述目标相关度
对于语音或者声乐录音而言大于等于正零点五一(≥+0.51),尤其大于等于
正零点六六(≥+0.66),并且/或者

【专利技术属性】
技术研发人员:C·帕尔
申请(专利权)人:斯托明瑞士有限责任公司
类型:发明
国别省市:瑞士;CH

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1