用于上混/重混/下混应用的多声道音频处理制造技术

技术编号：42460235 阅读：22 留言：0更新日期：2024-08-21 12:49

提供了一种用于确定解码L×K矩阵的方法，该解码L×K矩阵用于将传入的L维声道音频解码为传出的K维声道音频，其中L≥2且K≥1。该方法包括：确定使L维输入样本x与该输入样本的估计x<supgt;估计</supgt;＝d a之间的第一差度量最小化的平移控制参数p和样本分量d，其中a＝A(p)，并且其中A(p)是针对给定平移控制参数p返回L维平移向量a的第一预设映射函数；生成K维原始输出样本y<supgt;原始</supgt;＝d s，其中s＝S(p)，并且其中S(p)是针对给定平移控制参数p返回K维平移向量s的第二预设映射函数，以及；通过求解使该K维原始输出样本y<supgt;原始</supgt;与解码的输入样本x M之间的第二差度量最小化的优化问题来确定该解码L×K矩阵M。还提供了一种用于使用该解码L×K矩阵将传入的L维声道音频解码为传出的K维声道音频的方法。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】

所提出的技术总体上涉及音频处理，更具体地涉及一种用于上混/重混/下混应用的多声道音频处理的方法和系统、一种自适应空间解码器、一种音频处理系统和一种对应的总体音频系统、以及一种计算机程序和一种计算机程序产品。

技术介绍

1、多声道音频处理广泛用于许多不同的音频应用中。更具体地，多声道处理通常用于上混/重混/下混应用。

2、举例来说，众所周知的是提供上混以从立体声录音中生成多声道音频信号，例如，参见avendano等人的“a frequency-domain approach to multichannel upmix[多声道上混的频域方法]”，音频工程学会杂志，第52卷，第7/8期，2004年7月/8月，faller的“multiple-loudspeaker playback of stereo signals[立体声佶号的多扩音器重放]”，音频工程学会杂志，第54卷，第11期，2006年11月，以及美国专利号8,280,077。多声道上混的概念有时被称为立体声信号的多扩音器重放。

3、例如在美国专利号9,088...

【技术保护点】

1.一种用于确定解码L×K矩阵的计算机实施的方法，该解码L×K矩阵用于将传入的L维声道音频解码为传出的K维声道音频，其中L≥2且K≥1，该方法包括以下步骤：

2.根据权利要求1所述的方法，其中，该优化问题被设置为使样本加权差度量最小化，其中，样本权重包括来自其他L维输入样本的贡献。

3.根据权利要求1或2所述的方法，其中，该第一预设映射函数A()是根据预先建立的查找表或根据传达关于如何根据上下文预设映射函数A()的信息的预定义规则来预设的。

4.根据权利要求1至3中任一项所述的方法，其中，该第二预设映射函数S()是根据预先建立的传达关于如何根据上下文设...

【技术特征摘要】
【国外来华专利技术】

1.一种用于确定解码l×k矩阵的计算机实施的方法，该解码l×k矩阵用于将传入的l维声道音频解码为传出的k维声道音频，其中l≥2且k≥1，该方法包括以下步骤：

2.根据权利要求1所述的方法，其中，该优化问题被设置为使样本加权差度量最小化，其中，样本权重包括来自其他l维输入样本的贡献。

3.根据权利要求1或2所述的方法，其中，该第一预设映射函数a()是根据预先建立的查找表或根据传达关于如何根据上下文预设映射函数a()的信息的预定义规则来预设的。

4.根据权利要求1至3中任一项所述的方法，其中，该第二预设映射函数s()是根据预先建立的传达关于如何根据上下文设置预设映射函数s()的信息的查找表来预设的。

5.根据权利要求1至4中任一项所述的方法，其中，该第一差度量和/或该第二差度量是使用目标成本函数来确定的。

6.根据权利要求5所述的方法，其中，该目标成本函数被定义为加权平方差。

7.根据权利要求1至6中任一项所述的方法，进一步包括将该传入的l维声道音频划分为多个频带n的步骤，其中为每个此种频带n确定解码l×k矩阵。

8.根据权利要求1至7中任一项所述的方法，进一步包括基于新的l维输入样本xi随时间动态更...

【专利技术属性】
技术研发人员：索伦·斯科夫加德克里斯滕森，佩德罗·霍仁索伦森，莫滕·罗汉森，丹尼斯·沃尔科夫，拉斯约翰·布兰马克，
申请(专利权)人：狄拉克研究公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人