编码器、解码器以及用于编码和解码的方法技术

技术编号:14676338 阅读:83 留言:0更新日期:2017-02-19 01:23
一种用于将音频信号编码至数据流的编码器包括:预测器、因子分解器、变换器以及量化和编码阶段。预测器用于分析音频信号以获得描述音频信号的频谱模拟或音频信号的基频的预测系数,并使得音频信号服从取决于预测系数的分析滤波函数以输出音频信号的残差信号。因子分解器用于对由预测系数定义的合成滤波函数的自相关或协方差矩阵应用因子分解以获得经因子分解的矩阵。变换器用于基于经因子分解的矩阵对残差信号进行变换以获得变换的残差信号。量化和编码阶段用于对变换的残差信号进行量化以获得量化后的变换的残差信号或经编码的量化后的变换的残差信号。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术的实施例涉及用于对音频信号进行编码以获得数据流的编码器以及用于对数据流进行解码以获得音频信号的解码器。其他实施例涉及用于对音频信号进行编码以及用于对数据流进行解码的对应方法。又一实施例涉及进行用于编码和/或解码的方法的步骤的计算机程序。
技术介绍
待被编码的音频信号可以,例如,为语音信号;即编码器与语音编码器相对应且解码器与语音解码器相对应。语音编码中最常用的范例为用于诸如AMR-家族、G.718以及MPEGUSAC的标准中的代数码激励线性预测(ACELP)。它基于使用源模型的建模语音,由用于对频谱包络进行建模的线性预测器(LP)、用于对基频进行建模的长期预测器(LTP)以及用于残差的代数码本组成。在感知加权合成域中,码本参数被优化。感知模型基于滤波器,由此,通过线性预测器和加权滤波器的组合描述从残差至加权输出的映射。ACELP编解码器中的计算复杂度的最大部分花费在选择代数码本条目上,其基于残差的量化。从残差域至加权合成域的映射本质上是乘以大小为N×N的矩阵,其中N为向量长度。由于此映射,就加权输出SNR(信噪比)而言,残差样本是相关的且无法被独立地量化。由此得出结论,在加权合成域中,需要明确地评估每个可能的码本向量以确定最佳条目。此方法被称为合成-分析算法。仅利用码本的暴力搜索,最优性能是可能的。码本大小取决于比特率,但考虑B的比特率,存在2B个条目需要评估,总复杂度为O(2BN2),当B大于或等于11时,这明显是不切实际的。在实际中,编解码器因此利用在复杂度和质量之间权衡的非最优量化。已存在一些用于找到以准确率为代价限制复杂度的最佳量化的迭代算法。为了克服此限制,需要新方法。
技术实现思路
本专利技术的目的在于提供一种用于编码和解码音频信号同时避免上述缺陷的概念。通过独立权利要求实现此目的。第一实施例提供一种用于将音频信号编码为数据流的编码器。该编码器包括:(线性或长期)预测器、因子分解器(factorizer)、变换器、以及量化的编码阶段。预测器用于分析音频信号以获得描述音频信号的频谱包络或音频信号的基频的(线性或长期)预测系数并用于使得音频信号服从取决于预测系数的分析滤波函数以输出音频信号的残差信号。因子分解器用于将矩阵因子分解应用于由预测系数定义的合成滤波函数的自相关或协方差矩阵以获得经因子分解的矩阵。变换器用于基于经因子分解的矩阵对残差信号进行变换以获得变换的残差信号。量化和编码阶段用于对变换的残差信号进行量化以获得量化后的变换的残差信号或经编码的量化后的变换的残差信号。另一实施例提供一种用于将数据流解码为音频信号的解码器。该解码器包括:解码阶段、再变换器以及合成阶段。解码阶段用于基于入站的量化后的变换的残差信号或基于入站的经编码的量化后的变换的残差信号输出变换的残差信号。再变换器用于基于从合成滤波函数的自相关或协方差矩阵的矩阵因子分解产生的经因子分解的矩阵,从变换的残差信号再变换为残差信号,合成滤波函数由描述音频信号的频谱包络或音频信号的基频的预测系数定义。合成阶段用于通过使用由预测系数定义的合成滤波函数基于残差信号合成音频信号。正如基于这两个实施例可见的,编码和解码为使得此概念可比拟于ACELP的两阶段过程。第一步骤使能关于频谱包络或基频的合成的量化,其中第二阶段能够实现残差信号(也称为激励信号并表示在利用音频信号的频谱包络或基频对信号进行滤波之后的信号)的(直接)量化或合成。同样,类似于ACELP,残差信号或激励信号的量化遵守优化问题,其中与ACELP相比,根据本文中所公开的教示的优化问题的目标函数存在本质区别。详细地,本专利技术的教示基于矩阵因子分解用于对优化问题的目标函数进行去相关,由此可避免计算昂贵的迭代并保证最优性能的原理。作为所附实施例的一个核心步骤的矩阵因子分解包括于编码器实施例中,且优选地而非必须地可包括于解码器实施例中。矩阵分子分解可基于不同技术,例如特征值分解、范德蒙因子分解或任何其他因子分解,其中,对于每种所选的技术,因子分解进行因子分解的是矩阵,如由编码或解码的第一阶段(线性预测器或长期预测器)中的第一音频检测到的(线性或长期)预测系数定义的合成滤波函数的自相关或协方差矩阵。根据另一实施例,因子分解器对包括使用矩阵存储的预测系数的合成滤波函数进行因子分解,并对合成滤波函数矩阵的加权形式进行因子分解。例如,可通过使用范德蒙矩阵V、对角矩阵D以及范德蒙矩阵的共轭变换形式V*进行因子分解。可使用公式R=V*DV或C=V*DV对范德蒙矩阵进行因子分解,其中自相关矩阵R或协方差矩阵C由合成滤波函数矩阵的共轭变换形式H*以及合成函数矩阵H的正则形式定义,即R=H*H或C=H*H。根据又一实施例,变换器,从先前确定的对角矩阵D的和先前确定的范德蒙矩阵V,使用公式y=D1/2Vx或公式y=DVx将残差信号x变换为变换的残差信号y。根据又一实施例,量化和编码阶段此刻能够对变换的残差信号y进行量化以获得量化后的变换的残差信号此变换为优化问题,如上所论述,其中使用目标函数此处,有利的是,与用于不同的编码或解码方法的目标函数(如,ACELP编码器中使用的目标函数)相比,此目标函数具有减小的复杂度。根据实施例,解码器从编码器接收经因子分解的矩阵,如和数据流一起。或根据另一实施例,解码器包括进行矩阵因子分解的可选的因子分解器。根据优选实施例,解码器直接接收经因子分解的矩阵并从这些经因子分解的矩阵得到预测系数,因为矩阵都源于预测系数(参看编码器)。此实施例能够实现进一步地减小解码器的复杂度。又一实施例提供用于将音频信号编码为数据流以及用于将数据流解码为音频信号的对应方法。根据附加实施例,用于编码的方法以及用于解码的方法可由或至少部分地可由诸如计算机的CPU的处理器进行。附图说明将参考所附附图论述本专利技术的实施例,其中图1a显示根据第一实施例的用于对音频信号进行编码的编码器的示意性框图;图1b显示根据第一实施例的用于对音频信号进行编码的对应方法的示意性流程图;图2a显示根据第二实施例的用于对数据流进行解码的解码器的示意性框图;图2b显示根据第二实施例的用于对数据流进行解码的对应方法的示意性流程图;图3a显示示出对于不同量化方法的作为每帧比特数的函数的平均感知信噪比的示意图;图3b显示示出作为每帧比特数的函数的不同量化方法的归一化运行时间的示意图;以及图3c显示示出范德蒙变换的特征的示意图。具体实施方式随后以下将参考所附附图详细地论述本专利技术的实施例。此处,为具有相同或相似功能的对象提供相同的附图标记,以使得其描述为可互换或互相适用的。图1显示基本配置中的编码器10。编码器10包括:此处被实施为线性预测器12的预测器12、以及因子分解器14、变换器16以及量化和编码阶段18。线性预测器12布置于输入处以接收音频信号AS,优选地,数字音频信号,如脉冲码调制信号(PCM)。线性预测器12经由所谓的LPC信道LPC连接至因子分解器14和编码器的输出处,参看附图标记DSLPC/DSDV。更进一步地,线性预测器12经由所谓的残差信道连接至变换器16。反之亦然,变换器16在其输入侧(除残差信道之外)连接至因子分解器14。在其输出侧,变换器连接至量化和编码阶段18,其中量化和编码阶段18连接至输出本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/21/201580014310.html" title="编码器、解码器以及用于编码和解码的方法原文来自X技术">编码器、解码器以及用于编码和解码的方法</a>

【技术保护点】
一种用于将音频信号(AS)编码至数据流(DS)的编码器(10),包括:预测器(12),用于分析所述音频信号(AS)以获得描述所述音频信号(AS)的频谱包络或所述音频信号(AS)的基频的预测系数(LPC)并使得所述音频信号(AS)服从取决于所述预测系数(LPC)的分析滤波函数(H)以输出所述音频信号(AS)的残差信号(x);因子分解器(14),用于对由所述预测系数(LPC)定义的合成滤波函数(H)的自相关或协方差矩阵(R,C)应用矩阵因子分解以获得经因子分解的矩阵(V,D);变换器(16),用于基于所述经因子分解的矩阵(V,D)对所述残差信号(x)进行变换以获得变换的残差信号(y);以及量化和编码阶段(18),用于对所述变换的残差信号(y)进行量化以获得量化后的变换的残差信号或经编码的量化后的变换的残差信号

【技术特征摘要】
【国外来华专利技术】2014.03.14 EP 14159811.0;2014.08.22 EP 14182047.21.一种用于将音频信号(AS)编码至数据流(DS)的编码器(10),包括:预测器(12),用于分析所述音频信号(AS)以获得描述所述音频信号(AS)的频谱包络或所述音频信号(AS)的基频的预测系数(LPC)并使得所述音频信号(AS)服从取决于所述预测系数(LPC)的分析滤波函数(H)以输出所述音频信号(AS)的残差信号(x);因子分解器(14),用于对由所述预测系数(LPC)定义的合成滤波函数(H)的自相关或协方差矩阵(R,C)应用矩阵因子分解以获得经因子分解的矩阵(V,D);变换器(16),用于基于所述经因子分解的矩阵(V,D)对所述残差信号(x)进行变换以获得变换的残差信号(y);以及量化和编码阶段(18),用于对所述变换的残差信号(y)进行量化以获得量化后的变换的残差信号或经编码的量化后的变换的残差信号2.根据权利要求1所述的编码器(10),其中,所述合成滤波函数(H)由包括所述合成滤波函数(H)的加权值的矩阵(H)定义。3.根据权利要求1或2所述的编码器(10),其中,所述因子分解器(14)基于所述合成滤波函数的共轭变换形式(H*)与所述合成滤波函数(H)的正则形式的乘积计算所述自相关或协方差矩阵(R,C)。4.根据权利要求1-3中任一项所述的编码器(10),其中,所述因子分解器(14)基于公式C=V*DV或基于公式R=V*DV,对所述自相关或协方差矩阵(R,C)进行因子分解;其中,V为范德蒙矩阵,V*为范德蒙矩阵的共轭变换形式,以及D为具有严格正条目的对角矩阵。5.根据权利要求4所述的编码器(10),其中,所述因子分解器(14)用于进行范德蒙因子分解。6.根据权利要求1-5中任一项所述的编码器(10),其中,所述因子分解器(14)用于进行特征值分解和/或乔里斯基因子分解。7.根据权利要求4或5所述的编码器(10),其中,所述变换器(16)基于公式y=D1/2Vx或基于公式y=DVx,对所述残差信号(x)进行变换。8.根据权利要求1-7中任一项所述的编码器(10),其中,量化和编码阶段(18)基于目标函数对所述变换的残差信号(y)进行量化以获得所述量化后的变换的残差信号9.根据权利要求1-8中任一项所述的编码器(10),其中,所述量化和编码阶段(18)包括用于通过应用噪声填充以提供所述音频信号(AS)、所述残差信号(x)或所述变换的残差信号(y)的噪声填充的频谱表示和/或通过关于死区或关于其他量化参数优化所述量化后的变换的残差信号而优化量化的工具。10.根据权利要求1-9中任一项所述的编码器(10),其中,所述残差信号(x)的变换为从所述残差信号(x)的时域至所述变换的残差信号(y)的类频域的变换。11.根据权利要求1-10中任一项所述的编码器(10),其中,所述量化和编码阶段包括:用于进行所述量化后的变换的残差信号的编码以获得所述经编码的量化后的变换的残差信号的编码器。12.根据权利要求11所述的编码器(10),其中,由所述编码器进行的编码出自包括算术编码、代数编码、或其他熵编码的组。13.根据权利要求11或12所述的编码器(10),其中,所述编码器(10)还包括:用于将所述经编码的量化后的变换的残差信号和所述预测系数(LPC)封包至待被所述编码器(10)输出的所述数据流(DS)的封包器。14.根据权利要求1-13中任一项所述的编码器(10),其中,所述预测器(12)包括线性预测器和/或长期预测器。15.一种用于将音频信号(AS)编码至数据流(DS)的方法(100),所述方法包括:分析(120)所述音频信号(AS)以获得描述...

【专利技术属性】
技术研发人员:汤姆·贝克斯特伦约翰内斯·费舍尔克里斯蒂安·赫尔姆里希
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1