当前位置: 首页 > 专利查询>奥兰治专利>正文

从变换编码/解码过渡到预测编码/解码制造技术

技术编号:13329737 阅读:58 留言:0更新日期:2016-07-11 19:57
本发明专利技术涉及一种对数字音频信号进行解码的方法,该方法包括以下步骤:根据该数字信号的前一个样本帧的逆变换解码进行解码(E602),该帧是根据变换编码接收并编码的;根据该数字信号的当前样本帧的预测解码进行解码(E608),该帧是根据预测编码接收并编码的。该当前帧的该预测解码是过渡预测解码,该过渡预测解码不使用该前一个帧所产生的任何自适应字典,并且该方法另外包括:将该预测解码的至少一个状态重新初始化成预定的默认值的步骤(E606)、将通过该当前帧的预测解码合成的信号区段与对应于该前一个帧的该解码的存储区段的通过逆变换解码合成的信号区段进行组合的相加重叠步骤(E609)。本发明专利技术相关地涉及一种编码方法,该编码方法包括将该预测编码的至少一个状态重新初始化成预定的默认值。本发明专利技术涉及一种实现这些对应的方法的编码器和解码器。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及数字信号编码领域。根据本专利技术的编码具体被适配成用于传输和/或存储如音频信号(语音、音乐或其他)的数字音频信号。
技术介绍
本专利技术借助于交替至少两种编码模式并且其算法延迟被适配成用于会话应用(通常≤40ms)的多模技术有利地适用于语音、音乐和混合内容信号的统一编码。为了有效地对语音声音进行编码,主张CELP(“码激励线性预测”)类型或其变体ACELP(“代数码激励线性预测”)技术,最近也更多地提出了CELP编码的替代方案,如BV16、BV32、iLBC或SILK编码器。另一方面,主张变换编码技术以有效地对音乐声音进行编码。线性预测编码器并且更具体地CELP类型的编码器是预测编码器。它们的目标是基于以下元素中的至少某部分对语音产生进行建模:用于对声道进行建模的短期线性预测、用于在有声期中对声带的振动进行建模的长期预测、以及来源于一般被称为固定字典的向量量化字典的用于表示不可能通过预测对其进行建模的“新事物”的激励(白噪声、代数激励)。使用最多的变换编码器(例如MPEGAAC或ITU-TG.722.1AnnexC编码器)使用MDCT(“经修改的离散变换”)类型的临界采样变换以便在变换域中压缩信号。“临界采样变换”指针对其在变换域中的系数的数量等于所分析的时间样本的数量的变换。用于有效地对包含这两种类型的内容的信号进行编码的解决方案在于随着时间过去(一帧一帧地)选择最佳技术。这种解决方案已经具体地由3GPP(“第三代合作伙伴计划”)标准主体通过被称为AMRWB+(或增强型AMR-WB)的技术并且最近更多地通过MPEG-HUSAC(“统一语音音频编码”)编解码器而主张。在对算数延迟没有严苛限制的情况下,由AMR-WB+和USAC设想的这些应用不是会话式的,但是对应于广播和存储服务。USAC标准是在ISO/IEC文件23003-3:2012,信息技术--MPEG音频技术--部分3:统一语音和音频编码中公布的。举例说明,在M.诺伊恩多夫(Neuendorf)等人的文章《针对低比特率统一语音和音频编码的新方案-MPEGRM0》,2009年5月7-10日,第126届AES会议中描述了被称为RM0(参考模型0)的USAC编解码器的初始版本。此编解码器在至少两种编码模式之间交替:·针对语音类型的信号:使用ACELP技术的LPD(“线性预测域”)模式·针对音乐类型的信号:使用MDCT(“经修改的离散变换”)技术的FD(“频域”)模式。在下文回忆ACELP和MDCT编码的原理。一方面,CELP编码(包括其ACELP变体)是基于源滤波器模型的预测编码。通常,滤波器对应于具有通过线性预测(LPC,线性预测编码)获得的传递函数1/A(z)的全极点滤波器。实际上,合成使用滤波器1/A(z)的量化版本源(也就是说,预测线性滤波器的激励)通常是通过对声带振动进行建模的长期预测获得的预测与以噪声字典等的代数编码(ACELP)的形式描述的随机激励(或创新)的组合。通过在由滤波器用传递函数W(z)加权的信号域中的平方误差标准的最小化执行对“最优”激励的搜索,A(z)该传递函数通常源自具有形式W(z)=A(z/γ1)/A(z/γ2)的线性预测滤波器。将注意的是,已经提出了CELP模型的许多变体并且在此将保留UIT-TG.718标准的CELP编码的示例,其中,两个LPC滤波器每一帧被量化并且LPC激励是根据分类被编码的,其中,模式是针对有声的、无声的、瞬态的声音等适配的。此外,CELP编码的替代方案也已经被提出,包括仍然基于线性预测的BV16、BV32、iLBC或SILK编码器。通常,预测编码(包括CELP编码)出于历史的和其他的原因(宽频带线性预测限制、针对高频的算法复杂性等)以受限制的采样频率(≤16kHz)进行操作;因此,为了以典型的16至48kHz的频率进行操作,还使用重采样操作(通过FIR滤波器、滤波器组或IIR滤波器)以及可选地针对可以是参数频带扩展的高频带的单独编码-在此不再回顾这些重采样和高频带编码操作。另一方面,MDCT变换编码于编码器处在三个步骤之间被划分:1.在对应于2个块的长度之上通过在此被称为“MDCT窗”的窗对信号进行加权2.时间混叠(或“时域混叠”)以形成缩减的块(其长度除以2)3.对缩减的块进行DCT-IV(“离散余弦变换”)变换。将注意的是,TDAC变换类型的计算变体可以使用例如傅里叶变换(FFT)而不是DCT变换。MDCT窗通常被划分为具有相等长度的被称为“夸特(quarter)”的4个相邻的部分。信号乘以分析窗并且然后执行混叠:第一夸特(被加窗的)在第二夸特上混叠(也就是说,时间翻转并且重叠)而第四夸特在第三夸特上混叠。更确切地,一个夸特在另一个夸特上的混叠是通过以下方式执行的:第一夸特的第一个样本与第二夸特的最后一个样本相加(或相减),第一夸特的第二个样本与第二夸特的倒数第二个样本相加(或相减),并且如此这般直到第一夸特的最后一个样本与第二夸特的第一个样本相加(或相减)。因此,从4个夸特获得2个混叠的夸特,其中,每个样本是有待编码的信号的2个样本的线性组合的结果。此线性组合被称为时间混叠。将注意的是,时间混叠对应于混合两个时间区段并且两个时间区段在每个“混叠的夸特”中的相对水平取决于分析窗/合成窗。这2个混叠的夸特此后在DCT变换之后被共同地编码。针对后面的帧存在半个窗的移位(即,50%重叠),前一个帧的第三和第四夸特变成当前帧的第一和第二夸特。在混叠之后,与在前一帧中相同的样本对的第二线性组合被派遣,但是具有不同的权重。在解码器处,在逆DCT变换之后,因此获得这些混叠信号的经解码的版本。两个连续的帧包含相同的2个夸特的2种不同的混叠结果,也就是说,针对每个样本对我们具有拥有不同的但已知的权重的2种线性组合结果:方程组因此被求解以获得输入信号的经解码的版本,通过使用2个连续的经解码的帧可以因此免去时间混叠。所提及的方程组通常是通过去混叠、乘以合理选择的合成窗并且然后重叠相加公共部分而求解的。此重叠相加同时确保2个连续的经解码的帧之间的平缓过渡(没有由于量化误差引起的中断),实际上这个操作表现得像淡入淡出。当第一夸特或第四夸特的窗针对每个样本为零时,值得一提的是在窗的这个部分中没有时间混叠的MDCT变换。在这种情况中,平缓过渡不是由MDCT变换确保的,其必须通过其他手段完成,如,例如,外部淡入淡出。如由在包括G.722.1编码的G.722.1的附件C中的组合实现方式所展示的,变本文档来自技高网...

【技术保护点】
一种用于对数字音频信号进行解码的方法,该方法包括以下步骤:‑根据该数字信号的根据变换编码接收并编码的前一个样本帧的逆变换解码进行解码(E602);‑根据该数字信号的根据预测编码接收并编码的当前样本帧的预测解码进行解码(E608),该方法的特征在于,该当前帧的该预测解码是过渡预测解码,该过渡预测解码不使用该前一个帧所产生的任何自适应字典,并且特征在于,该方法另外包括:‑将该预测解码的至少一个状态重新初始化成预定的默认值的步骤(E606);‑重叠相加步骤(E609),该重叠相加步骤将通过该当前帧的预测解码合成的信号区段与对应于该前一个帧的该解码的存储区段的通过逆变换解码合成的信号区段进行组合。

【技术特征摘要】
【国外来华专利技术】2013.11.15 FR 13612431.一种用于对数字音频信号进行解码的方法,该方法包括以下步骤:
-根据该数字信号的根据变换编码接收并编码的前一个样本帧的逆变换解码进行解码
(E602);
-根据该数字信号的根据预测编码接收并编码的当前样本帧的预测解码进行解码
(E608),
该方法的特征在于,该当前帧的该预测解码是过渡预测解码,该过渡预测解码不使用
该前一个帧所产生的任何自适应字典,并且特征在于,该方法另外包括:
-将该预测解码的至少一个状态重新初始化成预定的默认值的步骤(E606);
-重叠相加步骤(E609),该重叠相加步骤将通过该当前帧的预测解码合成的信号区段
与对应于该前一个帧的该解码的存储区段的通过逆变换解码合成的信号区段进行组合。
2.如权利要求1所述的解码方法,其特征在于,该逆变换解码具有比该预测解码的处理
延迟更小的处理延迟,并且其特征在于,由预测解码所解码的当前帧的第一区段被该前一
个帧的该解码所产生的对应于在该前一个帧的该解码过程中的存储器中的延迟移位和放
置的区段替换。
3.如以上权利要求之一所述的解码方法,其特征在于,在该重叠相加步骤之前通过施
加补偿之前施加于该区段的加窗的逆窗口来校正通过逆变换解码合成的该信号区段。
4.如以上权利要求之一所述的解码方法,其特征在于,以对应于该当前帧的该经解码
的信号区段的采样频率预先对通过逆变换解码合成的该信号区段进行重采样。
5.如权利要求1所述的解码方法,其特征在于,该预测解码的状态在以下状态的列表
中:
-用于以该预测解码的内部频率进行重采样的滤波器的状态记忆;
-预加重/去加重滤波器的状态记忆;
-线性预测滤波器的系数;
-合成滤波器的状态记忆;
-自适应字典的记忆;
-低频后置滤波器的状态记忆;
-固定字典增益的量化记忆。
6.如权利要求5所述的解码方法,其特征在于,针对该当前帧对该线性预测滤波器的这
些系数进行计算是通过对独特的滤波器的这些系数进行解码并且通过将完全相同的系数
分配给结束帧、中间帧和开始帧线性预测滤波器执行的。
7.如权利要求5所述的解码方法,其特征在于,所述针对该当前帧对该线性预测滤波器
的这些系数进行计算包括以下步骤:
-通过使用该结束帧滤波器的这些系数的这些经解码的值以及该开始帧滤波器的这些
系数的预定的重新初始化值来确定该中间帧滤波器的这些系数的这些经解码的值;
-用该中间帧滤波器的这些系数的这些经解码的值替换该开始帧滤波器的这些系数的
这些经解码的值;
-通过使用该结束帧、中间帧和开始帧滤波器的这些系数的这些因此解码的值来针对
该当前帧确定该线性预测滤波器的这些系数。
8.如权利要求5所述的解码方法,其特征在于,该开始帧线性预测滤波器的这些系数被
重新初始化成对应于长期预测滤波器系数的平均值的预定值,并且其特征在于,针对该当
前帧的这些线性预测系数是通过使用这些因此预定的值以及该结束帧滤波器的这些系数
的这些经解码的值确定的。
9.一种用于对数字音频信号进行编码的方法,该方法包括以下步骤:
-根据变换编码对该数字信号的前一个样本帧进行编码(E302);
-接收该数字信号的有待根据预测编码进行编码的当前样本帧(E308);
该方法的特征在于,该当前帧的该预测编码是过渡预测编码,该过渡预测编码不使用...

【专利技术属性】
技术研发人员:J福尔S拉戈特
申请(专利权)人:奥兰治
类型:发明
国别省市:法国;FR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1