能量保留多通道音频编码制造技术

技术编号:7152675 阅读:204 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及音频编码和/或解码技术的技术领域,并从而涉及整体编码过程及相关联的解码步骤。编码步骤涉及对音频输入通道组的信号表示进行操作的至少两个信号编码过程(S1-S3),以及涉及残余编码(S7-S8)。本发明专利技术还涉及对音频输入通道的能量进行估计和编码的专用过程(S4-S6)。每个编码过程与对应的解码过程相关联。在整体解码过程中,优选地将来自每个编码过程的解码信号进行组合,使得输出通道在能量和/或质量方面接近输入通道。一般地,组合步骤还适应于一个或多个信号表示的部分或全部的可能丢失,使得用解码器手上的信号对能量和质量进行优化。这样,提高了输出通道的整体质量。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频编码方法和相应的音频解码方法,以及音频编码器和相应的音频解码器。
技术介绍
对提供基于分组交换网络的电信服务的需求正在显著地增加,且该需求在当今比以往任何时候都更强。同时,在要发送的媒体内容中存在日益增长的多样性,包括不同的带宽、单声道和立体声声音以及语音和音乐信号。多个标准化组织付出大量努力来定义灵活和有效的用于向用户传输混合内容的解决方案。显著地,两个主要的挑战依然等待着解决方案。首先,所部署的网络技术和用户设备的多样性暗示着由于传输网络的不同属性,因此向不同用户提供的相同设备可能具有不同的用户感知质量。其次,通信设备必须适应广泛的媒体内容。当前,语音和音乐发送依然属于不同的范式(paradigm),且对于可以向所有类型音频信号提供良好质量的服务,存在要填补的差距。当今,可扩缩的音视频以及通常的媒体内容编解码是可用的,实际上,MPEG的早期设计指南从开始就是可扩缩的。然而,尽管这些编解码由于它们的功能而具有吸引力,它们缺少在低比特率下运行的效率,这与当前的大量市场的无线设备不相符。随着无线通信的更高渗透,需要更复杂的可扩缩编解码。已经认识到了该事实,且预期新的编解码将要在不远的将来出现。尽管对自适应服务和可扩缩编解码付出了巨大努力,可扩缩服务将不会出现,除非对传输问题给予更多的关注。因此,除了有效的编解码之外,必须将恰当的网络架构和传输框架认为是完全利用服务传输中的可扩缩性的使能技术。基本上,可以考虑三种场景 在端点处的自适应。即,如果必须选择较低的发送速率,则通知发送方,且其执行扩缩或编解码改变。 在中间网关处的自适应。如果网络的一部分变得阻塞,或具有不同的服务能力, 如图1所示的专用网络实体执行服务的译码。在可扩缩编解码的情况下,这可以简单如丢弃或截断媒体帧一样。 网络中的自适应。如果路由器或无线接口变得阻塞,则就在发生问题的地方通过丢弃或截断分组来执行自适应。这是瞬变问题所需的解决方案,例如对无线链路的严重业务脉冲或通道质量变化的处理。以下,给出了根据现有技术的语音和音频的可扩缩编解码的概览。还给出对立体声编码概念的总体背景。可扩缩咅频编码非会话,流传输/下载总体上,当前的音频研究趋势是提高低比特率的压缩率(提供以321APS以下比特率的足够良好的立体声质量)。最近的低比特率音频提高是对MPEG中的参数化立体声(PS) 工具开发的定案,对3GPP中的混合CELP/和变换编解码扩展AMR-WB (称为AMW-WB+)的标准化。还存在正在进行的对空间音频编码(环绕立体声/5.1内容)的MPEG标准化活动, 其中已经选择了第一参考模型(RMO) [4]0与可扩缩音频编码相关的,MPEG中的近期标准化成就已经导致了对无损扩展工具的可扩缩MPEG4-SLS。MPEG4-SLS 一直向核心AAC/BSAC提供了渐进的增强,直至具有低至 0. 4kbps粒度步长的无损。依然需要定义SLS的音频对象类型(AOT)。在MPEG中,在2005 年1月还发布了针对信息的呼叫(CfI) [1],其目标是可扩缩语音和音频编码领域,在CfI中解决的主要问题是可扩缩性、在内容类型间(例如语音和音乐)一致的性能以及在低比特率(<MlibpS)的编码质量。之后,放弃了可扩缩部分,现在工作的目标是以各种比特率运行的不具有嵌入式可扩缩性的编解码。语音编码(会话单声道)概要在一般语音压缩中,最近的标准化成就是对3GPP2/VMR-WB编解码的扩展,以支持最大比特率8. 55kbps的操作。在ITU-T中,先前已经用以24、32和481cbpS提供操作的超宽带(14kHz音频带宽,32kHz采样)能力的两种新的模式来更新了多速率G. 722. 1音频/ 视频会议编解码。其它的标准化成就的目标是添加将带宽扩展到48kHz全频带编码的附加模式。最终结果是新的独立编解码G. 719,其提供了从32到USlAps的具有161ApS步长的低复杂度全频带编码。关于可扩缩会话语音编码,主要的标准化成就发生在ITU-T中(工作组3,研究组 16)。在2006年5月,对G. 729的可扩缩扩展进行了标准化,称作G. 729. 1。该扩展可从8 至321ibps以21ibps的粒度步长自121ibps进行扩缩。G. 729. 1的主要目标应用是在共享和带宽有限的xDSL-链路上的会话语音,即该扩缩有可能发生在将VoIP分组通过特定受控语音通道(Vc)进行传递的数字住宅网关中。ITU-T最近(2008年9月)还批准了对完全新的可扩缩会话编解码G. 718的建议。该编解码包括8. Okbps的核心速率和321ibps的最大速率,同时扩缩步长是12. 0,16. 0以及24. Okbps0 G. 718核心是从VMR-WB继承的WB语音编解码,但是也通过上采样至核心采样率处理NB输入信号。当前在ITU-T(工作组3,研究组 16,问题23)正在标准化将带来超宽带和立体声能力(32kHz采样/1个通道)的G. 718和 G. 729. 1编解码的联合扩展。在2008年7月认证周期结束。SNR可扩缩性SNR可扩缩性的原理是随着比特或层的数目的增加而增加SNR。两个先前提到的语音编解码G. 729. 1和G. 718具有该特征。一般地,这通过对来自先前层的编码残余进行逐步重新编码来实现。由于可以通过简单地丢弃上层以对较低的比特率解码,因此该嵌入式分层结构是有吸引力的。然而,当考虑到较高比特率时该嵌入式分层可能不是最优的,且分层编解码通常比相同比特率的固定比特率编解码表现更糟。此处可以提到的其它编解码是 SNR 可扩缩 MPEG4-CELP 和 G. 727 (嵌入式 ADPCM)。带宽可扩缩性还存在可以随着比特数量的增加而增加带宽的编解码,例如G722(子频带 ADPCM),还有G. 729. 1和G. 718。G. 729. 1以针对比特率8和12kbps的级联式CELP编解码进行操作,但是使用带宽扩展以Hbps提供WB信号,以填充从4kHz到7kHz的范围。带宽扩展一般通过频谱折叠或其它映射来创建来自较低频带的激励信号,用频谱包络对其进一步进行增益调整和成形,以仿真较高端的频谱。尽管该解决方案可能听起来很好,扩展的频谱在MSE方面一般不与输入信号匹配。对于同样SNR可扩缩的编解码,一般用在较高层编码的内容来替代以较低比特率使用的带宽扩展。针对G. 729. 1,是用以子带为基础的编码频谱来逐步替代频谱的情况。G. 718展示了相同的特征,并针对速率8、12和ieicbps使用从 6. 4kHz到7. OkHz的带宽扩展。对于速率M和321cbpS,禁用带宽扩展,并用编码频谱来替代带宽扩展。除了作为SNR可扩展之外,MPEG4-CELP针对8和16kHz采样的输入信号,指定了带宽可扩缩编码系统。音频可扩缩性基本上,可以通过以下方式来实现音频可扩缩性 改变信号的量化,即类似SNR的可扩缩性。 扩展或收紧信号的带宽。 放弃音频通道(例如由1个通道构成的单声道,2个通道构成的立体声,5个通道构成的环绕立体声)_(空间可扩缩性)。当前可用的、细粒度的可扩缩音频编解码是AAC_BSAC(高级音频编码-比特片算术编码)。它可以同时用于本文档来自技高网...

【技术保护点】
1.一种基于对具有至少两个通道的多通道音频信号的音频输入通道组的信号表示进行操作的整体编码过程的音频编码方法,其中,所述音频编码方法包括以下步骤:-执行(S1)第一编码过程,用于对所述音频输入通道组的包括缩混信号的第一信号表示进行编码;-执行(S2)与所述第一编码过程相关的本地合成,以产生包括所述第一编码过程的编码误差的表示在内的本地解码的缩混信号;-至少使用所述本地解码的缩混信号作为输入,执行(S3)第二编码过程,用于对所述音频输入通道组的第二表示进行编码;-估计(S4)所述音频输入通道的输入通道能量;-基于所述音频输入通道的估计出的输入通道能量,产生(S5)所述音频输入通道的至少一个能量表示;-对所述至少一个能量表示进行编码(S6);以及-通过至少包括所述第二编码过程在内的所述编码过程中的至少一个,产生(S7)残余误差信号;-在第三编码过程中执行(S8)对所述残余误差信号的残余编码。

【技术特征摘要】
【国外来华专利技术】US61/104,4042008年10月10日1.一种基于对具有至少两个通道的多通道音频信号的音频输入通道组的信号表示进行操作的整体编码过程的音频编码方法,其中,所述音频编码方法包括以下步骤-执行(Si)第一编码过程,用于对所述音频输入通道组的包括缩混信号的第一信号表示进行编码;-执行(S》与所述第一编码过程相关的本地合成,以产生包括所述第一编码过程的编码误差的表示在内的本地解码的缩混信号;-至少使用所述本地解码的缩混信号作为输入,执行(S3)第二编码过程,用于对所述音频输入通道组的第二表示进行编码;-估计(S4)所述音频输入通道的输入通道能量;-基于所述音频输入通道的估计出的输入通道能量,产生(SO所述音频输入通道的至少一个能量表示;-对所述至少一个能量表示进行编码(S6);以及-通过至少包括所述第二编码过程在内的所述编码过程中的至少一个,产生(S7)残余误差信号;-在第三编码过程中执行(S8)对所述残余误差信号的残余编码。2.根据权利要求1所述的音频编码方法,其中,所述至少一个能量表示使解码侧的输出通道的能量能够与估计出的输入通道能量相匹配。3.根据权利要求2所述的音频编码方法,其中,所述至少一个能量表示使输出通道和输入通道在能量和质量方面能够匹配。4.根据权利要求1所述的音频编码方法,其中,在所述第二编码过程中执行产生至少一个能量表示和对所述至少一个能量表示进行编码的所述步骤(S5、S6)。5.根据权利要求4所述的音频编码方法,其中,针对至少一个频带中的多个帧中的每一个帧,执行产生至少一个能量表示和对所述至少一个能量表示进行编码的所述步骤(S5、 S6)。6.根据权利要求1所述的音频编码方法,其中,所述第一编码过程是缩混编码过程,所述第二编码过程基于用于产生至少一个预测通道的通道预测,以及产生残余误差信号的所述步骤(S7)包括产生残余预测误差信号的步骤。7.根据权利要求6所述的音频编码方法,其中,在所述第二编码过程中将所估计出的输入通道能量和所述通道预测的预测参数进行联合表示和编码。8.根据权利要求6所述的音频编码方法,其中,产生至少一个能量表示的所述步骤 (S5)包括以下步骤-确定通道能量电平差; -确定通道能量电平和;以及-基于所述通道能量电平和以及来自与所述第一编码过程相关的所述本地合成的所述本地解码的缩混信号的能量,确定delta能量度量,其中,对所述至少一个能量表示进行编码的所述步骤(S6)包括以下步骤 -对所述通道能量电平差进行量化;以及 -对所述delta能量度量进行量化。9.根据权利要求8所述的音频编码方法,其中,所述通道预测基于未量化的通道预测参数。10.根据权利要求6所述的音频编码方法,其中,产生至少一个能量表示的所述步骤 (S5)包括以下步骤-确定通道能量电平差; -确定通道能量电平和;-基于所述通道能量电平和以及来自与所述第一编码过程相关的所述本地合成的所述本地解码的缩混信号的能量,确定delta能量度量,-基于所述delta能量度量以及由所述本地解码的缩混信号的能量所归一化的预测通道的能量,确定归一化能量补偿参数;其中,对所述至少一个能量表示进行编码的所述步骤(S6)包括以下步骤 -对所述通道能量电平差进行量化;以及 -对所述归一化能量补偿参数进行量化。11.根据权利要求10所述的音频编码方法,其中,所述通道预测基于从量化的通道能量电平差导出的量化通道预测参数。12.根据权利要求6所述的音频编码方法,其中,产生至少一个能量表示的所述步骤 (S5)包括以下步骤-确定通道能量电平差;以及 -确定能量归一化输入通道互相关参数;其中,对所述至少一个能量表示进行编码的所述步骤(S6)包括以下步骤 -对所述通道能量电平差进行量化;以及 -对所述能量归一化输入通道互相关参数进行量化。13.根据权利要求12所述的音频编码方法,其中,所述通道预测基于从量化的通道能量电平差和量化的能量归一化输入通道互相关参数导出的量化通道预测参数。14.一种对具有至少两个通道的多通道音频信号的音频输入通道组的信号表示进行操作的音频编码器设备(100),其中,所述音频编码器设备(100)包括-第一编码器(130),用于在第一编码过程中对所述音频输入通道组的包括缩混信号的第一表示进行编码;-本地合成器(132),用于执行与所述第一编码过程相关的本地合成,以产生包括所述第一编码过程的编码误差的表示在内的本地解码的缩混信号;-第二编码器(140),用于至少使用所述本地解码的缩混信号作为输入,在第二编码过程中对所述音频输入通道组的第二表示进行编码;-能量估计器(142),用于估计所述音频输入通道的输入通道能量; -能量表示产生器(144),用于基于所述音频输入通道的估计出的输入通道能量,产生所述音频输入通道的至少一个能量表示;-能量表示编码器(146),用于对所述至少一个能量表示进行编码; -残余产生器(15 ,用于通过至少包括所述第二编码过程在内的所述编码过程中的至少一个,产生残余误差信号;以及-残余编码器(160),用于在第三编码过程中执行对所述残余误差信号的残余编码。15.根据权利要求14所述的音频编码器设备,其中,所述能量表示产生器(144)被配置为产生至少一个能量表示,以使解码侧的输出通道的能量能够与估计出的输入通道能量相匹配。16.根据权利要求15所述的音频编码器设备,其中,所述能量表示产生器(144)被配置为产生至少一个能量表示,以使输出通道和输入通道在能量和质量方面能够匹配。17.根据权利要求14所述的音频编码器设备,其中,在所述第二编码器(140)中实现所述能量表示产生器(144)和所述能量表示编码器(146)。18.根据权利要求17所述的音频编码器设备,其中,所述能量表示产生器(144)和所述能量表示编码器(146)被配置为针对至少一个频带中的多个帧中的每一个帧,产生并编码所述至少一个能量表示。19.根据权利要求14所述的音频编码器设备,其中,所述第一编码器(130)是缩混编码器,所述第二编码器(140)是被配置为基于通道预测进行操作以产生至少一个预测通道的参数化编码器,以及所述残余产生器(15 被配置为产生残余预测误差信号。20.根据权利要求19所述的音频编码器设备,其中,所述第二编码器(140)被配置为对所估计出的输入通道能量和所述通道预测的预测参数进行联合表示和编码。21.根据权利要求19所述的音频编码器设备,其中,所述能量表示产生器(144)包括 -确定器,用于确定通道能量电平差;-确定器,用于确定通道能量电平和;以及-确定器,用于基于所述通道能量电平和以及来自与所述第一编码过程相关的所述本地合成的所述本地解码的缩混信号的能量,确定delta能量度量, 其中,所述能量表示编码器(146)包括 -量化器,用于对所述通道能量电平差进行量化;以及 -量化器,用于对所述delta能量度量进行量化。22.根据权利要求21所述的音频编码器设备,其中,所述第二编码器(140)被配置为基于未量化的通道预测参数来执行通道预测。23.根据权利要求19所述的音频编码器设备,其中,所述能量表示产生器(144)包括 -确定器,用于确定通道能量电平差;-确定器,用于确定通道能量电平和;-确定器,用于基于所述通道能量电平和以及来自与所述第一编码过程相关的所述本地合成的所述本地解码的缩混信号的能量,确定delta能量度量,-确定器,用于基于所述delta能量度量以及由所述本地解码的缩混信号的能量所归一化的预测通道的能量,确定归一化能量补偿参数; 其中,所述能量表示编码器(146)包括 -量化器,用于对所述通道能量电平差进行量化;以及 -量化器,用于对所述归一化能量补偿参数进行量化。24.根据权利要求23所述的音频编码器设备,其中,所述第二编码器(140)被配置为基于从量化的通道能量电平差导出的量化通道预测参数来执行通道预测。25.根据权利要求19所述的音频编码器设备,其中,所述能量表示产生器(144)包括 -确定器,用于确定通道能量电平差;以及-确定器,用于确定能量归一化输入通道互相关参数;其中,所述能量表示编码器(146)包括-量化器,用于对所述通道能量电平差进行量化;以及-量化器,用于对所述能量归一化输入通道互相关参数进行量化。26.根据权利要求25所述的音频编码器设备,其中,所述第二编码器(140)被配置为基于从量化的通道能量电平差和量化的能量归一化输入通道互相关参数导出的量化通道预测参数来执行通道预测。27.一种基于对呼入比特流进行操作以重构具有至少两个通道的多通道音频信号的整体解码过程的音频解码方法,其中,所述方法包括以下步骤-执行(Sll)第一解码过程,以基于所述呼入比特流的第一部分,产生包括解码缩混信号的至少一个第一解码通道表示;-执行(Si》第二解码过程,以基于所述解码缩混信号的估计能量以及表示音频输入通道的至少一个能量表示的所述呼入比特流的第二部分,产生至少一个第二解码通道表示;-基于所述解码的缩混信号的估计能量和表示音频输入通道的至少一个能量表示的所述呼入比特流的所述第二部分,估计(SU)音频输入通道的输入通道能量;-在第三解码过程中,基于表示残余误差信号信息的所述呼入比特流的第三部分,执行 (S14)残余解码以产生残余误差信号;-将所述残余误差信号和来自至少包括所述第二解码过程的所述第一和第二解码过程中的至少一个解码过程的解码通道表示进行组合,以及至少部分地基于估计出的输入通道能量来执行通道能量补偿,以产生所述多通道音频信号(S15)。28.根据权利要求27所述的音频解码方法,其中,执行所述能量补偿,以将所述多通道音频信号的输出通道的能量与估计出的输入通道能量进行匹配。29.根据权利要求观所述的音频解码方法,其中,将所述多通道音频信号的输出通道与编码侧的相应输入通道在能量和质量方面相匹配,其中...

【专利技术属性】
技术研发人员:艾力克·诺维尔
申请(专利权)人:艾利森电话股份有限公司
类型:发明
国别省市:SE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1