语音编码装置和语音编码方法制造方法及图纸

技术编号:3044785 阅读:199 留言:0更新日期:2012-04-11 18:40
即使在立体声语音的多个声道之间的相关较小的情况下也能够高效率地对立体声语音进行编码的语音编码装置。在该装置中,单声道信号生成单元(110)使用立体声信号所包含的第1声道信号和第2声道信号生成单声道信号。编码声道选择单元(120)选择第1声道信号或第2声道信号。包含单声道信号编码单元(112)、第1ch编码单元(122)、第2ch编码单元(124)以及开关单元(126)的编码单元,将所生成的单声道信号编码而获得核心层编码数据,同时将所选择的声道信号编码而获得与核心层编码数据对应的增强层编码数据。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及,特别涉及用于立体声语音的 。
技术介绍
随着移动通信或IP通信中的传输频带的宽频化、服务的多样化,在语音 通信中,对高质量化、富于临场感化的需求提高。例如,预计今后电视电话服务中的免提(hands free)方式的通话、电视会议中的语音通信、多个通话 者在多个地点同时进行会话的多地点语音通信、能够在保持临场感的同时传 输周围的声音环境的语音通信等的需要增加。在该情况下,期望实现比单声 道信号富有临场感,而且能够识别多个通话者的讲话位置的基于立体声语音 的语音通信。为了实现这样的基于立体声语音的语音通信,必须将立体声语 音编码。此外,在IP网络上的语音数据通信中,为了实现网络上的通信量控制和 组播通信,期望具有可伸缩(scalable)的结构的语音编码方式。可伸缩的结 构是指在接收端即使从一部分的编码数据也能够进行语音数据的解码的结 构。具有可伸缩的结构的语音编码方式中的编码处理已被分层化,包含与核 心层对应的处理和与增强层对应的处理。因此,通过该编码处理所生成的编 码数据也包含核心层的编码数据和增强层的编码数据。期望具有在将立体声语音编码并传输的情况下也能够在接收端选择立体 声信号的解码和使用了 一部分的编码数据的单声道信号的解码的、单声道-立体声之间的可伸缩结构(单声道/立体声可伸缩结构)的语音编码方式。作为基于这样的语音编码方式的语音编码方法,例如有通过声道相互间 的音调(pitch)预测来进行声道(以下有时筒称为ch)之间的信号预测(从 第lch信号预测第2ch信号或从第2ch信号预测第lch信号),即利用两个声 道之间的相关来进行编码的方法(参照非专利文献1 )。非专利文南史1: Ramprashad, S.A., tereophonic CELP coding using crosschannel prediction, Proc. IEEE Workshop on Speech Coding, pp.136-138, Sep. 2000.
技术实现思路
专利技术要解决的问题但是,在上述现有的语音编码方法中,在双方的声道之间的相关较小的 情况下,有时不能获得充分的预测性能(预测增益),编码效率劣化。本专利技术的目的在于,提供即使在双方的声道之间的相关较小的情况下也 能够高效率地对立体声语音进行编码的。解决该问题的方案本专利技术的语音编码装置对包含第1声道信号和第2声道信号的立体声信 号进行编码,该语音编码装置采用的结构包括单声道信号生成单元,使用 所述第1声道信号和所述第2声道信号来生成单声道信号;选择单元,选择 所述第1声道信号或所述第2声道信号;以及编码单元,将所生成的单声道 信号编码而获得核心层编码数据,同时将所选择的声道信号编码而获得与所 述核心层编码数据对应的增强层编码数据。本专利技术的语音编码方法为对包含第1声道信号和第2声道信号的立体声 信号进行编码,在该语音编码方法中,使用所述第1声道信号和所述第2声 道信号来生成单声道信号;选择所述第1声道信号或所述第2声道信号;以 及将所生成的单声道信号编码而获得核心层编码数据,同时将所选择的声道 信号编码而获得与所述核心层编码数据对应的增强层编码数据。专利技术的有益效果根据本专利技术,即使在立体声信号的多个声道信号之间的相关小的情况下 也能够高效率地对立体声语音进行编码。附图说明图1是表示本专利技术实施方式1的语音编码装置的结构的方框图; 图2是表示本专利技术实施方式1的语音解码装置的结构的方框图; 图3是表示本专利技术实施方式2的语音编码装置的结构的方框图; 图4是表示本专利技术实施方式3的语音编码装置的结构的方框图; 图5是表示本专利技术实施方式3的编码声道选择单元的结构的方框图6是表示本专利技术实施方式3的第Ach编码单元的结构的方框图; 图7是用于说明本专利技术实施方式3的第A声道的声道内预测緩存器的一 例更新动作的图;图8是用于说明本专利技术实施方式3的第B声道的声道内预测緩存器的一例更新动作的的图;图9是表示本专利技术实施方式4的语音编码装置的结构的方框图; 图10是表示本专利技术实施方式4的第AchCELP编码单元的结构的方框图; 图11是表示本专利技术实施方式4的一例自适应码本更新动作的流程图; 图12是用于说明本专利技术实施方式4的第Ach自适应码本的一例更新动作的图;以及图13是用于说明本专利技术实施方式4的第Bch自适应码本的一例更新动作 的图。具体实施方式以下,参照附图详细说明与具有单声道/立体声可伸缩结构的语音编码有 关的本专利技术的实施方式。 (实施方式1)图1是表示本专利技术的实施方式1的语音编码装置的结构的方框图。图1 的语音编码装置100具有作为与可伸缩结构的核心层对应的结构要素的核心 层编码单元102和作为与可伸缩结构的增强层对应的结构要素的增强层编码 单元104。以下,将各个结构要素以帧为单位进行动作为前提来进行说明。核心层编码单元102具有单声道信号生成单元110和单声道信号编码单 元112。此外,增强层编码单元104具有编码声道选择单元120、第lch编码 单元122、第2ch编码单元124以及开关单元126。在核心层编码单元102中,单声道信号生成单元110根据式(1 )所示的 关系,从立体声输入语音信号所包含的第lch输入语音信号s—chl (n)和第 2ch输入语音信号s—ch2 (n)(其中,n = 0~NF-1; NF为帧长度)生成单声 道信号s—mono (n),并输出到单声道信号编码单元112。这里,本实施方式 中说明的立体声信号由两个声道的信号,即第1声道的信号和第2声道的信 号构成。 <formula>formula see original document page 8</formula>一 2 …式(1 )单声道信号编码单元112对每个帧将单声道信号s—mono(n)编码。编码中 可使用任意的编码方式。将对单声道信号s一mono(n)进行编码而获得的编码数 据作为核心层编码数据输出。更具体地说,将核心层编码数据与后面叙述的 增强层编码数据和编码声道选4奪信息复用,并将其作为发送编码数据从语音 编码装置100输出。此外,单声道信号编码单元112将单声道信号s一mono(n)解码,并将由此 获得的单声道解码语音信号输出到增强层编码单元104的第lch编码单元122 和第2ch编码单元124。在增强层编码单元104中,编码声道选择单元120使用第lch输入语音 信号s一chl(n)和第2ch输入语音信号s—ch2(n),基于预定的选择基准,在第1 声道和第2声道中选择最适合的声道作为增强层上的编码对象的声道。对每 个帧选择最适合的声道。这里,预定的选择基准为用于能够高效率或高音质 (低编码失真)地实现增强层编码的基准。编码声道选择单元120生成表示所选 择的声道的编码声道选择信息。所生成的编码声道选择信息被输出到开关单 元126,同时将其与所述的核心层编码数据和后面叙述的增强层编码数据复 用。另外,编码声道选择单元120也可以使用在第lch编码单元122和第2ch 编码单元124中的编码的过程中所获得的任意的参数或信号、或者编码的结 果(即,后面叙述的第lch编码数据和第2ch编码数据),来代替使用第l输入 语音本文档来自技高网
...

【技术保护点】
一种语音编码装置,其对包含第1声道信号和第2声道信号的立体声信号进行编码,该语音编码装置包括:    单声道信号生成单元,使用所述第1声道信号和所述第2声道信号生成单声道信号;    选择单元,选择所述第1声道信号或所述第2声道信号;以及    编码单元,将所生成的单声道信号编码而获得核心层编码数据,同时将所选择的声道信号编码而获得与所述核心层编码数据对应的增强层编码数据。

【技术特征摘要】
【国外来华专利技术】JP 2005-4-28 132366/20051、一种语音编码装置,其对包含第1声道信号和第2声道信号的立体声信号进行编码,该语音编码装置包括单声道信号生成单元,使用所述第1声道信号和所述第2声道信号生成单声道信号;选择单元,选择所述第1声道信号或所述第2声道信号;以及编码单元,将所生成的单声道信号编码而获得核心层编码数据,同时将所选择的声道信号编码而获得与所述核心层编码数据对应的增强层编码数据。2、 如权利要求1所述的语音编码装置,其中,所述选择单元对每个帧选择所述第1声道信号或所述第2声道信号,的声道信号进行编码。3、 如权利要求1所述的语音编码装置,其中,还包括计算单元,分别计算在选择了所述第1声道信号时所产生的第1编码失 真和在选择了所述第2声道信号时所产生的第2编码失真;以及所述选择单元在计算出的第1编码失真小于计算出的第2编码失真时选 择所述第1声道信号,而在计算出的第2编码失真小于计算出的第1的编码 失真时选择所述第2声道信号。4、 如权利要求3所述的语音编码装置,其中,所述编码单元将所述第1声道信号和所述第2声道信号编码而分别获得 第1编码数据和第2编码数据,并将所述第1编码数据和所述第2编码数据 中被选择的声道信号所对应的编码数据作为所述增强层编码数据输出,该语音编码装置还包括估计信号生成单元,使用所述编码单元将所述单声道信号编码时所获得 的单声道解码信号和所述编码单元将所述第1声道信号编码时所获得的第1 声道解码信号,生成与所述第2声道信号对应的第2声道估计信号,同时使 用所述单声道解码信号和所述编码单元将所述第2声道信号编码时所获得的 第2声道解码信号,生成与所述第1声道信号对应的第1声道估计信号;以 及 失真计算单元,基于相对于所述第1声道信号的所述第1声道解码信号 的误差和相对于所述第2声道信号的所述第2声道估计信号的误差,计算所 述第1编码失真,同时基于相对于所述第1声道信号的所述第1声道估计信号的误差和相对于所述第2声道信号的所述第2声道解码信号的误差,计算 所述第2编码失真。5、 如权利...

【专利技术属性】
技术研发人员:吉田幸司
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1