语音编码装置和语音编码方法制造方法及图纸

技术编号:3044987 阅读:175 留言:0更新日期:2012-04-11 18:40
能够由立体声信号生成适当的单声道信号,从而抑制单声道信号的编码效率降低的语音编码装置。在该装置的单声道信号生成单元(101)中,信道间预测分析单元(201)求预测参数,该预测参数基于第1ch语音信号与第2ch语音信号之间的延迟差和振幅比;中间预测参数生成单元(202)求预测参数的中间的参数(称为中间预测参数),以使最终生成的单声道信号为第1ch语音信号和第2ch语音信号的中间的信号;单声道信号计算单元(203)使用中间预测参数来计算单声道信号。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及,特别涉及由立体声的语音输入信号生成单声道信号并对其进行编码的。
技术介绍
随着在移动通信和IP通信中的传输频带的宽带化以及服务的多样化,在语音通信中,对高音质化和更富于现场感的需求日益增高。例如,今后可以预料对下述的服务的需求会增多,即,电视电话服务中的免提(Handsfree)形式的通话、在电视会议中的语音通信、例如在多个地点多个说话者同时进行会话等的多地点语音通信、在保持现场感的同时能够传输周围的声音环境的语音通信等的服务。那时,人们期待例如比单声道信号更富于现场感并能够认识多个说话者的说话位置的使用立体声语音的语音通信的实现。为了实现这样的使用立体声语音的语音通信,必须进行对立体声语音的编码。另外,在IP网络上的语音数据通信中,为了实现网络上的业务控制和组播通信,具有可扩展结构的语音编码备受期望。可扩展结构是指在接收端即使由一部分编码数据也可进行语音数据的解码的结构。因此,在对立体声语音进行编码并传输时,也人们期望具有在单声道/立体声之间的可扩展结构(单声道/立体声可扩展结构)的编码,其可以在接收端选择立体声信号的解码或使用一部分编码数据的单声道信号的解码。在这样的具有单声道/立体声可扩展结构的语音编码中,由立体声的输入信号生成单声道信号。作为单声道信号的生成方法,例如有对立体声信号双方的信道(以下适宜地简写为”ch”)的信号进行平均而获得单声道信号的方法(参照非专利文献1)。(非专利文献1)ISO/IEC 14496-3,”Information Technology-Coding ofaudio-visual objects-Part 3Audio”,subpart-4,4.B.14 Scalable AAC with corecoder,pp.304-305,Sep.2000.
技术实现思路
本专利技术需要解决的问题然而,在简单地对立体声信号双方的信道的信号进行平均而生成单声道信号时,尤其在语音方面,有可能成为对于所输入的立体声信号产生了失真的单声道信号,或成为波形形状与所输入的立体声信号极为不同的单声道信号。也就是说,有可能传输本该传输的输入信号恶化后的信号,或者传输与本该传输的输入信号不同的信号。并且,在将对输入的立体声信号产生了失真的单声道信号或波形形状与被输入的立体声信号极为不同的单声道信号以CELP编码等的适合于语音信号固有的特性的编码模式进行编码时,不同于语音信号固有的特性的复杂的信号成为编码对象,其结果,导致编码效率的降低。本专利技术的目的是提供,它能够由立体声信号生成适当的单声道信号,从而抑制单声道信号的编码效率的降低。解决问题的方案本专利技术的语音编码装置所采用的结构包括第一生成单元,以包含第一信道信号和第二信道信号的立体声信号作为输入信号,基于所述第一信道信号与所述第二信道信号之间的时间差以及所述第一信道信号与所述第二信道信号的振幅比,由所述第一信道信号和所述第二信道信号生成单声道信号;以及编码单元,对所述单声道信号进行编码。本专利技术的有益效果根据本专利技术,能够由立体声信号生成适当的单声道信号,从而抑制单声道信号的编码效率的降低。附图说明图1是表示本专利技术实施方式1的语音编码装置的结构的方框图。图2是表示本专利技术实施方式1的单声道信号生成单元的结构的方框图。图3是本专利技术实施方式1的信号波形图。图4是表示本专利技术实施方式1的单声道信号生成单元的结构的方框图。图5是表示本专利技术实施方式2的语音编码装置的结构的方框图。图6是表示本专利技术实施方式2的第1ch、第2ch预测信号合成单元的结构的方框图。图7是表示本专利技术实施方式2的第1ch、第2ch预测信号合成单元的结构的方框图。图8是表示本专利技术实施方式2的语音解码装置的结构的方框图。图9是表示本专利技术实施方式3的语音编码装置的结构的方框图。图10是表示本专利技术实施方式4的单声道信号生成单元的结构的方框图。图11是表示本专利技术实施方式5的语音编码装置的结构的方框图。图12是表示本专利技术实施方式5的语音解码装置的结构的方框图。具体实施例方式下面,参照附图详细地说明本专利技术的实施方式。另外,在以下的说明中,将以帧为单位的动作作为前提进行说明。(实施方式1)图1表示本实施方式的语音编码装置的结构。图1所示的语音编码装置10包括单声道信号生成单元101和单声道信号编码单元102。单声道信号生成单元101由立体声的输入语音信号(第1ch语音信号和第2ch语音信号)生成单声道信号,并输出到单声道信号编码单元102。单声道信号生成单元101的详细说明将后述。单声道信号编码单元102对单声道信号进行编码并输出单声道信号编码数据,即对于单声道信号的语音编码数据。单声道信号编码单元102可以使用任意的编码方式对单声道信号进行编码。例如,可以使用以适合于语音信号的有效率的编码的CELP编码为基础的编码方式。另外,还可以使用其它语音编码方式,或者以AAC(Advanced Audio Coding)为代表的音频编码方式。接着,使用图2说明单声道信号生成单元101的详细情况。如该图所示,单声道信号生成单元101包括信道间预测分析单元201、中间预测参数生成单元202以及单声道信号计算单元203。信号间预测分析单元201,从第1ch语音信号和第2ch语音信号通过分析而求两信道间的预测参数。该预测参数是利用第1ch语音信号和第2ch语音信号之间的相关性而实现信道信号间的相互预测的参数,是基于两信道间的延迟差和振幅比的参数。具体来说,在以式(1)和式(2)表示从第2ch语音信号s_ch2(n)预测到的第1ch语音信号sp_ch1(n),以及从第1ch语音信号s_ch1(n)预测到的第2ch语音信号sp_ch2(n)时,以信道间的相互的延迟差D12、D21以及振幅比(以帧为单位的平均振幅的比)g12、g21作为预测参数。sp_ch1(n)=g21·s_ch2(n-D21)其中,n=0~NF-1 ...式(1)sp_ch2(n)=g12·s_ch1(n-D12)其中,n=0~NF-1 ...式(2)其中,sp_ch1(n)是第1ch的预测信号,g21是第1ch输入信号相对于第2ch输入信号的振幅比,s_ch2(n)是第2ch的输入信号,D21是第1ch输入信号相对于第2ch输入信号的延迟时间差,sp_ch2(n)是第2ch的预测信号,g12是第2ch输入信号相对于第1ch输入信号的振幅比,s_ch1(n)是第1ch的输入信号,D12是第2ch输入信号相对于第1ch输入信号的延迟时间差,NF是帧长度。然后,信道间预测分析单元201求使以式(3)和(4)表示的失真最小的预测参数g21、D21、g12和D12,并输出到中间预测参数生成单元202。该失真是各个信道的输入语音信号s_ch1(n)、s_ch2(n)(n=0~NF-1)与通过式(1)和(2)所预测的各个信道的预测信号sp_ch1(n)、sp_ch2(n)之间的失真Dist1和Dist2。Dist1=Σn=0NF-1{s_ch1(n)-sp_ch1(n)}2]]>...式(3)Dist2=Σn=0NF-1{s_ch2(n)-sp_ch2(n)}2]]>...式(4)另本文档来自技高网
...

【技术保护点】
一种语音编码装置,包括:第一生成单元,以包含第一信道信号和第二信道信号的立体声信号作为输入信号,基于所述第一信道信号与所述第二信道信号之间的时间差,以及所述第一信道信号与所述第二信道信号的振幅比,由所述第一信道信号和所述第二信道信号生成单声道信号;以及编码单元,对所述单声道信号进行编码。

【技术特征摘要】
【国外来华专利技术】JP 2004-12-28 380980/2004;JP 2005-5-30 157808/20051.一种语音编码装置,包括第一生成单元,以包含第一信道信号和第二信道信号的立体声信号作为输入信号,基于所述第一信道信号与所述第二信道信号之间的时间差,以及所述第一信道信号与所述第二信道信号的振幅比,由所述第一信道信号和所述第二信道信号生成单声道信号;以及编码单元,对所述单声道信号进行编码。2.如权利要求1所述的语音编码装置,其中,还包括第二生成单元,以所述立体声信号作为输入信号,对所述第一信道信号和所述第二信道信号进行平均而生成单声道信号;以及切换单元,基于所述第一信道信号和所述第二信道信号之间的相关度,在所述第一生成单元和所述第二生成单元之间切换所述立体声信号的输入目的地。3.如权利要求1所述的语音编码...

【专利技术属性】
技术研发人员:吉田幸司后藤道代
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:JP[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利