语音编码装置和语音编码方法制造方法及图纸

技术编号:3420822 阅读:140 留言:0更新日期:2012-04-11 18:40
能够将延迟量抑制为低延迟,并且能够减轻连接失真的语音编码装置。在该装置中,在长分析单元(21),由窗口乘法单元(211)对分析长度M1的长分析帧信号乘以分析窗口,并将乘以了该分析窗口的信号输出到MDCT单元(212),由MDCT单元(212)对所输入的信号进行MDCT而获得长分析帧的变换系数,并输出到变换系数编码单元(30)。另一方面,在短分析单元(22),窗口乘法单元(221)对分析长度M2(M2<M1)的短分析帧信号乘以分析窗口,并将乘以了该分析窗口的信号输出到MDCT单元(222),由MDCT单元(222)对所输入的信号进行MDCT而获得短分析帧的变换系数,并输出到变换系数编码单元(30)。变换系数编码单元(30)对这些变换系数进行编码并输出。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及。
技术介绍
在语音编码中,将时间信号变换到频域并对变换系数进行编码的变换编码,能够有效率地去除时间信号所包含的冗余性。另外,在变换编码,通过利用以频带表示的人的听觉特性,即使为低比特率,也能够实现难以感觉到量化失真的编码。近年来,在变换编码中,多利用被称为重叠正交变换(LOT;LappedOrthogonal Transform)的变换技术。这种技术是基于除了块内的正交性以外还考虑与相邻块之间的正交性的正交基,进行变换的技术,作为其代表的方法,可以举MDCT(Modified Discrete Cosine Transform)。在MDCT,以当前的分析帧和其前后的分析帧重叠的方式配置分析帧而进行分析。这时,变换后的系数中,只将分析长度的一半的系数作为编码对象即可,因此通过利用MDCT能够有效率地进行编码。并且,在合成时将当前帧与相邻的帧重叠相加,因此有以下特点,即,即使在对每个帧发生不同的量化失真的情况下,也难以发生在帧边界的间断。一般来说,在利用MDCT进行分析/合成时,将作为窗口函数的分析窗口和合成窗口分别与对象信号相乘。这时所使用的分析窗口/合成窗口与相邻帧重叠的位置的部分倾斜(slope)。该重叠区间的长度(即,斜坡长)与输入帧的缓存所需的延迟相当于因MDCT分析/合成而发生的延迟的长度。在双向通信中,如果该延迟变大,使得来自通信对方终端的响应达到本终端为止要费较长时间,无法形成流畅的会话。因此期望延迟尽量短。下面,说明现有的MDCT。在MDCT所使用的分析窗口/合成窗口,在满足式(1)所示的条件时,能够实现完全重构(在没有量化失真的前提下,变换造成的失真为0)。(式1) win(i)·wout(i)+win(i+N/2)·wout(i+N/2)=1(0≤i<N)作为满足式(1)的条件的有代表性的窗口,在非专利文献1提出了式(2)所示的正弦窗口。另外,图1是用图表示该正弦窗口的图。在使用这样的正弦窗口时,因为正弦窗口的谱特性能够充分的衰减旁瓣,所以能够以较高的精度分析频谱。(式2)w(i)=sin(iπN)]]>(0≤i<N)另外,在非专利文献2提出了使用式(3)所示的窗口作为满足式(1)的条件的窗口,来进行MDCT分析/合成的方法。其中,N表示分析窗口的长度,L表示重叠区间的长度。另外,图2是用图表示式(3)所示的窗口的图。在使用这种窗口时,因为重叠区间为L,所以由该窗口产生的延迟表示为L。因此,通过将重叠区间L设定得短,能够抑制延迟的发生。(式3)w(i)=00≤i<14N-12Lcos(π·(i-N/4-L/2)2L)14N-12L≤i<14N+12L114N+12L≤i<34N-12Lcos(π·(i-3N/4+L/2)2L)34N-12L≤i<34N+12L034N+12L≤i<N]]>(非专利文献1)守谷健弘著,“音声符号化”,(社)电子情报通信学会,1998年10月20日,pp.36-38(非专利文献2)M.Iwadare,et al.,“A 128 kb/s Hi-Fi Audio CODEC Basedon Adaptive Transform Coding with Adaptive Block Size MDCT,”IEEE Journalon Selected Areas in Communications,Vol.10,No.1,pp.138-144,Jan.1992.
技术实现思路
本专利技术需要解决的问题在使用式(2)所示的正弦窗口时,如图1所示,相邻的分析帧的重叠区间为分析帧的1/2的长度。在本例子中,因为分析帧长为N,所以重叠区间为N/2。因此,在合成端,合成位于N/2~N-1的信号时,除非获得下一个分析帧的信息,否则无法合成信号。也就是说,直到获得位于(3N/2)-1的采样值为止,不能在下一个分析帧进行MDCT分析,获得(3N/2)-1的位置的样本后,才能在下一个分析帧进行MDCT分析,能够使用该分析帧的变换系数来合成N/2~N-1的信号。因此,在使用正弦窗口时,发生N/2长度的延迟。另一方面,在使用式(3)所示的窗口时,由于重叠区间L较短,容易发生帧间的间断。对当前分析帧和下一个分析帧分别进行MDCT分析并量化其变换系数时,因为分别独立进行量化,在当前分析帧和下分析帧分别发生不同的量化失真。将附加了量化失真的变换系数逆变换到时域的话,对该时间信号在整个合成帧附加量化失真。也就是说,无相关地发生当前的合成帧的量化失真和下一个合成帧的量化失真。因此,在重叠区间较短时,在合成帧间的相邻部分,不能充分的吸收起因于量化失真的解码信号的间断性,而会感觉到帧间的连接失真。使重叠区间越短,这种倾向越显著地发生。本专利技术的目的为提供能够将延迟量抑制为低延迟,并且能够减轻连接失真的。解决问题的方案本专利技术的语音编码装置所采用的结构包括第一分析单元,对时域的语音信号的一帧按较长的分析长度和较短的分析长度两者进行MDCT分析,从而获得频域的两种变换系数;以及编码单元,对所述两种变换系数进行编码。专利技术的有益效果根据本专利技术,能够将延迟量抑制为低延迟,并且能够减轻连接失真。附图说明图1是表示以往的分析窗口的图。图2是表示以往的分析窗口的图。图3是表示本专利技术实施方式1的语音编码装置和语音解码装置的结构的图。图4是表示本专利技术实施方式1的语音编码装置的结构的方框图。图5是本专利技术实施方式1的语音编码装置的信号状态转移图。图6是表示本专利技术实施方式1的分析窗口的图。图7是表示本专利技术实施方式1的语音解码装置的结构的方框图。图8是本专利技术实施方式1的语音解码装置的信号状态转移图。图9是本专利技术实施方式1的语音编码装置的动作说明图。图10是表示本专利技术实施方式1的分析窗口的图。图11是表示本专利技术实施方式1的分析窗口的图。图12是表示本专利技术实施方式2的分析窗口的图。图13是表示本专利技术实施方式2的语音编码装置的结构的方框图。图14是表示本专利技术实施方式2的语音解码装置的结构的方框图。具体实施例方式下面,参照附图详细地说明本专利技术的实施方式。(实施方式1)本专利技术实施方式1的语音编码装置和语音解码装置的结构为如图3所示。如该图所示,语音编码装置包括帧构成单元10、分析单元20和变换系数编码单元30。另外,语音解码装置包括变换系数解码单元50、合成单元60和帧连接单元70。在语音编码装置中,帧构成单元10对所输入的时域的语音信号进行帧化。分析单元20将所帧化的时域的语音信号通过MDCT分析而变换到频域信号。变换系数编码单元30对由分析单元20获得的变换系数进行编码,并输出编码参数。该编码参数通过传输路径被发送到语音解码装置。在语音解码装置中,变换系数解码单元50对通过传输路径发送来的编码参数进行解码。合成单元60通过MDCT合成,由解码的变换系数生成时域信号。帧连接单元70连接时域信号以在相邻的帧间不产生间断,并输出解码语音信号。接着,进一步详细地说明本文档来自技高网
...

【技术保护点】
一种语音编码装置,包括:第一分析单元,对时域的语音信号的一帧按较长的分析长度和较短的分析长度两者进行MDCT分析,从而获得频域的两种变换系数;以及编码单元,对上述两种变换系数进行编码。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:押切正浩
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1