一种语音解码方法及装置制造方法及图纸

技术编号:4324814 阅读:208 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种语音解码方法及装置,该方法包括利用为窄频带的当前帧的低频带频谱生成当前帧的高频带频谱;根据一定的判断条件判断该窄带帧是否需要修正,需要修正时,修正该窄带帧的高频带频谱;将根据判断结果进行处理后的当前帧从频域信号变换为时域信号;利用当前帧的衰减因子对当前帧时域信号的高频时域信号进行衰减后,输出当前帧的时域信号。相应的,本发明专利技术还公开了一种语音解码装置,包括扩展单元、第一修正处理单元、变换单元和衰减单元。本发明专利技术实施例通过一种语音解码方法及装置,很好地解决了因不同带宽的语音信号导致听觉上不舒适的问题,提高了语音信号的听觉质量。

【技术实现步骤摘要】

本专利技术涉及通信技术,尤其涉及一种语音解码方法及装置
技术介绍
针对目前的多速率语音频编解码算法,编码后的码流在网络传输过程中,由于网络状态的不同,网络会对从编码端传输到网络的码流做不同长度的截断。在解码端,解码器就会根据截断后的码流解码出不同带宽或码率的语音频信号,这样就使得接收到的语音频信号会在不同带宽间切换。 由于解码器中的滤波器状态参数和前后语音频信号之间的联系,带宽切换时,会造成滤波器状态参数不连续,如果不及时地做一些适当的处理,则在带宽切换过程中会出现一些能量激变的现象,从而造成听觉质量变差;而且,当连续信号中出现不同的频带宽度时,也会造成不舒服的听觉效果。 现有技术中存在一种频带扩展(Bandwidth Extension, BWE)技术,其将窄频带信号扩展到宽频带信号的方式为其将当前帧的低频带频谱复制到高频带,然后通过一些参数修正当前帧的低频带频谱,从而使低频带频谱能量更符合高频带频谱的能量。目前,频带扩展技术中,一般地从当前帧的低频信息中获取一些参数信息或从编码端传输少量的当前帧的高频带参数到解码端,来恢复出当前帧的高频带部分的信号。然而,当宽频带语音信号向为窄频带语音信号切换时,为窄频带语音信号的当前帧,其高频部分没有任何信息,现有的频带扩展技术则不能很好地解决上述因不同带宽的语音信号带来的问题。
技术实现思路
本专利技术实施例提供一种语音解码方法及装置,其能够提高语音信号的听觉质量,避免语言信号解码时,不同带宽的语音信号带来的听觉不舒服的问题。 为此,本专利技术实施例提供了一种语音解码方法,包括 利用为窄频带的当前帧的低频带频谱生成所述当前帧的高频带频谱; 根据所述当前帧的低频带信息和相对于所述当前帧的前一帧的频带信息,判断所述当前帧是否需要修正,如果判断结果为是,则利用修正因子对所述当前帧的高频带频谱进行修正,如果判断结果为否,则对所述当前帧不进行修正; 将根据所述判断结果进行处理后的所述当前帧从频域信号变换为时域信号; 利用所述当前帧的衰减因子对所述当前帧时域信号的高频时域信号进行衰减后,输出所述当前帧的时域信号。 相应地,本专利技术实施例还提供了一种语音解码装置,包括 扩展单元,用于利用为窄频带的当前帧的低频带频谱生成所述当前帧的高频带频谱; 第一修正处理单元,用于根据所述当前帧的低频带信息和相对于所述当前帧的前一帧的频带信息,判断所述当前帧是否需要修正,当判断结果为是时,利用修正因子对所述当前帧的高频带频谱进行修正,当判断结果为否时,对所述当前帧不进行修正; 变换单元,用于将根据所述判断结果进行处理后的当前帧从频域信号变换为时域信号; 衰减单元,用于利用所述当前帧的衰减因子对所述当前帧时域信号的高频时域信 号进行衰减后,输出所述当前帧的时域信号。 本专利技术实施例利用窄频带帧的低频带频谱生成该窄频带帧的高频带频谱,并根据 一定的判断条件判断该窄频带帧是否需要修正,需要修正时,修正该窄频带帧的高频带频 谱,使得将语音信号中的窄频带帧扩展为有效的宽频带帧,很好地解决了因不同带宽的语 音信号导致听觉上不舒适的问题,提高了语音信号的听觉质量。附图说明 图1是本专利技术实施例一的一种语音解码方法的流程示意图; 图2是本专利技术实施例二的一种语音解码方法的流程示意图; 图3是本专利技术实施例的语音解码方法中确定当前帧的衰减因子的流程示意图; 图4是本专利技术实施例三的一种语音解码方法的流程示意图; 图5是本专利技术实施例四的一种语音解码装置的结构示意图; 图6是图5的语音解码装置中的第一修正处理单元的结构示意图; 图7是本专利技术实施例五的一种语音解码装置的结构示意图。具体实施例方式本专利技术实施例提出的一种语音解码方法及装置,其能够提高语音信号的听觉质 量,避免语言信号解码时,不同带宽的语音信号带来的听觉不舒服的问题。 下面将结合附图,以具体实施例的方式详细阐述本专利技术实施例的技术方案。 图1是本专利技术实施例一的一种语音解码方法的流程图。如图1所示,该方法包括 步骤S101、根据为窄频带的当前帧的低频带频谱生成该当前帧的高频带频谱。 步骤S102、根据当前帧的低频带信息和相对于该当前帧的前一帧的频带信息判断 该当前帧是否需要修正。如果判断结果为是,则执行步骤S103后再执行步骤S104。如果判 断结果为否,则执行步骤S104。 在本实施例中,设置前一帧模式位和当前帧模式位,为前一帧模式位设置一个初 始值。具体地,根据前一帧模式位的值、当前帧的低频带信息和相对于该当前帧的前一帧的 频带信息,确定当前帧模式位的值;然后根据当前帧模式位的值判断当前帧是否需要修正。 步骤S103、利用修正因子对当前帧的高频带频谱进行修正。 例如,通过将当前帧的高频带频谱与修正因子相乘,来对当前帧的高频带频谱进 行修正。 在本实施例中,该修正因子的值具体为当前帧的低频带频谱的平均能量值;或者为生成的当前帧的高频带频谱能量与低频带频谱能量的比值再乘以一个小数,使得该修正因子的值小于l,继而使得当前帧的高频带频谱能量值小于其低频带频谱能量值一定的倍数,可选地,使得当前帧的高频带频谱能量值小于其低频带频谱能量值的0. 8倍。 例如,计算一帧信号的高频带频谱能量值的方式有该帧的高频带频谱系数的平方和的均值即为该帧的高频带频谱能量值; 同理,计算一帧信号的低频带频谱能量值的方式有该帧的低频带频谱系数的平方和的均值即为该帧的低频带频谱能量值; 将一帧信号的高频带频谱能量值与该帧的低频带频谱能量值相比所得到的值,即为该帧的高频带频谱能量与低频带频谱能量的比值。 步骤S104、将当前帧从频域信号变换为时域信号。 步骤S105、利用当前帧的衰减因子对当前帧时域信号的高频时域信号进行衰减。 在本实施例中,当前帧的衰减因子根据当前帧的帧类型信息、相对于该当前帧的前一帧的帧类型信息及其衰减因子来确定;对于该当前帧后的每一帧,该帧的衰减因子根据该帧的帧类型信息、相对于该帧的前一帧的帧类型信息及其衰减因子来确定。实施时,将确定出的当前帧的衰减因子与当前帧时域信号的高频时域信号相乘。其中,所述帧类型信息为宽频带帧或窄频带帧。具体实施方式详见图3。 步骤S106、输出当前帧的时域信号。此处,当前帧的时域信号包括其高频时域信号和低频时域信号。 本实施例在语音解码时,且没有为窄频带的当前帧信号的高频部分的任何信息时,避免了由于不同带宽的语音信号之间切换造成的滤波器状态不连续,从而导致的能量激变现象,使得解码出来的连续的语音信号在听觉上更加舒适,提高了主观音质和听觉质 图2是本专利技术实施例二的一种语音解码方法的流程示意图。如图2所示,对接收到的连续的语音信号进行解码,该方法包括 步骤S201、判断当前帧是宽频带帧还是窄频带帧。如果当前帧是宽频带帧,则执行步骤S211。如果当前帧是窄频带帧,则执行步骤S202。 步骤S202、将当前帧的归一化的低频带频谱乘以相对于该当前帧的前一帧的高频带频域包络复制到高频,生成当前帧的高频带频谱,将当前帧由窄频带帧扩展为宽频带帧。 步骤S203、判断相对于该当前帧的前一帧,其原始帧是宽频带帧还是窄频带帧。如果该前一帧的原始帧是宽频带帧,则执行步骤S204后再执行步骤S206。如果该前一帧的原始帧是窄频带帧,则执行步骤S205后再执行步骤本文档来自技高网...

【技术保护点】
一种语音解码方法,包括:利用为窄频带的当前帧的低频带频谱生成所述当前帧的高频带频谱;根据所述当前帧的低频带信息和相对于所述当前帧的前一帧的频带信息,判断所述当前帧是否需要修正,如果判断结果为是,则利用修正因子对所述当前帧的高频带频谱进行修正,如果判断结果为否,则对所述当前帧不进行修正;将根据所述判断结果进行处理后的所述当前帧从频域信号变换为时域信号;利用所述当前帧的衰减因子对所述当前帧时域信号的高频时域信号进行衰减后,输出所述当前帧的时域信号。

【技术特征摘要】
一种语音解码方法,包括利用为窄频带的当前帧的低频带频谱生成所述当前帧的高频带频谱;根据所述当前帧的低频带信息和相对于所述当前帧的前一帧的频带信息,判断所述当前帧是否需要修正,如果判断结果为是,则利用修正因子对所述当前帧的高频带频谱进行修正,如果判断结果为否,则对所述当前帧不进行修正;将根据所述判断结果进行处理后的所述当前帧从频域信号变换为时域信号;利用所述当前帧的衰减因子对所述当前帧时域信号的高频时域信号进行衰减后,输出所述当前帧的时域信号。2. 如权利要求1所述的方法,其特征在于,所述相对于所述当前帧的前一帧为宽频带帧。3. 如权利要求2所述的方法,其特征在于,所述利用为窄频带的当前帧的低频带频谱 生成所述当前帧的高频带频谱具体为将所述当前帧的归一化的低频带频谱乘以相对于所 述当前帧的前一帧的高频带频域包络复制到高频,生成所述当前帧的高频带频谱;所述根据所述当前帧的低频带信息和相对于所述当前帧的前一帧的频带信息,判断所 述当前帧是否需要修正,包括用前一帧模式位的值、根据所述前一帧的频带信息计算出的所述前一帧的低频带频谱 能量值和高频带频谱能量值,及根据所述当前帧的低频带信息计算出的所述当前帧的低频 带频谱能量值和高频带频谱能量值,确定当前帧模式位的值;根据所述当前帧模式位的值判断出所述当前帧是否需要修正。4. 根据权利要求2所述的方法,其特征在于,所述利用为窄频带的当前帧的低频带频 谱生成所述当前帧的高频带频谱具体为将所述当前帧的低频带频谱直接复制到高频,生 成所述当前帧的高频带频谱;所述根据所述当前帧的低频带信息和相对于所述当前帧的前一帧的频带信息,判断所 述当前帧是否需要修正,包括用前一帧模式位的值、根据所述前一帧的频带信息计算出的所述前一帧的低频带频谱 能量值和高频带频谱能量值、及根据所述当前帧的低频带信息计算出的所述当前帧的低频 带频谱能量值,确定当前帧模式位的值;根据所述当前帧模式位的值判断出所述当前帧是否需要修正。5. 如权利要求4所述的方法,其特征在于,所述将根据所述判断结果进行处理后的当 前帧从频域信号变换为时域信号,还包括如果根据所述判断结果对所述当前帧的高频带频谱不进行修正,则将当前帧的归一化 的高频带频谱乘以所述前一帧的高频带频域包络后,将该当前帧从频域信号变换为时域信 号。6. 如权利要求2所述的方法,其特征在于,所述方法进一步包括对于所述为窄频带的当前帧后的每一帧,判断该帧是否为窄带帧,如果是,利用所述该 帧的低频带频谱生成所述该帧的高频带频谱;根据所述该帧的低频带信息和相对于所述该帧的前一帧的频带信息,判断所述该帧是 否需要修正,如果判断结果为是,则利用修正因子对所述该帧的高频带频谱进行修正,如果 判断结果为否,则对所述该帧不进行修正;将根据判断结果进行处理后的所述该帧从频域信号变换为时域信号; 利用所述该帧的衰减因子对所述该帧时域信号的高频时域信号进行衰减后,输出所述 该帧的时域信号。7. 如权利要求6所述的方法,其特征在于,所述当前帧的衰减因子根据所述当前帧的 帧类型信息、所述前一帧的帧类型信息来确定;禾口所述该帧的衰减因子根据所述该帧的帧类型信息、所述相对于该帧的前一帧的帧类型 信息及其衰减因子来确定,所述帧类型信息为宽频带帧或窄频带帧。8. 根据权利要求1所述的方法,其特征在于,所述修正因子的值根据所述当前帧的低 频带信息来确定。9. 一种语音解码装置,其特征在于,包括扩展单元,用于利用为窄频带的当前帧的低频带频谱生成所述当前帧的高频...

【专利技术属性】
技术研发人员:刘泽新胡晨苗磊陈龙吟肖玮哈维米希尔塔迪张清
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1