一种音频信号的时域包络处理方法及装置、编码器制造方法及图纸

技术编号:12875938 阅读:47 留言:0更新日期:2016-02-17 12:16
本发明专利技术实施例提供一种音频信号的时域包络处理方法及装置、编码器。该方法包括:根据接收到的当前帧音频信号,得到所述当前帧音频信号的高带信号;根据预先确定的时域包络个数M将所述当前帧音频信号的高带信号分成M个子帧,其中,M为大于等于2的整数;计算每一个所述子帧的时域包络;采用非对称窗对所述M个子帧中的最前端的子帧和所述M个子帧中的最末端的子帧进行加窗;对所述M个子帧中除所述最前端的子帧和所述最末端的子帧之外的子帧进行加窗。本发明专利技术实施例提供的音频信号的时域包络处理方法及装置,在求解多个时域包络能够很好的保持信号能量的连续,同时降低了计算时域包络的复杂度。

【技术实现步骤摘要】
一种音频信号的时域包络处理方法及装置、编码器
本专利技术实施例涉及通信
,尤其涉及一种音频信号的时域包络处理方法及装置、编码器。
技术介绍
随着语音频压缩技术的高速发展,各种语音频编码算法也相继出现。在语音频编码算法的处理过程中,需要计算时域包络,现有的计算并量化时域包络的过程为:根据事先设定好的计算时域包络的个数M,M为正整数,将预处理后的原始高带信号和预测的高带信号分别分成M个子帧,对子帧进行加窗,然后计算各个子帧内预处理后的原始高带信号和预测的高带信号的能量或幅度比。其中,事先设定好的计算时域包络的个数M是根据前向缓存(lookaheadbuffer)的长度来确定。前向缓存是当前帧为了计算一些参数的需要,将输入信号的最后某些样点缓存不用,在下一帧计算参数时使用,当前帧使用的是前一帧缓存的样点。缓存的这些样点即为前向缓存,缓存的样点的个数即为前向缓存的长度。上述对时域包络的处理过程存在的问题是:在求解时域包络时,利用的都是对称窗,同时为了保证子帧间和帧间的混叠,根据前向缓存(lookahead)的长度计算了多个时域包络。但在计算时域包络时,如果信号的时域分辨率太高,会造成帧内能量的不连续,从而引入很差的听觉感受。
技术实现思路
本专利技术实施例提供一种音频信号的时域包络处理方法及装置、编码器,可解决在计算时域包络时造成的帧内能量的不连续的问题。第一方面,本专利技术实施例提供一种音频信号的时域包络处理方法,包括:根据接收到的当前帧信号,得到所述当前帧信号的高带信号;根据预先确定的时域包络个数M将所述当前帧的高带信号分成M个子帧,其中,M为大于等于2的整数;计算每一个所述子帧的时域包络;其中,所述计算每一个所述子帧的时域包络包括:采用非对称窗对所述M个子帧中的最前端的子帧和所述M个子帧中的最末端的子帧进行加窗;对所述M个子帧中除所述最前端的子帧和所述最末端的子帧之外的子帧进行加窗。根据本专利技术实施例提供的音频信号的时域包络的处理方法,在不同的条件下采用不同的窗长度和/或窗形状求解时域包络,减少因为时域包络差别太大引入的能量不连续的影响,能够提升输出信号的性能。在第一方面的第一种可能的实施方式中,在采用非对称窗对所述M个子帧中的最前端的子帧和所述M个子帧中的最末端的子帧进行加窗之前,所述方法还包括:根据所述当前帧信号的高带信号的前向缓存的长度确定所述非对称窗;或者,根据所述当前帧信号的高带信号的前向缓存的长度和所述时域包络个数M确定所述非对称窗。结合第一方面或第一方面的第一种可能的实施方式,在第一方面的第二种可能的实施方式中,所述对所述M个子帧中除所述最前端的子帧和所述最末端的子帧之外的子帧进行加窗,包括:对所述M个子帧中除最前端的子帧和所述最末端的子帧之外的子帧采用对称窗进行加窗;或者,对所述M个子帧中除最前端的子帧和所述最末端的子帧之外的子帧采用非对称窗进行加窗。结合第一方面,在第一方面的第三种可能的实施方式中,所述非对称窗的窗长与对所述M个子帧中除所述最前端的子帧和所述最末端的子帧之外的子帧进行加窗所采用的窗的窗长相同。结合第一方面的第一种可能的实施方式至第一方面的第三种可能的实施方式任意之一所述的方法,在第一方面的第四种可能的实施方式中,所述根据所述当前帧音频信号的高带信号的前向缓存的长度确定非对称窗,包括:当所述当前帧信号的高带信号的前向缓存的长度小于第一阈值时,根据当前帧的前一帧信号的高带信号和所述当前帧信号的高带信号的前向缓存的长度确定所述非对称窗,其中,所述当前帧的前一帧信号的高带信号的最末端子帧采用的非对称窗和所述当前帧信号的高带信号的最前端子帧采用的非对称窗的混叠部分等于所述当前帧信号的高带信号的前向缓存的长度,所述第一阈值等于所述当前帧的高带信号的帧长除以M。结合第一方面的第一种可能的实施方式至第一方面的第三种可能的实施方式任意之一所述的方法,在第一方面的第五种可能的实施方式中,所述根据所述当前帧信号的高带信号的前向缓存的长度确定非对称窗,包括:当所述当前帧信号的高带信号的前向缓存的长度大于第一阈值时,根据所述当前帧的前一帧信号的高带信号和所述当前帧信号的高带信号的前向缓存的长度确定所述非对称窗,其中,所述当前帧的前一帧信号的高带信号的最末端子帧采用的非对称窗和所述当前帧信号的高带信号的最前端子帧采用的非对称窗的混叠部分等于所述第一阈值,所述第一阈值等于所述当前帧的高带信号的帧长除以M。结合第一方面至第一方面的第五种可能的实施方式任意之一所述的方法,在第一方面的第六种可能的实施方式中,根据下列之一方式确定所述时域包络个数M:根据所述当前帧信号得到所述当前帧信号的低带信号,当所述当前帧信号的低带信号的基音周期大于第二阈值时,M=M1;或者,根据所述当前帧信号得到所述当前帧信号的低带信号,当所述当前帧信号的低带信号的基音周期不大于第二阈值时,M=M2;其中,M1,M2均为正整数,且M2>M1。结合第一方面至第一方面的第五种可能的实施方式任意之一所述的方法,在第一方面的第七种可能的实施方式中,所述方法还包括:根据所述当前帧信号得到所述当前帧信号的低带信号的基音周期;当所述当前帧信号的类型与所述当前帧的前一帧信号的类型相同,且所述当前帧的低带信号的基音周期大于第三阈值时,对每一个所述子帧的时域包络进行平滑处理。第二方面,本专利技术实施例提供一种音频信号的时域包络处理装置,包括:高带信号获取模块,用于根据接收到的当前帧信号,得到所述当前帧信号的高带信号;子帧获取模块,用于根据预先确定的时域包络个数M将所述当前帧的高带信号分成M个子帧,其中,M为大于等于2的整数;时域包络获取模块,用于计算每一个所述子帧的时域包络;其中,所述时域包络获取模块具体用于:采用非对称窗对所述M个子帧中的最前端的子帧和所述M个子帧中的最末端的子帧进行加窗;对所述M个子帧中除所述最前端的子帧和所述最末端的子帧之外的子帧进行加窗。根据本专利技术实施例提供的音频信号的时域包络的处理装置,在不同的条件下采用不同的窗长度和/或窗形状求解时域包络,减少因为时域包络差别太大引入的能量不连续的影响,能够提升输出信号的性能。在第二方面的第一种可能的实施方式中,所述时域包络获取模块还用于:根据所述当前帧信号的高带信号的前向缓存的长度确定所述非对称窗;或者,根据所述当前帧信号的高带信号的前向缓存的长度和所述时域包络个数M确定所述非对称窗。结合第二方面的实施方式,在第二方面的第二种可能的实施方式中,所述时域包络获取模块具体用于:采用非对称窗对所述M个子帧中的最前端的子帧和所述M个子帧中的最末端的子帧进行加窗,对所述M个子帧中除最前端的子帧和所述最末端的子帧之外的子帧采用对称窗进行加窗;或者,采用非对称窗对所述M个子帧中的最前端的子帧和所述M个子帧中的最末端的子帧进行加窗,对所述M个子帧中除最前端的子帧和所述最末端的子帧之外的子帧采用非对称窗进行加窗。结合第二方面的实施方式,在第二方面的第三种可能的实施方式中,所述非对称窗的窗长与对所述M个子帧中除所述最前端的子帧和所述最末端的子帧之外的子帧进行加窗所采用的窗的窗长相同。结合第二方面至第二方面的第三种可能的实施方式任意之一所述的装置,在第二方面的第四种可能的实施方式中,还包括:确定模块,用于根据本文档来自技高网...
一种音频信号的时域包络处理方法及装置、编码器

【技术保护点】
一种音频信号的时域包络处理方法,其特征在于,包括:根据接收到的当前帧信号,得到所述当前帧信号的高带信号;根据预先确定的时域包络个数M将所述当前帧的高带信号分成M个子帧,其中,M为大于等于2的整数;计算每一个所述子帧的时域包络;其中,所述计算每一个所述子帧的时域包络包括:采用非对称窗对所述M个子帧中的最前端的子帧和所述M个子帧中的最末端的子帧进行加窗;对所述M个子帧中除所述最前端的子帧和所述最末端的子帧之外的子帧进行加窗。

【技术特征摘要】
1.一种音频信号的时域包络处理方法,其特征在于,包括:根据接收到的当前帧信号,得到所述当前帧信号的高带信号;根据预先确定的时域包络个数M将所述当前帧的高带信号分成M个子帧,其中,M为大于等于2的整数;计算每一个所述子帧的时域包络;其中,所述计算每一个所述子帧的时域包络包括:采用非对称窗对所述M个子帧中的最前端的子帧和所述M个子帧中的最末端的子帧进行加窗;对所述M个子帧中除所述最前端的子帧和所述最末端的子帧之外的子帧进行加窗。2.根据权利要求1所述的方法,其特征在于,在采用非对称窗对所述M个子帧中的最前端的子帧和所述M个子帧中的最末端的子帧进行加窗之前,所述方法还包括:根据所述当前帧信号的高带信号的前向缓存的长度确定所述非对称窗;或者,根据所述当前帧信号的高带信号的前向缓存的长度和所述时域包络个数M确定所述非对称窗。3.根据权利要求1所述的方法,其特征在于,所述对所述M个子帧中除所述最前端的子帧和所述最末端的子帧之外的子帧进行加窗,包括:对所述M个子帧中除最前端的子帧和所述最末端的子帧之外的子帧采用对称窗进行加窗;或者,对所述M个子帧中除最前端的子帧和所述最末端的子帧之外的子帧采用非对称窗进行加窗。4.根据权利要求1所述的方法,其特征在于,所述非对称窗的窗长与对所述M个子帧中除所述最前端的子帧和所述最末端的子帧之外的子帧进行加窗所采用的窗的窗长相同。5.根据权利要求2所述的方法,其特征在于,所述根据所述当前帧音频信号的高带信号的前向缓存的长度确定非对称窗,包括:当所述当前帧信号的高带信号的前向缓存的长度小于第一阈值时,根据当前帧的前一帧信号的高带信号和所述当前帧信号的高带信号的前向缓存的长度确定所述非对称窗,其中,所述当前帧的前一帧信号的高带信号的最末端子帧采用的非对称窗和所述当前帧信号的高带信号的最前端子帧采用的非对称窗的混叠部分等于所述当前帧信号的高带信号的前向缓存的长度,所述第一阈值等于所述当前帧的高带信号的帧长除以M。6.根据权利要求2所述的方法,其特征在于,所述根据所述当前帧信号的高带信号的前向缓存的长度确定非对称窗,包括:当所述当前帧信号的高带信号的前向缓存的长度大于第一阈值时,根据所述当前帧的前一帧信号的高带信号和所述当前帧信号的高带信号的前向缓存的长度确定所述非对称窗,其中,所述当前帧的前一帧信号的高带信号的最末端子帧采用的非对称窗和所述当前帧信号的高带信号的最前端子帧采用的非对称窗的混叠部分等于所述第一阈值,所述第一阈值等于所述当前帧的高带信号的帧长除以M。7.根据权利要求1-6任意之一所述的方法,其特征在于,所述方法还包括:根据所述当前帧信号得到所述当前帧信号的低带信号的基音周期;当所述当前帧信号的类型与所述当前帧的前一帧信号的类型相同,且所述当前帧的低带信号的基音周期大于...

【专利技术属性】
技术研发人员:刘泽新苗磊
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1