在小波音频编码中的基于感知熵的长短块切换方法技术

技术编号:3423410 阅读:242 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及电子技术领域中的信号处理方法,特别涉及一种音频信号小波变换编码中的信号自适应小波基切换方法。所提出的新方法通过心理声学模型中感知熵计算,作为小波基切换的判据,自适应的切换小波基,其特征在于根据心理声学模型计算信号的感知熵,当一段信号的感知熵大于某一个事先给定的阈值时,于是将长块的变换方式转换为短块方式,采用短的小波基,直到下一段信号的感知熵小于阈值时,再将短块的变换方式转换为长块方式;当一段信号的感知熵小于某一个事先给定的阈值时,于是将短块的变换方式转换为长块方式,采用长的小波基,直到下一段信号的感知熵大于阈值时,再将长块的变换方式转换为短块方式;为了实现完全重构,在长-短或短-长块的接驳处,采用过渡块,从而有效提高小波音频编码器的编码效率。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及电子
中的信号处理方法,特别涉及一种音频信号小波变换编码中的信号自适应小波基切换方法。在变换编码中,时域帧长(即时域窗长度)的选择受两个互相矛盾的因素制约帧长越大,则编码增益越高;而过大的帧长将会使时域分辨率降低,而产生严重的“预回声”。因此,选择一个合适的帧长,使编码增益和“预回声”的抑制都达到一个最佳的平衡点,是很重要的。实验证明,当帧长缩短到2ms~5ms时,由于前向掩蔽效应,“预回声”会被其后面的冲击响应所掩蔽。例如,在48kHz采样时,窗长为256时,其时域分辨率为2.7ms,由于前掩蔽效应,人耳察觉不到“预回声”。在在先申请中,如果对于所有的数字音频信号源,都采用同样的小波基,那么,对于快变的音频信号源,由于帧长较大,时域分辨率较低,将产生严重的“预回声”现象。本专利技术的
技术实现思路
本专利技术的目的是为了消除上述产生严重的“预回声”现象,解决的技术方案是在快变的部分,采用较短的小波基,提高时域分辨率,从而达到减弱和消除“预回声”的现象。基于这种想法,提出了长短块切换的技术,即对平稳部分采用较长的小波基(对应的采用长块),对快变部分采用较短小波基(对应的采用短块)。并在长-短或短-长小波基的接驳处,采用过渡块,实现完全重构。在基于在先申请的小波变换声音算法中,采用了长短块切换技术后,“预回声”现象基本上得到了消除,这说明在根据信号性质决定小波基选择的长短块切策略是有成效的。长短块的切换是在心理声学模型中感知熵计算的基础上进行的。感知熵定义为是一段信号变化快慢的度量,根据心理声学模型计算信号的感知熵,当一段信号的感知熵大于某一个事先给定的阈值时,表明该段信号是快变信号,于是将长块的变换方式转换为短块方式,采用短的小波基,直到下一段信号的感知熵小于阈值时,再将短块的变换方式转换为长块方式;当一段信号的感知熵小于某一个事先给定的阈值时,表明该段信号是慢变信号,于是将短块的变换方式转换为长块方式,采用长的小波基,直到下一段信号的感知熵大于阈值时,再将长块的变换方式转换为短块方式;为了实现完全重构,在长-短或短-长块的接驳处,采用过渡块。这里,小波基的长短取决于“预回声”的抑制和编码效率之间的平衡。例如,一般情况下,在48kHz采样时,窗长为256时,其时域分辨率为2.7ms,由于前掩蔽效应,人耳察觉不到“预回声”,短小波基的冲击响应长度可限定小于256。而为了提高编码效率,长小波基可较长的冲击响应,如接近2048。当长短小波基确定下来以后,就可以相应确定长短块的大小。如在长短小波基的冲击响应长度分别不大于2048和256的情况下,长短块的长度可分别为2048和256个时域样本长度。图2为本专利技术的13个子带的低延迟结构用于短块的示意图。本专利技术具体实现方式下面结合附图示意进一步阐明本专利技术以每个长块为2048时域个样本长度为例,心理声学模型根据当前2048样本长的时域信号计算出该段的感知熵,若感知熵小于事先给定的阈值,则对该段信号采取长度为2048的长块小波包变换方式;若感知熵大于阈值,则对该段信号采取8个长度为256的短块小波包变换方式。若上一段信号采取了长块方式,而当前段由感知熵确定为必须取短块方式时,当前段实际上采取了长短块的过渡块方式;反之,若上一段信号采取了短块方式,而由感知熵确定的当前块的变换方式为长块,那么,当前块实际采取的变换方式是短长块的过渡块方式。以下是以长块为2048样本长为例,具体描述长块、短块、长短块和短长块四种块变换的实现。采用两个小波包结构参见附图说明图1为16个子带的长延迟结构用于长块。参见图2为13个子带的低延迟结构用于短块。四种块变换分解的实现(1)长块输入2048个时域样本,输出16个子带样本系数,共2048个。其中各子带的样本数分别为 表1-1(2)短块输入256个,时域样本,输出16个子带样本系数,共256个。在实际变换中,8个短块为一组;即每组输入2048个时域样本,输出2048个子带样本系数。每个短块各子带的样本数分别为 表1-2(3)长-短块(开始块)输入2048个时域样本,输出由两部分组成第一部分为512个长延迟子带系数,各子带系数如下 表1-3 第二部分为一组(8个短块)低延迟子带系数,共2048个。具体情况与短块相同。每个短块各子带的样本数见表1-2。(4)短-长块(结束块)输入2048个时域样本,输出由两部分组成第一部分为512个低延迟子带系数,由两个短块组成,每个短块各子带的样本数见表1-2。第二部分为2048个长延迟子带系数,和长块情况相同,见表1-1。四种块变换重构的实现(1)长块输入16个子带样本系数,共2048个,输出2048个时域样本。(2)短块输入13个子带样本系数,共256个,输出256个时域样本。在实际变换中,8个短块为一组;即每组输入2048个子带样本系数,输出2048个时域样本。(3)长-短块(开始块)先输入512个长延迟子带系数,输出2048个时域样本;再输入2048个低延迟子带系数,刷新子带系数缓冲区。(4)短-长块(结束块)先输入512个低延迟子带系数,输出2320个时域样本;再输入2048个长延迟子带系数,刷新子带系数缓冲区。补偿长延迟和低延迟为了补偿两个不同小波包的不等延迟问题,做如下处理(1)长短-块(开始块)在输出2048时域样本时,去掉最后的272个,实际输出1776个时域样本。(2)短-长块(结束块)在输出2048时域样本后添加272个时域样本,实际输出2320个时域样本。对长块和短块不做特殊处理。权利要求1.一种,其特征在于根据心理声学模型计算信号的感知熵,当一段信号的感知熵大于某一个事先给定的阈值时,于是将长块的变换方式转换为短块方式,采用短的小波基,直到下一段信号的感知熵小于阈值时,再将短块的变换方式转换为长块方式;当一段信号的感知熵小于某一个事先给定的阈值时,于是将短块的变换方式转换为长块方式,采用长的小波基,直到下一段信号的感知熵大于阈值时,再将长块的变换方式转换为短块方式;为了实现完全重构,在长-短或短-长块的接驳处,采用过渡块。全文摘要本专利技术涉及电子
中的信号处理方法,特别涉及一种音频信号小波变换编码中的信号自适应小波基切换方法。所提出的新方法通过心理声学模型中感知熵计算,作为小波基切换的判据,自适应的切换小波基,其特征在于根据心理声学模型计算信号的感知熵,当一段信号的感知熵大于某一个事先给定的阈值时,于是将长块的变换方式转换为短块方式,采用短的小波基,直到下一段信号的感知熵小于阈值时,再将短块的变换方式转换为长块方式;当一段信号的感知熵小于某一个事先给定的阈值时,于是将短块的变换方式转换为长块方式,采用长的小波基,直到下一段信号的感知熵大于阈值时,再将长块的变换方式转换为短块方式;为了实现完全重构,在长-短或短-长块的接驳处,采用过渡块,从而有效提高小波音频编码器的编码效率。文档编号G10L19/00GK1355611SQ01144568公开日2002年6月26日 申请日期2001年12月21日 优先权日2001年12月21日专利技术者潘兴德, 朱晓明 申请人:北京阜国数字技术有限公司本文档来自技高网
...

【技术保护点】
一种在小波音频编码中的基于感知熵的长短块切换方法,其特征在于根据心理声学模型计算信号的感知熵,当一段信号的感知熵大于某一个事先给定的阈值时,于是将长块的变换方式转换为短块方式,采用短的小波基,直到下一段信号的感知熵小于阈值时,再将短块的变换方式转换为长块方式;当一段信号的感知熵小于某一个事先给定的阈值时,于是将短块的变换方式转换为长块方式,采用长的小波基,直到下一段信号的感知熵大于阈值时,再将长块的变换方式转换为短块方式;为了实现完全重构,在长-短或短-长块的接驳处,采用过渡块。

【技术特征摘要】

【专利技术属性】
技术研发人员:潘兴德朱晓明
申请(专利权)人:北京阜国数字技术有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利