自适应高通后滤波器制造技术

技术编号:13346331 阅读:101 留言:0更新日期:2016-07-14 16:07
根据本发明专利技术的一实施例,一种语音处理方法包括:接收包含编码噪声的编码音频信号。所述方法还包括:从所述编码音频信号中生成解码音频信号;以及确定所述音频信号的基频对应的基音。所述方法还包括:确定最小允许基音,并判断所述音频信号的基音是否小于所述最小允许基音。若所述音频信号的基音小于所述最小允许基音时,对所述解码音频信号应用自适应高通滤波器,以降低低于所述基频的频率的编码噪声。

【技术实现步骤摘要】
【国外来华专利技术】自适应高通后滤波器本申请要求于2014年8月13日递交的申请号为14/459100、专利技术名称为“自适应高通后滤波器(AdaptiveHigh-PassPost-Filter)”的美国专利申请案的在先申请优先权,该申请是2013年8月15日递交的申请号为61/866,459、专利技术名称为“自适应高通后滤波器(AdaptiveHigh-PassPost-filter)”的美国临时申请案的延续,该两个申请案在先申请的内容以引入的方式并入本文。
本专利技术主要涉及信号编码领域,特别地,本专利技术涉及低码率语音编码领域。
技术介绍
语音编码是指降低语音文件码率的过程。语音编码是关于包含语音的数字音频信号的数据压缩的一种应用。语音编码采用音频信号处理技术通过语音特定参数估计对语音信号进行建模,结合通用数据压缩算法将建模得到的参数在码流中表示出来。语音编码的目的是通过降低每样点的比特数,实现节约所需存储器存储空间、传输带宽以及传输功率,从而使解码(解压缩)后的语音与原始语音在感知上没有差别。然而,语音编码器是有损编码器,也就是说,解码后的信号与原信号不同。因此,语音编码的一个目的就是在给定码率的情况下尽可能降低失真(或者可感知的损耗)或者尽可能以最小的码率来实现给定的失真。语音编码与其他形式的音频编码的区别在于,语音信号比大部分音频信号都简单得多,而且具有更多的统计信息可以反映语音的特性。因此,在语音编码的情景中可能并不需要音频编码涉及的一些听觉信息。语音编码中最重要的标准是,使用有限数量的传输数据保持语音的可懂性和“愉悦性”。除了实际的字面内容外,语音的可懂性还包括说话者的身份、情绪、语调、音色等,这些都是影响最佳可懂性的重要因素。质量受损语音的愉悦性是最抽象的一个概念,它是不同于可懂性的一种特性,因为虽然质量受损语音完全具有可懂性,但主观上可能会令听者不悦。按照传统,所有参数化语音编码方法都利用语音信号中固有的冗余来降低必须发送的信息的量以及每隔较短时间估计信号的语音样点的参数。这种冗余主要是由于语音波形按照类周期性速率重复以及语音信号缓慢变化的频谱包络产生的。语音波形的冗余可以认为与几种不同类型的语音信号有关,比如浊音和清音语音信号。浊音比如“a”、“b”本质上由于声带振动产生并且是周期振动的。因此,在较短的时间段中,通过大量的周期信号比如正弦波对浊音进行很好的建模。换句话说,对于浊音语音,语音信号本质上是周期性的。然而,这种周期性在一个语音分片时长中是可变的,并且周期性声波的形状从一个分片到另一个分片通常也是逐渐变化的。通过利用这种周期性,低码率语音编码可以极大地受益。浊音语音周期也叫做基音,并且基音预测通常称为长期预测(LTP)。相比之下,清音比如“s”、“sh”更类似于噪声,这是因为清音语音信号更像随机噪声且可预测性较低。在这两种情况中,都可以使用参数化编码将语音信号的激励分量与频谱包络分量分离以降低语音分片的冗余。缓慢变化的频谱包络分量可以通过线性预测编码(LPC),也称短期预测(STP)来表示。通过利用这种短期预测,低码率语音编码也可以大大受益。参数以缓慢的速率变化,带来了编码优势。然而,参数很少会与几毫秒的内的数值产生明显的差异。在诸如G.723.1、G.729和G.718等一些为人们所熟知的较新的标准中,已经采用了增强型全速率(EFR)、可选模式声码器(SMV)、自适应多速率(AMR)、可变速率多模宽带(VMR-WB)或自适应多速率宽带(AMR-WB)、码激励线性预测技术(CELP)。一般认为,CELP是码激励、长期预测和短期预测的技术结合。CELP主要用于通过从特定的人类声音特征或人类语音生成模型受益来编码语音信号。CELP语音编码是语音压缩领域一种非常流行的算法原理,尽管不同编解码器的CELP细节可能会有明显差异。由于十分流行,CELP算法已经被ITU-T、MPEG、3GPP、3GPP2等一些标准所采用。CELP的变体包括:代数CELP、宽松CELP、低时延CELP以及矢量和激励线性预测等其他变体。CELP是一类算法的通称,而不是对某一种编解码器来说的。CELP算法所基于的主要思想有以下四点:第一,采用线性预测(LP)语音生成的源-滤波器模型。语音生成的源-滤波器模型将语音建模为声源(如声带)和线性声滤波器、声道(以及辐射特性)的组合。在语音生成的源-滤波器模型的实现中,对于浊音语音或者对于清音语音的白噪声,声源或激励信号常常被建模为周期性脉冲序列。第二,将自适应码本和固定码本作为LP模型的输入(激励)。第三,在“感知加权域”进行闭环的查找。第四,应用矢量量化(VQ)技术。
技术实现思路
根据本专利技术的一实施例,一种语音处理方法包括:接收包含编码噪声的编码音频信号。所述方法还包括:从所述编码音频信号中生成解码音频信号;以及确定所述音频信号的基频对应的基音。所述方法还包括:确定最小允许基音并判断所述音频信号的基音是否小于所述最小允许基音;若所述音频信号的基音小于所述最小允许基音时,对所述解码音频信号应用自适应高通滤波器以降低低于所述基频的频率的编码噪声。根据本专利技术的另一实施例,一种语音处理方法包括:接收包含编码噪声的浊音宽带频谱,确定所述浊音宽带频谱的基频对应的基音,并确定最小允许基音。所述方法还包括:确定所述浊音宽带频谱的基音小于所述最小允许基音。对所述浊音宽带频谱应用截频小于所述基频的自适应高通滤波器以降低低于所述基频的频率的编码噪声。根据本专利技术的另一实施例,一种码激励线性预测(CELP)解码器包括:激励码本,用于输出语音信号的第一激励信号;第一增益级,用于放大来自所述激励码本中的所述第一激励信号;自适应码本,用于输出所述语音信号的第二激励信号;以及第二增益级,用于放大来自所述自适应码本中的所述第二激励信号。通过加法器将放大后的第一激励码矢与放大后的第二激励码矢相加。短期预测滤波器,用于对所述加法器的输出进行滤波并输出合成语音。自适应高通滤波器与所述短期预测滤波器的输出耦合。所述自适应高通滤波器包括可调整的截频,以便动态地滤除所述合成语音输出中低于所述基频的编码噪声。根据本专利技术的第一方面,提供了一种利用码激励线性预测(CELP)算法进行音频处理的方法,包括:接收包含编码噪声的编码音频信号;从所述编码音频信号中生成解码音频信号;确定所述音频信号的基频对应的基音;确定所述CELP算法的最小允许基音;判断所述音频信号的基音是否小于所述最小允许基音;当所述音频信号的基音小于所述最小允许基音时,对所述解码音频信号应用自适应高通滤波器以降低低于所述基频的频率的编码噪声。在第一方面的第一种可能的实现方式中,所述自适应高通滤波器的截频小于所述基频。结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述自适应高通滤波器为二阶高通滤波器。结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,所述自适应高通滤波器记为:其中,r0为表示零点与z平面中心之间的最本文档来自技高网
...

【技术保护点】
一种利用码激励线性预测(CELP)算法进行音频处理的方法,其特征在于,所述方法包括:接收包含编码噪声的编码音频信号;从所述编码音频信号中生成解码音频信号;确定所述音频信号的基频对应的基音;确定所述CELP算法的最小允许基音;判断所述音频信号的基音是否小于所述最小允许基音;当所述音频信号的基音小于所述最小允许基音时,对所述解码音频信号应用自适应高通滤波器以降低低于所述基频的频率的编码噪声。

【技术特征摘要】
【国外来华专利技术】2013.08.15 US 61/866,459;2014.08.13 US 14/459,1001.一种利用码激励线性预测CELP算法进行音频处理的方法,其特征在于,所述方法包括:
接收包含编码噪声的编码音频信号;
从所述编码音频信号中生成解码音频信号;
确定所述解码音频信号的基频对应的基音;
确定所述CELP算法的最小允许基音;
判断所述解码音频信号的基音是否小于所述最小允许基音;
当所述解码音频信号的基音小于所述最小允许基音时,对所述解码音频信号应用自适应高通滤波器以降低低于所述基频的频率的编码噪声;
其中,所述自适应高通滤波器的截频小于所述基频;
其中,所述自适应高通滤波器为二阶高通滤波器;
其中,所述自适应高通滤波器记为:
其中,r0为表示零点与z平面中心之间的最大距离的常数,r1为表示极点与z平面中心之间的最大距离的常数,F0_sm与短基音信号的基频相关,αsm为自适应减少极点与z平面中心之间的距离的控制参数,其中,0≤αsm≤1。


2.根据权利要求1所述的方法,其特征在于,当所述解码音频信号的基音大于最大允许基音时,不应用所述自适应高通滤波器。


3.根据权利要求1所述的方法,其特征在于,还包括:
判断所述解码音频信号是否是浊音语音信号;
当确定所述解码音频信号不是浊音语音信号时,不应用所述自适应高通滤波器。


4.根据权利要求2所述的方法,其特征在于,还包括:
判断所述解码音频信号是否是浊音语音信号;
当确定所述解码音频信号不是浊音语音信号时,不应用所述自适应高通滤波器。


5.根据权利要求1所述的方法,其特征在于,还包括:
判断所述解码音频信号是否是通过CELP编码器编码的;
当所述解码音频信号不是通过CELP编码器编码的,不对所述解码音频信号应用自适应高通滤波器。


6.根据权利要求2所述的方法,其特征在于,还包括:
判断所述解码音频信号是否是通过CELP编码器编码的;
当所述解码音频信号不是通过CELP编码器编码的,不对所述解码音频信号应用自适应高通滤波器。


7.根据权利要求3所述的方法,其特征在于,还包括:
判断所述解码音频信号是否是通过CELP编码器编码的;
当所述解码音频信号不是通过CELP编码器编码的,不对所述解码音频信号应用自适应高通滤波器。


8.根据权利要求4所述的方法,其特征在于,还包括:
判断所述解码音频信号是否是通过CELP编码器编码的;
当所述解码音频信号不是通过CELP编码器编码的,不对所述解码音频信号应用自适应高通滤波器。


9.根据权利要求1至8中任一项所述的方法,其特征在于,所述编码音频信号的帧的第一子帧在最小基音限制到最大基音限制的全范围中编码,其中,所述最小允许基音为所述CELP算法的最小基音限制。


10.根据权利要求1至8中任一项所述的方法,其特征在于,所述自适应高通滤波器包括在CELP解码器中。


11.根据权利要求9所述的方法,其特征在于,所述自适应高通滤波器包括在CELP解码器中。


12.根据权利要求1至7中任一项所述的方法,其特征在于,所述解码音频信号包括浊音宽带频谱。


13.根据权利要求8所述的方法,其特征在于,所述解码音频信号包括浊音宽带频谱。


14.根据权利要求9所述的方法,其特征在于,所述解码音频信号包括浊音宽带频谱。


15.根据权利要求10所述的方法,其特征在于,所述解码音频信号包括浊音宽带频谱。


16.根据权利要求11所述的方法,其特征在于,所述解码音频信号包括浊音宽带频谱。


17.一种利用码激励线性预测CELP算法进行音频处理的装置,其特征在于,所述装置包括:
接收单元,用于接收包含编码噪声的编码音频信号;
生成单元,用于从所述编码音频信号中生成解码音频信号;
确定单元,用于确定所述解码音频信号的基频对应的基音;确定所述CELP算法的最小允许基音;判断所述解码音频信号的基音是否小于所述最小允许基音;
应用单元,用于当所述确定单元确定所述解码音频信号的基音小于所述最小允许基音时,对所述解码音频信号应用自适应高通滤波器以降低低于所述基频的频率的编码噪声;
其中,所述自适应高通滤波器的截频小于所述基频;
其中,所述自适应高通滤波器为二阶高通滤波器;
其中,所述自适应高通滤波器记为:

【专利技术属性】
技术研发人员:高扬
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1