改进时域编码与频域编码之间的分类制造技术

技术编号:15343493 阅读:112 留言:0更新日期:2017-05-17 00:28
一种用于在对包括音频数据的数字信号进行编码之前处理语音信号的方法包括:基于将用于对所述数字信号进行编码的编码比特率和所述数字信号的短基音周期检测来选择频域编码或时域编码。

【技术实现步骤摘要】
【国外来华专利技术】改进时域编码与频域编码之间的分类相关申请案交叉申请本申请要求2014年10月10日递交的专利技术名称为“改进时域编码与频域编码之间的分类(ImprovingClassificationBetweenTime-DomainCodingandFrequencyDomainCoding)”的第14/511,943号美国非临时专利申请案的在先申请优先权,该在先申请要求2014年7月26日递交的专利技术名称为“针对高比特率改进时域编码与频域编码之间的分类(ImprovingClassificationBetweenTime-DomainCodingandFrequencyDomainCodingforHighBitRates)”的第62/029,437号美国临时专利申请案的在先申请优先权,这两个在先申请的内容以引入的方式并入本文本中。
本专利技术大体上涉及信号编码领域。具体而言,本专利技术涉及改进时域编码与频域编码之间的分类的领域。
技术介绍
语音编码是指一种降低语音文件的比特率的过程。语音编码是一种对包含语音的数字音频信号进行数据压缩的应用。语音编码通过使用音频信号处理技术使用特定语音参数估计来建模语音信号,结合通用数据压缩算法以小型比特流表示所得的建模参数。语音编码的目的是:通过减少每个样本的比特数来实现所需内存存储空间、传输带宽和传输功率的节省,使得在感知上难以区分已解码(已压缩)语音和原始语音。然而,语音编码器是有损编码器,即,已解码信号不同于原始信号。因此,语音编码中的其中一个目标是:在给定比特率下使失真(或可感知的损失)最小化,或者使比特率最小化以达到给定的失真。语音编码与音频编码的不同之处在于语音比多数其它音频信号简单地多,而且关于语音属性的统计信息更多。因此,与音频编码相关的一些听觉信息在语音编码上下文中可以是不必要的。在语音编码中,最重要的标准是语音的可懂度和“愉悦度”,该语音具有限量的传输数据。语音的可懂度除了包括实际文字内容,还包括说话者标识、情绪、语调、音色,所有这些对于完美可懂度都很重要。恶化语音的愉悦度这个较抽象概念是一个不同于可懂度的属性,因为恶化语音有可能是完全可懂的,但是主观上却不能愉悦听众。传统上,所有参数语音编码方法利用语音信号内在的冗余度来减少必须发送的信息量以及在短的间隔内估计信号的语音样本的参数。这种冗余主要来自语音波形以准周期性速率重复,以及语音信号的缓慢变化的频谱包络。可以参考若干不同类型的语音信号,例如浊音和清音信号,来考虑语音波形的冗余。浊音,例如‘a’、‘b’基本上是由于声带的振动,而且是振荡的。因此,在短时间内,它们通过正弦等周期性信号的和来很好地建模。换言之,浊音语音信号基本上是周期性的。然而,这种周期性在语音片段的持续时间内可能是变化的,而且周期性波的形状通常逐片段变化。这种周期性研究可大大有利于低比特率语音编码。这种周期性研究可大大有利于时域语音编码。浊音周期还被称为基音,基音预测通常被称为长期预测(Long-TermPrediction,LTP)。相比之下,‘s’、‘sh’等清音更似噪声。这是因为清音语音信号更像一种随机噪声,并且可预测性较小。在任一情况下,参数编码可以用于通过将语音信号的激励分量与以较低速率发生变化的频谱包络分量分离来减少语音片段的冗余,。缓慢变化的频谱包络可以通过线性预测编码(LinearPredictionCoding,LPC),也称为短期预测(Short-TermPrediction,STP)来表示。这种短期预测研究也可大大有利于低比特率语音编码。编码优点来自于参数变化时的低速率。然而,这些参数在几毫秒内保持的值明显不同是很少见的。在最新的著名标准,例如G.723.1、G.729、G.718、增强型全速率(EnhancedFullRate,EFR)、可选择模式声码器(SelectableModeVocoder,SMV)、自适应多速率(AdaptiveMulti-Rate,AMR)、可变速率多模式宽带(Variable-RateMultimodeWideband,VMR-WB)或自适应多速率宽带(AdaptiveMulti-RateWideband,AMR-WB)中,已经采用了码激励线性预测技术(CodeExcitedLinearPredictionTechnique,“CELP”)。CELP通常被理解为编码激励、长期预测和短期预测的技术组合。CELP主要用于通过受益于具体人类声音特性或人类嗓音发声模型对语音信号进行编码。CELP语音编码在语音压缩领域是一种非常流行的算法原理,但是,不同编码器下的CELP细节可能会大大不同。由于其普遍性,CELP算法已经应用于各种ITU-T、MPEG、3GPP和3GPP2标准中。CELP的变体包括代数CELP、松散CELP、低时延CELP以及矢量和激励线性预测,以及其它。CELP是一类算法的通用术语,而不是针对特定的编解码器。CELP算法基于四个主要观点。第一,使用通过线性预测(linearprediction,LP)的语音产生的源滤波器模型。语音产生的源滤波器将语音建模为声源,例如声带,和线性声滤波器,即声道(和辐射特征)的组合。在语音产生的源滤波器模型的实施方式中,对于浊音语音,声源或激励信号通常被建模为周期性脉冲序列;或对于清音语音,声源或激励信号通常被建模为白噪声。第二,将自适应和固定码本用作LP模型的输入(激励)。第三,在“感知上加权的域”的闭环中执行搜索。第四,应用矢量量化(vectorquantization,VQ)。
技术实现思路
根据本专利技术一实施例,一种用于在对包括音频数据的数字信号进行编码之前处理语音信号的方法包括:基于将用于对所述数字信号进行编码的编码比特率和所述数字信号的短基音周期检测来选择频域编码或时域编码。根据本专利技术一替代性实施例,一种用于在对包括音频数据的数字信号进行编码之前处理语音信号的方法包括:当编码比特率高于比特率上限时,选择频域编码来对所述数字信号进行编码。或者,当所述编码比特率低于比特率下限时,所述方法选择时域编码来对所述数字信号进行编码。所述数字信号包括基音周期短于基音周期限度的短基音信号。根据本专利技术一替代性实施例,一种用于在编码之前处理语音信号的方法包括:当数字信号不包括短基音信号并且所述数字信号被归类为清音语音或正常语音时,选择时域编码来对包括音频数据的所述数字信号进行编码。所述方法还包括:当编码比特率处于比特率下限与比特率上限中间时,选择频域编码来对所述数字信号进行编码。所述数字信号包括短基音信号,且浊音周期较低。所述方法还包括:当编码比特率处于中间、所述数字信号包括短基音信号且浊音周期非常强时,选择时域编码来对所述数字信号进行编码。根据本专利技术一替代性实施例,一种用于在对包括音频数据的数字信号进行编码之前处理语音信号的装置包括:编码选择器,用于基于将用于对所述数字信号进行编码的编码比特率和所述数字信号的短基音周期检测来选择频域编码或时域编码。附图说明为了更完整地理解本专利技术及其优点,现在参考下文结合附图进行的描述,其中:图1示出了在使用传统CELP编码器对原始语音进行编码期间执行的操作;图2示出了在使用CELP解码器对原始语音进行解码期间执行的操作;图3本文档来自技高网
...
改进时域编码与频域编码之间的分类

【技术保护点】
一种用于在对包括音频数据的数字信号进行编码之前处理语音信号的方法,其特征在于,所述方法包括:基于以下项选择频域编码或时域编码:将用于对所述数字信号进行编码的编码比特率,以及所述数字信号的短基音周期检测。

【技术特征摘要】
【国外来华专利技术】2014.07.26 US 62/029,437;2014.10.10 US 14/511,9431.一种用于在对包括音频数据的数字信号进行编码之前处理语音信号的方法,其特征在于,所述方法包括:基于以下项选择频域编码或时域编码:将用于对所述数字信号进行编码的编码比特率,以及所述数字信号的短基音周期检测。2.根据权利要求1所述的方法,其特征在于,所述短基音周期检测包括检测所述数字信号是否包括基音周期短于基音周期限度的短基音信号,其中所述基音周期限度是用于对所述数字信号进行编码的码激励线性预测技术(CodeExcitedLinearPredictionTechnique,CELP)算法的最小允许基音。3.根据权利要求1所述的方法,其特征在于,所述数字信号包括基音周期短于基音周期限度的短基音信号,选择频域编码或时域编码包括:当所述编码比特率高于比特率上限时,选择频域编码来对所述数字信号进行编码,以及当所述编码比特率低于比特率下限时,选择时域编码来对所述数字信号进行编码。4.根据权利要求3所述的方法,其特征在于,当所述编码比特率大于或等于46200bps时,所述编码比特率高于所述比特率上限;当所述编码比特率小于24.4kbps时,所述编码比特率低于所述比特率下限。5.根据权利要求1所述的方法,其特征在于,所述数字信号包括基音周期短于基音周期限度的短基音信号,选择频域编码或时域编码包括:当所述编码比特率处于比特率下限与比特率上限中间且其中浊音周期较低时,选择频域编码来对所述数字信号进行编码。6.根据权利要求1所述的方法,其特征在于,所述数字信号不包括基音周期短于基音周期限度的短基音信号,选择频域编码或时域编码包括:当所述数字信号被归类为清音语音或正常语音时,选择时域编码来对所述数字信号进行编码。7.根据权利要求1所述的方法,其特征在于,所述数字信号包括基音周期短于基音周期限度的短基音信号,选择频域编码或时域编码包括:当所述编码比特率处于比特率下限与比特率上限中间且浊音周期非常强时,选择时域编码来对所述数字信号进行编码。8.根据权利要求1所述的方法,其特征在于,还包括使用所述选择的频域编码或所述选择的时域编码来对所述数字信号进行编码。9.根据权利要求1所述的方法,其特征在于,基于所述数字信号的基音周期选择频域编码或时域编码包括基于确定以下参数来检测短基音信号:检测非常低的频率能量的缺少的参数,以及频谱锐度的参数。10.一种用于在对包括音频数据的数字信号进行编码之前处理语音信号的方法,其特征在于,所述方法包括:当编码比特率高于比特率上限时,选择频域编码来对所述数字信号进行编码;以及当所述...

【专利技术属性】
技术研发人员:高扬
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1