语音压缩方法、语音解压方法及音频编码器、音频解码器技术

技术编号:13743883 阅读:162 留言:0更新日期:2016-09-23 06:32
本发明专利技术公开了一种语音压缩方法、语音解压方法及音频编码器、音频解码器,通过MLT变换时域信号转换成频域信号,采用RMS权重分析法细化频域信号量化分级,矢量量化和哈弗曼编码等方法分别对量化参数(量化权重、比特分配数)和频域数据进行压缩,以期在保证近似无损的频谱特性最大限度提高压缩比。

【技术实现步骤摘要】

本专利技术属于无线语音信号压缩领域,具体涉及一种基于MLT变换和向量熵编码的语音压缩方法、解压方法及音频编码器、音频解码器。
技术介绍
语音信号压缩是为了节省硬件存储空间,方便存储和传输。而无线数字语音系统不同于一般的有线音频系统,其利用空中带宽传输语音信号,不需有线作为信号传输载体,方便了用户实际使用体验。基于嵌入式技术的无线数字音频系统更是有效地将嵌入式技术、音频编解码技术、无线传输技术结合在一起,具有体积小,携带方便,功能专业化高,成本较低,稳定性高,实时性好等特点。但是会受到带宽、延迟和功耗等方面的限制。因此要求应用于无线语音传输的压缩算法同时具有有高音、质高压缩比、低延迟和低计算复杂度的特性。而目前频域压缩编码蓝牙SBC语音算法的音质较低,而时域压缩算法ADPCM,G711等,又普遍具有较低的压缩比。因此,针对无线传输设计一款高压缩比、低延迟和低计算复杂度的情况下实现较高音质的语音编解码算并将之应用在基于嵌入式技术的无线音频系统中是十分有意义的。语音数据压缩利用的是语音信号的冗余和人耳听觉系统的独特感知性,语音信号的冗余主要表现在时域冗余和频域冗余2中,目前公知的语音压缩方法按照编码方式可以分为两类。第一类是:时域压缩,该类型编码器通过分析语音数据时域上的相关性对其进行压缩;第二类是:
频域压缩,该类型编码器通过分析语音数据频域上的相关性对其进行压缩。第一类压缩方法主要采用消除语音信号的时域冗余进行压缩,通过计算音频数据和预测值的差值,并设定自适应量化器的量化级、更新下一数据的预测值。时域预测方法在保证一定压缩比的情况下很难将提高主观音质水平,所以时域预测方法的特点是低延迟、低运算量、中等音质和较低的压缩比。主流的时域预测方法有ADPCM和G711等,一般压缩比在2:1到4:1之间。第二类压缩方法主要采用消除语音信号的频域冗余进行压缩,一般采用变换域结合心里声学模型的方法,通过变换域将时域语音数据变换为频域数据而后通过心里声学模型,按照人耳听觉特性对该语音数据的频域信号进行分级量化,对人耳听觉敏感度高的频域部分进行较少的量化,保留较高的精度,对人耳听觉敏感度低的频域部分进行较多的量化,保留较少的精度。由于有心理声学模型的分析,变换域方法可以在保证人耳主观感受的情况下最大限度地压缩音频数据流,所以变换域方法的特点就是高延迟、高复杂度、高音质和低码流。以主流的变换域方法有余弦调制滤波器组实现的子带编码,如SBC(音质一般,压缩比仅有5:1左右),改进型离散余弦变换(MDCT)实现的编码,如CELT,SPEEX等(音质较高,但延迟需要50ms到100ms)。由于基于无线语音传输的语音码流需要的高音质、高压缩比、低延迟和低计算复杂度,因此主流第一类编码器中的主流的域预测编码因其低压缩比和音质而同样无法满足要求;而第二类编码器的主流变换域编码因为其高延迟和高运算量无法达到无线传输的要求。
技术实现思路
针对现有技术存在的问题,本专利技术的目的在于提供一种基于MLT变换和向量熵编码的语音压缩方法,该方法可同时有效满足无线语音传输的高音质、低延迟、高压缩比且低复杂运算量。本专利技术的另一目的是提供一种基于MLT变换和向量熵编码的语音解压方法。为实现上述目的,本专利技术基于MLT变换和向量熵编码的语音压缩方法,具体为:1)MLT频域变换:将数字麦克采集的时域数字语音信号转换为频域谱系数;2)RMS量化权重计算:频域谱系数为分组计算信号的均方根RMS,通过分组均方根计算频域分量权重;3)最优分组比特位分配:根据分组信号频域分量权重和设定比特率参数获得最优分组比特位;4)将分组频域语音信号进行矢量量化,生成分组矢量量化系数;5)将分组矢量量化系数进行哈弗曼编码,完成数据压缩。进一步,所述步骤1)采用调制混叠变换,通过MLT变换,将短时帧的PCM时域音频数据转换成MLT频域谱系数,按频域相关性对MLT频域谱系数进行分组。进一步,所述PCM时域音频数据首先经过50%数据重叠混合处理,再进行反混叠滤波,防止频谱溢出,之后进行DCT-IV变换,将时域数据变换成频域谱系数。进一步,所述MLT频域变换的公式如下: m l t ( m ) = Σ n = 0 2 N - 1 2 N s i n ( P I 2 N ( n + 0.5 ) ) c o s ( P I N ( n - N 2 - 1 ) ( m + 0.5 ) ) x ( n ) ; ]]> ( 0 ≤ m < N , 0 ≤ n < 2 N , N ∈ ( 80 , 160 , 320 ) . ]]>进一步,所述步骤2)中将时频转换后的频域谱系数通过均方根RMS计算量化权重,其RMS计算公式如下: r m s ( r ) = 1 20 Σ n = 0 19 m l t ( 20 r + n ) m l t ( 20 r + n 本文档来自技高网
...

【技术保护点】
一种语音压缩方法,其特征在于,该方法具体为:1)MLT频域变换:将数字麦克采集的时域数字语音信号转换为频域谱系数;2)RMS量化权重计算:频域谱系数为分组计算信号的均方根RMS,通过分组均方根计算频域分量权重;3)最优分组比特位分配:根据分组信号频域分量权重和设定比特率参数获得最优分组比特位;4)将分组频域语音信号进行矢量量化,生成分组矢量量化系数;5)将分组矢量量化系数进行哈弗曼编码,完成数据压缩。

【技术特征摘要】
1.一种语音压缩方法,其特征在于,该方法具体为:1)MLT频域变换:将数字麦克采集的时域数字语音信号转换为频域谱系数;2)RMS量化权重计算:频域谱系数为分组计算信号的均方根RMS,通过分组均方根计算频域分量权重;3)最优分组比特位分配:根据分组信号频域分量权重和设定比特率参数获得最优分组比特位;4)将分组频域语音信号进行矢量量化,生成分组矢量量化系数;5)将分组矢量量化系数进行哈弗曼编码,完成数据压缩。2.如权利要求1所述的语音压缩方法,其特征在于,所述步骤1)采用调制混叠变换,通过MLT变换,将短时帧的PCM时域音频数据转换成MLT频域谱系数,按频域相关性对MLT频域谱系数进行分组;所述PCM时域音频数据首先经过50%数据重叠混合处理,再进行反混叠滤波,防止频谱溢出,之后进行DCT-IV变换,将时域数据变换成频域谱系数。3.如权利要求1所述的语音压缩方法,其特征在于,所述MLT频域变换的公式如下: m l t ( m ) = Σ n = 0 2 N - 1 2 N s i n ( P I 2 N ( n + 0.5 ) ) c o s ( P I N ( n - N 2 - 1 ) ( m + 0.5 ...

【专利技术属性】
技术研发人员:杨洋姚嘉任金平高永泽
申请(专利权)人:杭州微纳科技股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1