当前位置: 首页 > 专利查询>武汉大学专利>正文

语音音频混合分级编码中核心层残差提取系统及方法技术方案

技术编号:5484387 阅读:263 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及音频编码技术领域,尤其涉及一种语音音频混合分级编码中核心层残差提取系统及方法。本发明专利技术提供的系统包括预处理模块(1)、语音编码模块(2)、音频编码模块(3)、模式选取模块(4)、语音解码合成模块(5)、音频解码合成模块(6)、残差生成模块(7);本发明专利技术提供的用于获得语音音频混合编码模式下分级核心层与原始信号的准确残差的方法是本发明专利技术的主要内容,编码端的语音/音频编码器生成的合成信号用于进行最优编码模式的选择,利用语音/音频编码器输出的编码参数得到与解码端一致的合成信号,从而得到准确的残差用于分级增强层。本发明专利技术克服了现有语音音频混合编码模式下可分级核心层残差信号无法准确提取的问题。

【技术实现步骤摘要】

本专利技术涉及音频编码
,尤其涉及一种语音音频混合分级编码中核心层残 差提取系统及方法。
技术介绍
可分级增强层编码方法中,编码端通过计算原始信号与核心层合成信号的残差, 同时接收核心层的输出参数,对残差域信号做分级编码。解码端解码出残差域信号,与核心 层信号相加,得到恢复的合成信号。各个增强层的残差域信号逐级加到核心层信号上,从而 渐次改善重建质量。残差域信号的准确提取与增强层编码所能提供的音质增益有直接关 系,解码端解码得到的残差信号越接近编码端计算的残差信号,则合成信号越接近原始信 号,解码音质越高。由于语音编码和音频编码的技术和方法存在差异,现有的语音音频的混合编码 器,采用不同的模式分别对语音/音频进行编码。系统会根据当前声音信号的类型选择采 用何种模式,或者分别采用两种模式进行编码,然后根据编码生成的合成信号选出编码效 果好的作为最终的编码模式。由于该合成信号的生成只是用于模式选择,并不等同于解码 端生成合成信号的所有操作,再加上两种编码模式的交叠,往往会导致编、解码端得到的合 成信号不一致,因而编码端得到的原始信号与合成信号的残差信号并非准确的残差信号。 对于语音音频混合编码模式下核心层编码残差的准确提取,成为提高语音音频混合编码器 分级编码质量的关键。
技术实现思路
针对上述存在的技术问题,本专利技术的目的是提供一种语音音频混合分级编码中核 心层残差提取系统及方法,以解决语音音频混合分级编码的需求。为达到上述目的,本专利技术采用如下的技术方案一种语音音频混合分级编码框架中核心层残差提取系统,包括预处理模块来自音频输入设备的单声道或多声道的输入信号进行预处理,得到 当前帧的音频信号,并将所获得的当前帧的音频信号做三路输出一路输出给语音编码模 块,一路输出给音频编码模块,一路输出给残差生成模块;语音编码模块采用通用的语音编码算法对输入的当前帧的音频信号进行编码, 编码后作两路输出,其中一路输出为语音解码合成码流,用于模式判决,另一路输出为编码 提取的各类编码参数,传递给语音解码合成模块;音频编码模块采用通用的音频编码算法对输入的当前帧的音频信号进行编码, 编码后作两路输出,其中一路输出为音频解码合成码流,用于模式判决,另一路输出为编码 提取的各类编码参数,传递给音频解码合成模块;模式选取模块选取最优的编码模式,得到模式位标识分两路输出,一路进入语音 解码合成模块,一路进入音频解码合成模块;语音解码合成模块如果模式选取模块的输出是语音编码模式,则进入语音解码 合成模块,利用语音编码模块输出的各类编码参数作为输入,输出最终的核心层语音解码 合成信号;音频解码合成模块如果模式选取模块的输出是音频编码模式,则进入音频解码 合成模块,利用音频编码模块输出的各类编码参数作为输入,输出最终的核心层音频解码 合成信号; 残差生成模块预处理模块输出的预处理后的当前帧的音频信号和语音/音频解 码合成模块输出的解码后合成信号为本模块的两路输入,根据模式位不同,选择语音解码 合成信号或音频解码合成信号,计算得到残差信号,本模块的输出为残差信号。一种语音音频混合分级编码中核心层残差提取方法,包括①输入语音/音频信号首先经过预处理,输入信号可以是单声道或多声道信号, 预处理可以包括高通滤波、分帧、预加重等处理,得到预处理后的信号s(n);②由①所得的预处理后的音频信号,进行语音编码后一路输出为语音编码合成码 流X1 (η),另一路输出为语音编码参数;③由①所得的预处理后的音频信号,进行音频编码后一路输出为音频编码合成码 流X2 (η),另一路输出为音频编码参数;④由②和③得到的合成码流X1 (η)和X2 (η),进行模式选取,选择最优的编码方式, 输出模式位标识;⑤由④所得的模式位,如果选择的是语音编码模式,则转入步骤⑥,执行语音解码 合成;如果选择的是音频编码模式,则转入步骤⑦,执行音频解码合成;⑥由步骤②输出的编码参数,进行语音解码合成得到语音解码合成信号;⑦由步骤③输出的编码参数,进行音频解码合成得到音频解码合成信号料⑧由①得到预处理后的信号s(n)和由⑥或⑦得到的解码后的合成信号或 料《)得到残差信号r(n)。所述步骤⑥进一步包括以下子步骤解码LP滤波器参数,通过接收到的ISP量化索引合成已量化的ISP矢量,插值后 的ISP矢量被转换到LP滤波器系数域,用于合成滤波器重建语音;解码自适应码本矢量和固定码本矢量及两者的增益,合成语音;进行白噪声特性增强和基音增强的后处理;得到最终的合成音频信号并更新公共缓存。所述步骤⑦进一步包括以下子步骤读取量化频率样值,进行基于分裂表的反矢量量化;增益平衡,去除不同缩放因子的影响;峰值逆整形;逆时频变换,信号由频域变换到时域,得到的时域信号与全局增益相乘;加窗和TVC内的重叠相加;通过逆感知加权滤波器得到合成音频信号;如果前一帧采用的是ACELP模式编码,那么将当前帧起始的交迭部分和上一帧 ACELP合成信号的最后一个子帧做加窗交迭,得到最终的合成音频信号并更新公共缓存。本专利技术具有以下优点和积极效果本专利技术克服了现有语音音频混合编码模式下可分级核心层残差信号无法准确提 取的问题。附图说明图1是本专利技术提供的语音音频混合分级编码中核心层残差提取系统的框架示意 图。图2是本专利技术提供的语音音频混合分级编码中核心层残差提取方法的流程图。1-预处理模块,2-语音编码模块,3-音频编码模块,4-模式选取模块,5-语音解 码合成模块,6-音频解码合成模块,7-残差生成模块,8-音频原始信号,9-预处理后信号, 10"语音编码合成信号,11-音频编码合成信号,12-编码模式标识位,13-语音解码合成信 号,14-音频解码合成信号,15-语音编码参数,16-音频编码参数,17-残差信号。具体实施例方式下面以具体实施例结合附图对本专利技术作进一步说明本专利技术提供的语音音频混合分级编码中核心层残差提取系统分为两部分,一部分 为核心编码层,另一部分为残差增强层,其中核心层采用通用的语音/音频混合编码技术, 残差增强层可以分为多个增强层,如图1所示,包括预处理模块1、语音编码模块2、音频编码模块3、模式选取模块4、语音解码合成模 块5、音频解码合成模块6、残差生成模块7 ;预处理模块1 对输入信号进行预处理,其输入为音频原始信号,输出为预处理后 的信号,预处理后的信号做三路输出一路输出给语音编码模块,一路输出给音频编码模 块,一路输出给残差生成模块;语音编码模块2 该模块是可分级编码框架中的核心层编码模块,采用通用的语 音编码算法对预处理模块的输入信号进行编码,编码后作两路输出,其中一路输出为语音 编码合成码流,用于模式判决,另一路输出为编码提取的各类编码参数,传递给语音解码合 成模块,用于计算准确的合成信号;音频编码模块3 该模块是可分级编码框架中的核心层编码模块,采用通用的音 频编码算法对预处理模块的输入信号进行编码,编码后作两路输出,其中一路输出为音频 编码合成码流,用于模式判决,另一路输出为编码提取的各类编码参数,传递给音频解码合 成模块,用于计算准确的合成信号;模式选取模块4:对于语音编码模块和音频编码模块的两路输出,选取最优的模 式作为编码器,输出为模式位标识。如果选择了语音编码模式,则进入本文档来自技高网...

【技术保护点】
一种语音音频混合分级编码框架中核心层残差提取系统,其特征在于,包括:预处理模块(1):来自音频输入设备的单声道或多声道的输入信号(8)进行预处理,得到当前帧的音频信号(9),并将所获得的当前帧的音频信号(9)做三路输出:一路输出给语音编码模块(2),一路输出给音频编码模块(3),一路输出给残差生成模块(7);语音编码模块(2):采用通用的语音编码算法对输入的当前帧的音频信号(9)进行编码,编码后作两路输出,其中一路输出为语音解码合成码流(10),用于模式判决,另一路输出为编码提取的各类编码参数(15),传递给语音解码合成模块(5);音频编码模块(3):采用通用的音频编码算法对输入的当前帧的音频信号(9)进行编码,编码后作两路输出,其中一路输出为音频解码合成码流(11),用于模式判决,另一路输出为编码提取的各类编码参数(16),传递给音频解码合成模块(6);模式选取模块(4):选取最优的编码模式,得到模式位标识(12)分两路输出,一路进入语音解码合成模块(5),一路进入音频解码合成模块(6);语音解码合成模块(5):如果模式选取模块的输出(12)是语音编码模式,则进入语音解码合成模块(5),利用语音编码模块输出的各类编码参数(15)作为输入,输出最终的核心层语音解码合成信号(13);音频解码合成模块(6):如果模式选取模块的输出(12)是音频编码模式,则进入音频解码合成模块(6),利用音频编码模块输出的各类编码参数(16)作为输入,输出最终的核心层音频解码合成信号(14);残差生成模块(7):预处理模块输出的预处理后的当前帧的音频信号(9)和语音/音频解码合成模块输出的解码后合成信号为本模块的两路输入,根据模式位不同,选择语音解码合成信号(13)或音频解码合成信号(14),计算得到残差信号(17),本模块的输出为残差信号(17)。...

【技术特征摘要】

【专利技术属性】
技术研发人员:胡瑞敏杨玉红高丽杨裕才曾琦陈先念王国英
申请(专利权)人:武汉大学
类型:发明
国别省市:83[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1