一种基于混合激励线性预测MELP的1.2kb/s低速率语音编解码方法技术

技术编号:12420611 阅读:112 留言:0更新日期:2015-12-02 15:45
本发明专利技术请求保护一种基于MELP的1.2kb/s低速率语音编解码方法,包括:编码端首先对语音信号以30ms为子帧长度进行分帧处理,将相邻两子帧组成一个超帧,对提取的语音特征参数LSF、Pitch、VP、Fsmag和G进行多帧联合量化编码。利用帧结构中剩余比特对重要的语音特征参数进行差错控制编码,最后组成二进制比特流进行传送。解码端从接收到的比特流中解析出各语音特征参数的量化索引值,通过量化索引得到语音特征参数的初值,然后进行语音特征参数完整性重构,利用重构的语音特征参数生成激励信号,再经过自适应谱增强、合成滤波器、增益控制和散布脉冲滤波后得到合成的语音信号。本发明专利技术能有效地降低语音编码速率,接收端合成的语音具有较高的清晰度和可懂度。

【技术实现步骤摘要】

本专利技术属于语音通信领域,特别是涉及到一种基于MELP的低速率语音编解码器, 广泛应用在保密通信、卫星移动通信、深海通信以及语音信箱等语音应用服务中。
技术介绍
语音是人类相互传递信息的主要载体,是现代通信中最直接、最方便、最有效的交 流方式,也是未来人机交互的主要手段。随着通信技术的发展,图像、数据等非语音信息在 信息传递中所占比重越来越大,但有效传递语音信息仍然是众多通信系统必备的功能之 O 虽然近年来光纤传输技术的引入为有线通信提供了巨大的传输容量,信道带宽问 题似乎得到解决。但人们对频带资源有限的陆地蜂窝移动通信、信道价格昂贵的卫星通信 和军事保密通信的需求也在不断增加。语音信号经过模/数转换后,数据量大增,高速率 的语音信号在通信网中进行传输时需要更大的带宽,这对频带资源有限的无线通信系统来 说,传输成本太高,因此,必须对数字化后的语音信号进行压缩编码。目前随着智能语音的 提出,各种与语音应用服务相关的新业务开始不断涌现,要求语音数据能被灵活处理、存 储、转发和传送。比如语音信箱中的语音信息的存储;水电、交通、铁道等部门的调度员现场 录音数据的备份;轨道交通上的自动语音提醒等。这些应用都需要对大量语音数据进行存 储。为了便于管理、节省存储空间和提高通信系统的传输效率,都需要对语音数据进行有效 的压缩编码。另外,低速率语音编码技术也可运用在军事保密通信中,先对语音信号进行压 缩编码,再经过加密处理后,在窄带信道上进行传送。可以说低速率语音通信的广泛应用, 促进了低速率语音编码技术的快速发展。 经过几十年的研究和发展,高质量语音编码技术已大规模地走向实用化,产生了 许多语音编码国际标准,国际标准化组织ITU-T相继制定了 16kb/s的G. 728 (LD-CELP)、 8kb/s 的 G. 729 (CS-ACELP)、5. 3/6. 3kb/s 的 G. 723. I (ACELP)等国际语音编码标准;国际海 事卫星组织(INMARSAT)于1990年制定的语音压缩编码标准采用了 4. 15kb/s改进型多带 激励(MBE)算法;美国Qualcom公司为CDMA移动通信系统采用了 4kb/s~8kb/s的变速 率语音压缩编码的标准QCELP,并纳入了 IS-95标准中。二十世纪九十年代,McCree博士 和Barnwell教授提出了混合激励线性预测(MELP)编码算法,1997年及之后的几年,采用 MELP算法产生的具有较高合成质量的I. 2kbps~2. 4kbps MELP声码器,被北大西洋公约 组织(NATO)选为低码率语音编码标准。NATO的I. 2kbps声码器采用三个20ms子帧组成 一个超帧进行联合量化,由于子帧数较多,每子帧提取的参数也较多,而每超帧编码输出只 有72bit,因此,声码器对基音周期、线谱对频率、残差谐波幅度值、增益和带通浊音强度均 采用了矢量量化编码技术,导致了编码复杂度和存储矢量量化码本所需存储器容量增加, 声码器的实现成本增大。而本专利技术采用两个30ms子帧组成一个超帧进行联合量化,只对线 谱对频率和残差谐波幅度值进行矢量量化,其他参数均采用标量量化,因此,本文实现的声 码器编码复杂度和所需的存储容量均相对较低。
技术实现思路
针对现有技术的不足,提出了一种算法复杂度较低,需要的存储空间较小的基于 混合激励线性预测MELP的I. 2kb/s低速率语音编解码方法。本专利技术的技术方案如下:一种 基于混合激励线性预测MELP的I. 2kb/s低速率语音编解码方法,其包括编码端的编码步骤 及解码端的解码步骤,其中编码端的编码步骤具体为: 101、在编码端,根据编码器的输出码率和处理帧的长度计算出编码帧长,确定 语音特征参数,包括线谱对频率LSF、基音周期Pitch、增益G、非周期标志、残差谐波幅度 Fsmag、带通清/浊音强度VP量化所用的比特数,设计出编码帧结构; 102、输入语音信号。首先对输入的语音信号进行预处理,滤除工频干扰信号,截取 M1(M1取值为30ms)长度的语音信号为一子帧,两个子帧组成一个超帧; 103、设计编码数据缓存器结构,确定分析语音特征参数所用的窗函数的中心位 置; 104、采用步骤103中确定的窗函数对语音信号进行截断处理后,提取子帧的语音 特征参数,以超帧为单位,对语音特征参数进行联合量化; 105、利用编码后超帧结构中的剩余比特将步骤104所得的重要参数进行差错控 制编码,组成二进制比特流后,传送给解码端; 在解码端,解码端的解码步骤为: 106、解码端接收编码端发送来的比特流,并从接收到的比特流中解析出各语音特 征参数的量化索引值,通过量化索引得到语音特征参数的初值,然后进行语音特征参数完 整性重构; 107、根据步骤106解析出的基音周期Pitch值判断该子帧的清/浊状态。若为浊 音子帧时,利用残差谐波幅度Fsmag和带通清/浊音强度VP生成周期性脉冲激励信号;如 果为清音子帧,激励为白噪声信号。激励信号经过合成滤波器后,得到重构的语音信号; 108、对重构的语音信号进行增益调整和脉冲散布滤波,得到最终合成的语音信 号; 进一步的,步骤107中合成滤波器的系统函数i是通过解析 重构出的线谱对频率LSF经转换得到的线性预测系数值; 进一步的,步骤103中的编码数据缓存器结构和窗函数的中心位置中:1到250是 前一超帧后250个样点的存储区域,251到730是当前超帧两个子帧共480个样点的存储区 域,280表示提取当前超帧第一子帧语音特征参数时窗的中心位置,520表示提取当前超帧 第二子帧语音特征参数时窗的中心位置,窗长均为256 ; 进一步的,步骤104中提取语音特征参数包括:线谱对频率LSF、基音周期Pitch、 带通清/浊强度VP、残差谐波幅度Fsmag和增益G ; 进一步的,对超帧的语音特征参数进行联合量化,具体为:将超帧的语音特征参数 按分配的比特数进行标量量化或矢量量化,包括步骤: AU提取子帧的基音周期Pitch,经对数化后进行7bit标量量化; A2、判断子帧的清音/浊音(U/V)状态,如果为清音子帧,则不提取清/浊音强度 VP值;如果是浊音子帧,则提取清/浊音强度VP值。对浊音子帧进行分带处理。浊音子帧 通过带通滤波器后分为5个子带,如果子带为清音状态,用"0"表示,如果子带为浊音状态, 用"1"表示。对浊音子帧的后4个子带的带通清/浊音强度VP用2bit量化,即:将0001、 0010、0011、0100、0101 归入 0000,用 00 编码;将 1001,1010,1011 归入 1000,用 01 编码;将 1101 归入 1100,用 10 编码;将 1110,0111,0110 归入 1111,用 11 编码; A3、提取每子帧的增益G,用8bit进行标量量化; A4、提取超帧中第一个浊音子帧的残差谐波幅度Fsmag值,进行Sbit矢量量化。对 清音子帧不提取Fsmag值; A5、对提取子帧的线谱对频率LSF分模式进行量化,当两子帧分别为浊音清音或 清音浊音时,浊音子帧和清音子帧的LSF分别采用19bit和IObit矢量量化;当两子帧均为 清音时,两子帧的LSF都采用IOb本文档来自技高网
...

【技术保护点】
一种基于混合激励线性预测MELP的1.2kb/s低速率语音编解码方法,其特征在于,包括编码端的编码步骤及解码端的解码步骤,其中编码端的编码步骤具体为:101、在编码端,根据编码器的输出码率和处理帧的长度计算出编码帧长,确定语音特征参数,包括线谱对频率LSF、基音周期Pitch、增益G、非周期标志、残差谐波幅度Fsmag、带通清/浊音强度VP量化所用的比特数,设计出编码帧结构;102、输入语音信号,首先对输入的语音信号进行预处理,滤除工频干扰信号,截取M1ms长度的语音信号为一子帧,两个子帧组成一个超帧;103、设计编码数据缓存器结构,确定分析语音特征参数所用的窗函数的中心位置;104、采用步骤103中确定的窗函数对语音信号进行截断处理后,提取子帧的语音特征参数,以超帧为单位,对语音特征参数进行联合量化;105、利用编码后超帧结构中的剩余比特将步骤104所得的语音特征参数进行差错控制编码,组成二进制比特流后,传送给解码端;在解码端,解码端的解码步骤为:106、解码端接收编码端发送来的比特流,并从接收到的比特流中解析出各语音特征参数的量化索引值,通过量化索引得到语音特征参数的初值,然后进行语音特征参数完整性重构;107、根据步骤106解析出的基音周期Pitch值判断该子帧的清/浊状态,若为浊音子帧时,利用残差谐波幅度Fsmag和带通清/浊音强度VP生成周期性脉冲激励信号;如果为清音子帧,激励为白噪声信号。激励信号经过合成滤波器后,得到重构的语音信号;108、对重构的语音信号进行增益调整和脉冲散布滤波,得到最终合成的语音信号。...

【技术特征摘要】

【专利技术属性】
技术研发人员:李强付余涛舒勤军陈丁当陈浩朱兰明艳夏绪玖
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆;85

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1