一种基于多描述格型矢量量化技术的语音编码方法技术

技术编号:3044955 阅读:258 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种基于多描述格型矢量量化的语音编码方法,属于通信领域。本发明专利技术主要用于分组语音传输。该算法首先对语音信号进行LPC分析,并进行感知加权,再将加权语音信号变换到频域。在频域,信号被分解成矢量,采用格型矢量量化方法进行量化,最后量化后的格点按照多描述格型矢量量化的标注方法分解成两个描述(相应子格点的索引)在信道中传输,从而提高了系统的传输可靠性。因为该算法基于格型量化技术,算法复杂度和编码延时较低。

【技术实现步骤摘要】

本专利技术涉及通信领域,特别涉及多描述格型矢量量化技术的语音 编码方法,属于网络通信领域。
技术介绍
多描述编码是1979年的香农信息论会议上由Gersho、 0zarow等 人提出。它将单个信号编码成两个(或两个以上)独立的比特流,这 些独立的比特流称为描述。每个描述都可以单独解码,并得到质量上 可接受的原始信号;而且多个描述之间存在互补的信息,随着正确接 收到的描述的数量的增加,解码出的信号质量也在逐步提高。值得注 意的是,多描述编码不同于常规的可分级编码,常规的方法编码出的 基本层是至关重要的,如果失去基本层,剩下的其他比特流将毫无用 处。而多描述编码技术可以利用正确接收到的任何一个描述符重构出 有用的原始信号,随着接收到描述符数量的增加,编码出来的语音质 量也逐步提高。相比较分层编码更适合存在分组丢失的网络上提高系 统的性能。Jayant最早在他的论文分组丢失对波形编码的影响以及通过奇 偶样点内插来提升质量(Effects of packet losses in waveform coded speech and improvements due to an odd-even sample-interpolation procedure IEEE Trans. Co咖un. , vol. 29, pp. 101-109, Feb. 1981.)设计出一个简单有效的多描述波形编码 系统。该编码系统将奇数样点和偶数样点分别放入两个描述中,用 DPCM进行编码,并在两条信道中传输。当两个描述同时收到时,它 就是一个普通的DPCM解码器。而当只收到一个描述时,采用自适应 内插法进行恢复,得到带有频谱混叠的信号。为了降低混叠的影响, 这类编码器需要提高采样率,从而使编码速率比较高,而且当有描述丢失时,信号的混叠也会严重的影响恢复质量。Dong Lin在她的论文基于LSP适用于实时低速率IP语音的多 描述编码算法,,(LSP-based multiple-description coding for real-time low bit-rate voice over IP Multimedia, IEEE Transactions on , vol. 7, no. 1pp. 167_ 178, Feb. 2005)中设 计出一个基于CELP结构的多描述参数语音编码系统。这类多描述参 数语音编码算法相对于波形多描述编码算法而言,具有较高的压縮效 率。它根据参数的统计特性将参数分配到两个描述中。因为参数之间 的依赖性,以及对误差的敏感性,使得两个描述中有大量重复的参数 才可以单独解码,降低了系统的压縮率。而且参数在分解的过程中, 也不灵活,有诸多限制。本专利技术就是为了解决上述这些不足,相对于波形多描述编码方 法,本专利技术因采用格型矢量量化技术,所以在保持较低的延时和算法 复杂度的情况下,还能保证足够的压缩率;相对于参数多描述编码方 法,本专利技术直接对加权语音的频谱进行量化,不需要提取基音周期等 参数,即使在噪声环境下也不会发生误判,抵抗噪声的能力更强。
技术实现思路
本专利技术要解决分组语音传输过程中,分组丢失影响系统性能的问 题,提供了一种基于多描述格型矢量量化的多描述语音编码方法,涉 及到对加权语音信号进行格型矢量量化,并对量化后的索引进行多描 述标注。本专利技术的技术方案首先对语音信号进行LPC分析,并进行感知加权,再通过时频变 换将加权语音信号变换到频域;在频域,经过幅度调整之后的信号被 分解成矢量,用格型矢量量化法进行量化,量化后的格点按照多描述 格型矢量量化的方法分解成两个描述(相应子格点的索引);两个描 述分别在信道中传输;在接收端根据信道的传输状态对参数进行解 析,根据解析的结果重建矢量,从而重建感知加权语音信号的频谱, 再通过时频反变换变化到时域。最后通过感知去加权滤波器得到最终 的重建语音信号。本专利技术用到的技术方案中涉及到对输入信号进行LPC分析。为提5高LPC分析的精度,若输入信号为宽带语音信号需进行预加重处理, 若输入信号为窄带语音则直接进行LPC分析;LPC分析的窗长大于 实际处理的语音信号的窗长;利用LPC分析之后的参数对输入语音 进行感知加权。本专利技术用到的技术方案中涉及到通过时频变换方法将加权语音 信号从时域变换到频域;变换方法可以是离散傅里叶变换、离散余弦 变换等。本专利技术用到的技术方案中涉及到在形成格型量化的码本时,不同 的编码速率对应不同的码本尺寸,需要根据实际的系统速率要求确定 格型量化的码本尺寸。根据码本尺寸所确定的量化范围,对加权语音 信号的频谱幅度进行调整。使其充分利用量化器的动态范围。本专利技术用到的技术方案中涉及到根据格型量化的维数,将加权语 音信号的频谱的实部虚部分开,组成相应维数的矢量,并进行格型矢本专利技术用到的技术方案中涉及到根据多描述格型矢量量化技术 的标注方法,将量化索引映射成两个子格的索引,该映射可以在一个 小范围内首先确立,然后根据格型本身的结构特性和平移属性将这种 格点到两个子格点的映射关系扩展到整个量化空间。本专利技术用到的技术方案中涉及到解码的过程依赖于每个描述的 传输状态,如果两个描述(子格索引)都正确接收,就可以根据多描 述格型矢量量化的映射关系,找到中心描述。如果只有一个描述正确 接收,那么就用单个描述来恢复信号。如果所有的描述都丢失,则采 用静音替代的方法进行恢复。本专利技术用到的技术方案中涉及到将恢复后的矢量重新组合成信 号的频谱,并进行能量调整,再利用与编码端相同的时频变换方法将 信号从频域变换到时域。本专利技术用到的技术方案中涉及到合成的时域信号通过感知去加 重后得到重建语音信号。本专利技术有益的效果是编码器采用了多描述的思想,这样语音信 号在传输过程中,如果包含一个描述的分组丢失,仍然可以从另外正 确接收的分组中部分的恢复原始信号,从而提高了系统的稳定性。而 且在对信号进行编码的过程中,采用了格型矢量量化的方法,该方法算法复杂度低,所以编解码时不会引入大量的算法时延,而且不需要 存储量化码本,节省了编解码器中的存储空间。附图说明图l一本专利技术的系统组成框图2 —A2格中格点与索引为31的子格点的位置关系; 图3 —A2格中格点与索引为31子格点对的对应关系。具体实施例方式下面结合附图和实施例对本专利技术作进一步介绍。本专利技术主要针对 如何提高语音信号在分组网络上的传输质量的问题。适合分组语音传 输。如图l所示,本专利技术方法包括对编码端和解码端的处理。编码端 包括感知加权、时频变换、能量调整与格型矢量量化以及多描述标注; 而解码端包括,参数解析、能量调整与频谱矢量恢复、时频反变换以 及去加权。各个部分的实现细节如下如图1所示,编码端首先需要对语音信号进行加权,得到加权语音信号,而在解码端需要进行相反的去加权过程。操作细节如下a) 根据语音信号的短时特性,可以将语音信号分成20ms左右的 帧,对每帧语音进行LPC分析,为了避免LPC分析的边界效应,可 以将LPC的分析窗长大于实际处理的语音帧长。为了提高LPC的精 度而又不引入较大的计算量,可以将语音帧分成若干子帧,将LPC 系数对每个子帧进行内插。b) 在子帧的基础上进行感知加权,如果输入信号是宽带语音信号, 则加权本文档来自技高网
...

【技术保护点】
一种基于多描述格型矢量量化技术的语音编码方法,其特征在于:该方法首先对语音信号进行LPC分析,并进行感知加权,再通过时频变换将加权语音信号变换到频域;在频域,经过幅度调整之后的信号被分解成矢量,用格型矢量量化法进行量化,量化后的格点按照多描述格型矢量量化的方法分解成两个描述(相应子格点的索引);两个描述分别在信道中传输;在接收端根据信道的传输状态对参数进行解析,根据解析的结果重建矢量,从而重建感知加权语音信号的频谱,再通过时频反变换变化到时域;最后通过感知去加权滤波器得到最终的重建语音信号。

【技术特征摘要】
1.一种基于多描述格型矢量量化技术的语音编码方法,其特征在于该方法首先对语音信号进行LPC分析,并进行感知加权,再通过时频变换将加权语音信号变换到频域;在频域,经过幅度调整之后的信号被分解成矢量,用格型矢量量化法进行量化,量化后的格点按照多描述格型矢量量化的方法分解成两个描述(相应子格点的索引);两个描述分别在信道中传输;在接收端根据信道的传输状态对参数进行解析,根据解析的结果重建矢量,从而重建感知加权语音信号的频谱,再通过时频反变换变化到时域;最后通过感知去加权滤波器得到最终的重建语音信号。2. 如权利要求1所述的基于多描述格型矢量量化技术的语音编 码算法,其特征在于,该方法的主要步骤有-a) 对输入语音信号进行LPC分析,并进行感知加权;b) 通过时频变换方法将加权后的语音信号转换到频域;c) 对信号的频谱进行能量调整,将信号频谱参数的实部虚部组合 在一起形成矢量,并用格型矢量量化算法对信号矢量进行量 化;d) 根据标注方程,将量化后的索引映射到两个描述;e) 根据传输状态对传输参数进行解析;f) 重建矢量,并进行能量调整重新合成信号的频谱;g) 并采用时频变换将信号从频域变化到时域;h) 感知去加权。3. 如权利要求2要求所述的一种基于多描述格型矢量量化技术 的语音编码方法,其特征在于对输入语音信号进行LPC分析;为 提高LPC分析的精度,若输入信号为宽带语音信号需进行预加重处 理,若输入信号为窄带语音则直接进行LPC分析;LPC分析的窗长 大于实际处理的语音信号的窗长;利用LPC分析之后的参...

【专利技术属性】
技术研发人员:匡镜明郎玥赵胜辉
申请(专利权)人:北京理工大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1