一种语音线性预测编码模型的缺失值非线性估算方法技术

技术编号:10095200 阅读:137 留言:0更新日期:2014-05-28 19:35
本发明专利技术实施例公开了一种语音线性预测编码模型的缺失值非线性估算方法。该方法包括如下步骤:线谱频率参数变换步骤:将语音线性编码预测模型的线谱频率参数通过线性变换转化为线谱频率参数差值;训练模型步骤;传输过程中丢失部分和收到部分概率分布计算步骤;最小均方误差最优化估计步骤。利用本发明专利技术实施例,能够在分组传输丢包的情况下,可靠的实现线性预测模型的最优估计,降低传输损失,提高语音质量,具有很大的实用价值。

【技术实现步骤摘要】
【专利摘要】本专利技术实施例公开了。该方法包括如下步骤:线谱频率参数变换步骤:将语音线性编码预测模型的线谱频率参数通过线性变换转化为线谱频率参数差值;训练模型步骤;传输过程中丢失部分和收到部分概率分布计算步骤;最小均方误差最优化估计步骤。利用本专利技术实施例,能够在分组传输丢包的情况下,可靠的实现线性预测模型的最优估计,降低传输损失,提高语音质量,具有很大的实用价值。【专利说明】
本专利技术涉及在分组网络中,语音传输过程中包丢失的处理问题,着重描述了一种基于变换的线谱频率参数和狄利克雷混合模型的非线性最优化估计方法。
技术介绍
随着互联网技术的深入发展,语音通信技术得到了长足的进步,传输的语音信号已经由窄带信号传播演进到了宽带信号传播。伴随着多媒体应用的不断开发与推广,人们对于在语音通信技术中语音传输质量和实时性的要求越来越高,因此,研究高效可靠的语音通信算法,具有迫切的社会需求。语音通信中要解决的首要问题是语音的编码。经过数十年的发展,语音编码技术大致可以分为三种方式:波形编码技术、基于参数模型的编码技术和混合编码技术。波形编码技术针对语音波形直接进行量化和传输,不基于声学模型。基于参数模型的编码技术将语音通过线性预测模型分析后,分别传输线性预测模型,边信息和语音能量信息。混合编码技术是上述两者的结合。在语音编码中,基于参数模型的编码被广泛应用,其核心在于如何有效可靠的实现线性预测模型的量化和编码。在语音线性预测编码模型的研究中,一般把线性预测编码参数转化为线谱频率参数,这种表示方法较其他参数表示方法更为稳定高效,原因在于其频谱敏感区域的分布较为平均。在分组网络中传输语音时,语音恢复的质量很大程度上取决于网络的状况。在分组网络传输的模式下,如果能够从已知信息估计出延迟或丢失的分组,可以有效地回复出语音信号,并且避免额外的延迟,从而提高语音质量,改善用户的体验。传统的缺失的和接收到的线谱频率元素间的联合分布主要由高斯混合模型进行建模,通过高斯混合模型来模拟接收到部分和丢失部分的联合分布,从而最优估计出丢失的包的信息。最新的研究表明,对于线性预测模型的编码可以通过量化线谱频率参数差值来实现,此方法比传统的基于高斯混合模型的线谱频率参数量化更为有效。在传输线谱频率差值的时候,传统的高斯混合模型无法很好地模拟数据的分布,也就不能实现最优的预测。因此,针对线谱频率差值设计相应的统计模型并由此模型来最优估计分组传输中丢失的包就显得尤为重要。
技术实现思路
针对现有语音传输过程中的丢包问题,本专利技术的目的是提供一种非线性最优化算法来估计所丢失的内容,最大限度恢复传输的语音质量。为达到上述目的,本专利技术提出的非线性最优化缺失值估计方法包括下列步骤:线谱频率参数变换步骤:将语音线性编码预测模型的线谱频率参数通过线性变换转化为线谱频率参数差值;训练模型步骤:在发送端,使用狄利克雷混合模型(DMM-Dirichlet mixturemodel)模拟线谱频率参数差值的分布,采用期望最大化算法训练DMM中的各个参数;传输过程中丢失部分和收到部分概率分布计算步骤:根据线谱频率参数差值满足狄利克雷分布(Dirichlet distribution)的假设,把线谱频率参数差值分成丢失部分和收到部分,分别归一化后得到相应的狄利克雷分布;最小均方误差最优化估计步骤:按照最小均方误差标准,得到缺失值的最优估计。线谱频率参数变换步骤中,利用线谱频率参数的①非负特性,②有序特性和③有界特性将其变换为线性谱参数差值ALSF,此差值的特征为:①分布在(0,1)开区间内,②加和为I ;此步骤具体过程如下:1)K维线谱频率参数表示为s = T,满足O < S1 < S2 <,…,sK< π ;2)变换后的K+1维线谱频率参数差值ALSF为【权利要求】1.一种语音线性预测模型的非线性最优化丢包估计方法,其特征在于,包括以下步骤: 线谱频率参数变换步骤:将语音线性编码预测模型的线谱频率参数通过线性变换转化为线谱频率参数差值; 训练模型步骤:在发送端,使用狄利克雷混合模型(DMM-Dirichlet mixture model)模拟线谱频率参数差值的分布,采用期望最大化算法训练的DMM中的各个参数; 传输过程中丢失部分和收到部分概率分布计算步骤:根据线谱频率参数差值满足狄利克雷分布(Dirichlet distribution)的假设,把线谱频率参数差值分成丢失部分和收到部分,分别归一化后得到相应的狄里特雷分布; 最小均方误差最优化估计步骤:按照最小均方误差标准,得到缺失值的最优估计。2.如权利要求1所述的方法,其特征在于,线谱频率参数变换步骤中,利用线谱频率参数的①非负特性,②有序特性和③有界特性将其变换为线性谱参数差值ALSF,此差值的特征为:①分布在(0,I)开区间内,②加和为I ;此步骤具体过程如下: 1)K 维线谱频率参数表示为 s = T,满足 O < S1 < S2 <,..., sK < π ; 2)变换后的Κ+1维线谱频率参数差值ALSF为5= 1;,?,...,?;,其中.V, in1=13.如权利要求2所述的方法,其特征在于,训练模型步骤中,传输之前,假设权利要求2中算得的?满足狄利克雷分布,在发送端训练模型,得到条件概率分布中的混合分量参数 可表示为: 4.如权利要求3所述的方法,其特征在于,计算传输过程中丢失部分和收到部分概率分布步骤,假设、满足狄利克雷分布,它在传输后可以分为两部分:丢失部分Sw和收到部分可以通过两者的相关特性估计其中的丢失部分;由于狄利克雷向量^是中性向量(neutral vector),将f和f分别归一化后可计算得到它们的边缘概率分布,其过程如下: 1)输入:将上一步骤中得到的ALSF参数分成丢失部分和收到部分,即 5.如权利要求4所述的方法,其特征在于,最小均方误差最优化估计步骤:根据最小均方误差准则,丢失部分的最佳估计,是归一化丢失部分的均值与(1-Sk)相乘得到的结果,即丢失部分在已知收到部分基础上的条件均值。计算结果如下式: 【文档编号】G10L25/69GK103824561SQ201410054042【公开日】2014年5月28日 申请日期:2014年2月18日 优先权日:2014年2月18日【专利技术者】马占宇, 齐峰, 司中威, 郭军, 张洪刚 申请人:北京邮电大学本文档来自技高网
...

【技术保护点】
一种语音线性预测模型的非线性最优化丢包估计方法,其特征在于,包括以下步骤:线谱频率参数变换步骤:将语音线性编码预测模型的线谱频率参数通过线性变换转化为线谱频率参数差值;训练模型步骤:在发送端,使用狄利克雷混合模型(DMM‑Dirichlet mixture model)模拟线谱频率参数差值的分布,采用期望最大化算法训练的DMM中的各个参数;传输过程中丢失部分和收到部分概率分布计算步骤:根据线谱频率参数差值满足狄利克雷分布(Dirichlet distribution)的假设,把线谱频率参数差值分成丢失部分和收到部分,分别归一化后得到相应的狄里特雷分布;最小均方误差最优化估计步骤:按照最小均方误差标准,得到缺失值的最优估计。

【技术特征摘要】

【专利技术属性】
技术研发人员:马占宇齐峰司中威郭军张洪刚
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1