语音信号的处理方法和移动设备技术

技术编号:26514677 阅读:82 留言:0更新日期:2020-11-27 15:44
一种语音信号的处理方法和移动设备,方法包括:对接收到的编码后的语音信号解码后得到m组低频语音参数;m组低频语音参数为语音信号的m个语音帧的低频语音参数;基于m组低频语音参数确定m个语音帧的类型,并重构m个语音帧对应的低频语音信号;根据n个清音帧的低频语音参数和混合高斯模型算法,得到n个清音帧对应的n个高频语音信号,并根据k个浊音帧的低频语音参数和神经网络算法,得到k个浊音帧对应的k个高频语音信号,n和k的和等于m;对每个语音帧的低频语音信号和高频语音信号进行合成,得到宽带语音信号。降低了噪声引入的概率,保留了原始语音的情感度,可精确的再现原始语音。

【技术实现步骤摘要】
【国外来华专利技术】语音信号的处理方法和移动设备
本申请涉及信号处理
,尤其涉及一种语音信号的处理方法和移动设备。
技术介绍
在信息传输中,语音是最直观简洁的通信方式。通常自然语音的带宽在50Hz~8000Hz之间,然而在现代通信系统中,由于受传输带宽的限制,语音的频带范围被限制在300Hz~3400Hz之间,300Hz~3400Hz之间的语音信号称为窄带语音信号。语音的主要能量包含在低频语音信号中,而高频信号的缺失使得语音信号的清晰度与自然度在一定程度上受到影响,声色等一些代表说话者特性部分的信息被丢失;如打电话过程中语音失真较为严重,特别是在嘈杂的环境中,失真度往往不被用户接受。随着移动设备对语音质量的要求越来越高,仅仅是能听懂移动设备发出的声音已经远远不满足人们的需求。高清晰度,高保真度的语音信号是各种移动设备的新要求。因此相关研究者越来越多的技术投入到语音的带宽扩展中,以得到宽带语音。目前语音扩展的方法主要有基于网络映射的方法和基于统计学模型的方法两种。基于网络映射的方法,最终得到的宽带语音中的噪声较大;基于统计学模型的方法,最终得到的宽带语音不能保留原始语音的情感度。
技术实现思路
本申请提供一种语音信号的处理方法和移动设备,得到的宽带语音噪声小且保留了原始语音的情感度,能够很好的再现原始语音。第一方面提供一种语音信号的处理方法,包括:移动设备对接收到的编码后的语音信号解码后得到m组低频语音参数;所述m组低频语音参数为所述语音信号的m个语音帧的低频语音参数,m为大于1的整数;所述移动设备基于所述m组低频语音参数确定所述m个语音帧的类型,并重构m个语音帧对应的低频语音信号,所述类型包括清音帧或浊音帧;所述移动设备根据n个清音帧的低频语音参数和混合高斯模型算法,得到所述n个清音帧对应的n个高频语音信号,并根据k个浊音帧的低频语音参数和神经网络算法,得到所述k个浊音帧对应的k个高频语音信号,n和k为大于1的整数,n和k的和等于m;所述移动设备对m个语音帧中每个语音帧的低频语音信号和高频语音信号进行合成,得到宽带语音信号。该方案在移动设备侧进行,不改变原有的通信系统,只需在移动设备侧设置相应装置或者相应程序即可;根据语音参数区分浊音帧和清音帧,区分准确率高;根据清音帧和浊音帧性质的不同,采用混合高斯模型算法获取清音帧对应的高频语音信号,降低了噪声引入的概率,采用神经网络算法获取浊音帧对应的高频语音信号,保留了原始语音的情感度,可精确的再现原始语音,提升了用户的听觉感受。可选地,每组低频语音参数包括:基音周期;或者,子带信号强度;或者,增益值;或者,线谱频率;或者,基音周期,子带信号强度,增益值,或者线谱频率中的至少两个。在一种可能的设计中,所述移动设备基于所述m组低频语音参数确定所述m个语音帧的类型,包括:所述移动设备根据所述m组低频语音参数和栈自动编码机(StackedAutoEncoder,简称SAE)模型,采用SAE算法,得到m个标签,m个标签用于指示m组低频语音参数对应的m个语音帧的类型;其中,所述SAE模型是所述移动设备或其它移动设备采用所述SAE算法,基于多个第一训练样本训练得到的,每个第一训练样本包括其它语音信号的一个语音帧的低频语音信号对应的低频语音参数。在一种可能的设计中,所述移动设备根据n个清音帧的低频语音参数和混合高斯模型算法,得到所述n个清音帧对应的n个高频语音信号,包括:所述移动设备根据n个清音帧的低频语音参数和混合高斯模型算法,得到n个清音帧的高频语音参数;所述移动设备根据所述n个清音帧的高频语音参数,构建所述n个高频语音信号。采用混合高斯模型算法预测清音帧的高频语音信号几乎不会引入噪声,提升了用户的听觉感受。在一种可能的设计中,所述移动设备根据k个浊音帧的低频语音参数和神经网络算法,得到所述k个浊音帧对应的k个高频语音信号,包括:所述移动设备根据k个浊音帧的低频语音参数和神经网络模型,采用神经网络算法,得到k个浊音帧的高频语音参数;所述移动设备根据所述k个浊音帧的高频语音参数,构建所述k个高频语音信号;其中,所述神经网络模型是所述移动设备或其它移动设备采用所述神经网络算法,基于多个第二训练样本训练得到的,一个所述第二训练样本包括一个其它语音信号的h个浊音帧的h组低频语音参数,h为大于1的整数。采用神经网络算法预测浊音帧的高频语音信号几乎不会引入噪声,且可保留原始语音的情感度。可选地,所述神经网络算法为长短期记忆(LSTM)神经网络算法,所述神经网络模型为LSTM神经网络模型;可选地,所述神经网络算法为双向循环神经网络(BRNN)算法,所述神经网络模型为BRNN模型;可选地,所述神经网络算法为循环神经网络(RNN)算法,所述神经网络模型为RNN模型。其中,采用BRNN算法可大大提高获取的高频语音信号的准确度,从而可精确的再现原始语音。第二方面提供一种移动设备,包括:解码模块,用于对接收到的编码后的语音信号解码后得到m组低频语音参数;所述m组低频语音参数为所述语音信号的m个语音帧的低频语音参数,m为大于1的整数;处理模块,用于基于所述m组低频语音参数确定所述m个语音帧的类型,并重构m个语音帧对应的低频语音信号,所述类型包括清音帧或浊音帧;获取模块,用于根据n个清音帧的低频语音参数和混合高斯模型算法,得到所述n个清音帧对应的n个高频语音信号,并根据k个浊音帧的低频语音参数和神经网络算法,得到所述k个浊音帧对应的k个高频语音信号,n和k为大于1的整数,n和k的和等于m;合成模块,用于对m个语音帧中每个语音帧的低频语音信号和高频语音信号进行合成,得到宽带语音信号。该方案中,只需在语音处理装置侧设置相关的扩展装置或者扩展程序即可,不改变原有的通信系统;根据语音参数区分浊音帧和清音帧,区分准确率高;根据清音帧和浊音帧性质的不同,采用混合高斯模型算法获取清音帧对应的高频语音信号,降低了噪声引入的概率,采用神经网络算法获取浊音帧对应的高频语音信号,保留了原始语音的情感度,可精确的再现原始语音,提升了用户的听觉感受。可选地,每组低频语音参数包括:基音周期;或者,子带信号强度;或者,增益值;或者,线谱频率;或者,基音周期,子带信号强度,增益值,或者线谱频率中的至少两个。在一种可能的设计中,所述处理模块,具体用于:根据所述m组低频语音参数和栈自动编码机(SAE)神经网络模型,采用SAE算法,得到m个标签,m个标签用于指示m组低频语音参数对应的m个语音帧的类型;其中,所述SAE模型是所述移动设备或其它移动设备采用所述SAE算法,基于多个第一训练样本训练得到的,每个第一训练样本包括其它语音信号的一个语音帧的低频语音信号对应的低频语音参数。在一种可能的设计中,所述获取模块,具体用于:根据n个清音帧的低频语音参数和混合高斯模型算法,得到n个清音帧的高频语音参数;根据所本文档来自技高网...

【技术保护点】
一种语音信号的处理方法,其特征在于,包括:/n移动设备对接收到的编码后的语音信号解码后得到m组低频语音参数;所述m组低频语音参数为所述语音信号的m个语音帧的低频语音参数,m为大于1的整数;/n所述移动设备基于所述m组低频语音参数确定所述m个语音帧的类型,并重构所述m个语音帧对应的低频语音信号,所述类型包括清音帧或浊音帧;/n所述移动设备根据n个清音帧的低频语音参数和混合高斯模型算法,得到所述n个清音帧对应的n个高频语音信号,并根据k个浊音帧的低频语音参数和神经网络算法,得到所述k个浊音帧对应的k个高频语音信号,n和k为大于1的整数,n和k的和等于m;/n所述移动设备对所述m个语音帧中每个语音帧的低频语音信号和高频语音信号进行合成,得到宽带语音信号。/n

【技术特征摘要】
【国外来华专利技术】一种语音信号的处理方法,其特征在于,包括:
移动设备对接收到的编码后的语音信号解码后得到m组低频语音参数;所述m组低频语音参数为所述语音信号的m个语音帧的低频语音参数,m为大于1的整数;
所述移动设备基于所述m组低频语音参数确定所述m个语音帧的类型,并重构所述m个语音帧对应的低频语音信号,所述类型包括清音帧或浊音帧;
所述移动设备根据n个清音帧的低频语音参数和混合高斯模型算法,得到所述n个清音帧对应的n个高频语音信号,并根据k个浊音帧的低频语音参数和神经网络算法,得到所述k个浊音帧对应的k个高频语音信号,n和k为大于1的整数,n和k的和等于m;
所述移动设备对所述m个语音帧中每个语音帧的低频语音信号和高频语音信号进行合成,得到宽带语音信号。


根据权利要求1所述的方法,其特征在于,所述移动设备基于所述m组低频语音参数确定所述m个语音帧的类型,包括:
所述移动设备根据所述m组低频语音参数和栈自动编码机SAE模型,采用SAE算法,得到m个标签,所述m个标签用于指示所述m组低频语音参数对应的所述m个语音帧的类型;
其中,所述SAE模型是所述移动设备或其它移动设备采用所述SAE算法,基于多个第一训练样本训练得到的,每个第一训练样本包括其它语音信号的一个语音帧的低频语音信号对应的低频语音参数。


根据权利要求1或2所述的方法,其特征在于,所述移动设备根据n个清音帧的低频语音参数和混合高斯模型算法,得到所述n个清音帧对应的n个高频语音信号,包括:
所述移动设备根据n个清音帧的低频语音参数和混合高斯模型算法,得到所述n个清音帧的高频语音参数;
所述移动设备根据所述n个清音帧的高频语音参数,构建所述n个高频语音信号。


根据权利要求1或2所述的方法,其特征在于,所述移动设备根据k个浊音帧的低频语音参数和神经网络算法,得到所述k个浊音帧对应的k个高频语音信号,包括:
所述移动设备根据k个浊音帧的低频语音参数和神经网络模型,采用神经网络算法,得到所述k个浊音帧的高频语音参数;
所述移动设备根据所述k个浊音帧的高频语音参数,构建所述k个高频语音信号;
其中,所述神经网络模型是所述移动设备或其它移动设备采用所述神经网络算法,基于多个第二训练样本训练得到的,一个所述第二训练样本包括一个其它语音信号的h个浊音帧的h组低频语音参数,h为大于1的整数。


根据权利要求4所述的方法,其特征在于,所述神经网络算法为长短期记忆LSTM神经网络算法,所述神经网络模型为LSTM神经网络模型;或者,
所述神经网络算法为双向循环神经网络BRNN算法,所述神经网络模型为BRNN模型;或者,
所述神经网络算法为循环神经网络RNN算法,所述神经网络模型为RNN模型。


一种移动设备,其...

【专利技术属性】
技术研发人员:赵月娇李向东杨霖尹朝阳于雪松张晶
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1