语音信号的处理方法和移动设备技术

技术编号：26514677 阅读：82 留言：0更新日期：2020-11-27 15:44

一种语音信号的处理方法和移动设备，方法包括：对接收到的编码后的语音信号解码后得到m组低频语音参数；m组低频语音参数为语音信号的m个语音帧的低频语音参数；基于m组低频语音参数确定m个语音帧的类型，并重构m个语音帧对应的低频语音信号；根据n个清音帧的低频语音参数和混合高斯模型算法，得到n个清音帧对应的n个高频语音信号，并根据k个浊音帧的低频语音参数和神经网络算法，得到k个浊音帧对应的k个高频语音信号，n和k的和等于m；对每个语音帧的低频语音信号和高频语音信号进行合成，得到宽带语音信号。降低了噪声引入的概率，保留了原始语音的情感度，可精确的再现原始语音。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】语音信号的处理方法和移动设备
本申请涉及信号处理
，尤其涉及一种语音信号的处理方法和移动设备。
技术介绍
在信息传输中，语音是最直观简洁的通信方式。通常自然语音的带宽在50Hz～8000Hz之间，然而在现代通信系统中，由于受传输带宽的限制，语音的频带范围被限制在300Hz～3400Hz之间，300Hz～3400Hz之间的语音信号称为窄带语音信号。语音的主要能量包含在低频语音信号中，而高频信号的缺失使得语音信号的清晰度与自然度在一定程度上受到影响，声色等一些代表说话者特性部分的信息被丢失；如打电话过程中语音失真较为严重，特别是在嘈杂的环境中，失真度往往不被用户接受。随着移动设备对语音质量的要求越来越高，仅仅是能听懂移动设备发出的声音已经远远不满足人们的需求。高清晰度，高保真度的语音信号是各种移动设备的新要求。因此相关研究者越来越多的技术投入到语音的带宽扩展中，以得到宽带语音。目前语音扩展的方法主要有基于网络映射的方法和基于统计学模型的方法两种。基于网络映射的方法，最终得到的宽带语音中的噪声较大；基于统计学模型的方法，最终得到的宽带语音不能保留原始语音的情感度。
技术实现思路
本申请提供一种语音信号的处理方法和移动设备，得到的宽带语音噪声小且保留了原始语音的情感度，能够很好的再现原始语音。第一方面提供一种语音信号的处理方法，包括：移动设备对接收到的编码后的语音信号解码后得到m组低频语音参数；所述m组低频语音参数为所述语音信号的m个语音帧的低频语音参数，m为大于1的整数；所述移动设...

【技术保护点】
一种语音信号的处理方法，其特征在于，包括：/n移动设备对接收到的编码后的语音信号解码后得到m组低频语音参数；所述m组低频语音参数为所述语音信号的m个语音帧的低频语音参数，m为大于1的整数；/n所述移动设备基于所述m组低频语音参数确定所述m个语音帧的类型，并重构所述m个语音帧对应的低频语音信号，所述类型包括清音帧或浊音帧；/n所述移动设备根据n个清音帧的低频语音参数和混合高斯模型算法，得到所述n个清音帧对应的n个高频语音信号，并根据k个浊音帧的低频语音参数和神经网络算法，得到所述k个浊音帧对应的k个高频语音信号，n和k为大于1的整数，n和k的和等于m；/n所述移动设备对所述m个语音帧中每个语音帧的低频语音信号和高频语音信号进行合成，得到宽带语音信号。/n

【技术特征摘要】
【国外来华专利技术】一种语音信号的处理方法，其特征在于，包括：
移动设备对接收到的编码后的语音信号解码后得到m组低频语音参数；所述m组低频语音参数为所述语音信号的m个语音帧的低频语音参数，m为大于1的整数；
所述移动设备基于所述m组低频语音参数确定所述m个语音帧的类型，并重构所述m个语音帧对应的低频语音信号，所述类型包括清音帧或浊音帧；
所述移动设备根据n个清音帧的低频语音参数和混合高斯模型算法，得到所述n个清音帧对应的n个高频语音信号，并根据k个浊音帧的低频语音参数和神经网络算法，得到所述k个浊音帧对应的k个高频语音信号，n和k为大于1的整数，n和k的和等于m；
所述移动设备对所述m个语音帧中每个语音帧的低频语音信号和高频语音信号进行合成，得到宽带语音信号。

根据权利要求1所述的方法，其特征在于，所述移动设备基于所述m组低频语音参数确定所述m个语音帧的类型，包括：
所述移动设备根据所述m组低频语音参数和栈自动编码机SAE模型，采用SAE算法，得到m个标签，所述m个标签用于指示所述m组低频语音参数对应的所述m个语音帧的类型；
其中，所述SAE模型是所述移动设备或其它移动设备采用所述SAE算法，基于多个第一训练样本训练得到的，每个第一训练样本包括其它语音信号的一个语音帧的低频语音信号对应的低频语音参数。

根据权利要求1或2所述的方法，其特征在于，所述移动设备根据n个清音帧的低频语音参数和混合高斯模型算法，得到所述n个清音帧对应的n个高频语音信号，包括：
所述移动设备根据n个清音帧的低频语音参数和混合高斯模型算法，得到所述n个清音帧的高频语音参数；
所述移动设备根据所述n个清音帧的高频语音参数，构建所述n个高频语音信号。

根据权利要求1或2所述的方法，其特征在于，所述移动设备根据k个浊音帧的低频语音参数和神经网络算法，得到所述k个浊音帧对应的k个高频语音信号，包括：
所述移动设备根据k个浊音帧的低频语音参数和神经网络模型，采用神经网络算法，得到所述k个浊音帧的高频语音参数；
所述移动设备根据所述k个浊音帧的高频语音参数，构建所述k个高频语音信号；
其中，所述神经网络模型是所述移动设备或其它移动设备采用所述神经网络算法，基于多个第二训练样本训练得到的，一个所述第二训练样本包括一个其它语音信号的h个浊音帧的h组低频语音参数，h为大于1的整数。

根据权利要求4所述的方法，其特征在于，所述神经网络算法为长短期记忆LSTM神经网络算法，所述神经网络模型为LSTM神经网络模型；或者，
所述神经网络算法为双向循环神经网络BRNN算法，所述神经网络模型为BRNN模型；或者，
所述神经网络算法为循环神经网络RNN算法，所述神经网络模型为RNN模型。

一种移动设备，其...

【专利技术属性】
技术研发人员：赵月娇，李向东，杨霖，尹朝阳，于雪松，张晶，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人