基于深度神经网络的语音特征增强后置滤波方法技术

技术编号:24689986 阅读:68 留言:0更新日期:2020-06-27 09:50
本发明专利技术涉及一种基于深度神经网络的语音特征增强后置滤波方法,属于语音滤波技术领域,包括以下步骤:S1:将纯净语音与噪声按不同信噪比混合,生成训练数据;S2:选择训练数据的对数功率谱LPS作为特征进行提取,以纯净语音的LPS作为目标;S3:使用标准结构深度神经网络DNN进行训练;S4:对训练结果进行损失估计;S5:输入损失语音,基于损失估计进行损失补偿。相比于现有技术,本发明专利技术能够在保证语音质量的同时有效抑制噪声干扰。

Speech feature enhancement post filtering method based on depth neural network

【技术实现步骤摘要】
基于深度神经网络的语音特征增强后置滤波方法
本专利技术属于语音滤波
,涉及一种基于深度神经网络的语音特征增强后置滤波方法。
技术介绍
语音是人类最自然、最常用的信息传递方式。无论是在日常生活中还是在快速发展的互联网上,语音作为主要媒体之一,承载着大量的有用信息。因此,对语音中的信息进行分析、处理和识别无疑具有广阔的应用前景。目前,在提高语音识别系统的噪声鲁棒性方面存在两种策略:①减小噪声对特征的影响使其适应干净语音训练的声学模型,即特征增强;②修改声学模型使其适应混噪语音,即模型补偿。相比之下,特征增强运行在识别系统的前端,具有较小的时间复杂度;而且无需改变声学模型和识别器结构,便于集成到不同的识别系统。一种理想的语音特征应该有3个特点:1.良好的可区分性,即相同类别样本的特征相似,不同类别样本的特征具有较大差异,这是模式分类的内在要求;2.较高压缩率,即在满足特点1的情况下特征位数尽可能地少,以减小识别的时间复杂度;3.具有噪声鲁棒性。传统信号处理的语音特征增强算法,目前存在的方法主要有3本文档来自技高网...

【技术保护点】
1.一种基于深度神经网络的语音特征增强后置滤波方法,其特征在于:包括以下步骤:/nS1:将纯净语音与噪声按不同信噪比混合,生成训练数据;/nS2:选择训练数据的对数功率谱LPS作为特征进行提取,以纯净语音的LPS作为目标;/nS3:使用标准结构深度神经网络DNN进行训练;/nS4:对训练结果进行损失估计;/nS5:输入损失语音,基于损失估计进行损失补偿。/n

【技术特征摘要】
1.一种基于深度神经网络的语音特征增强后置滤波方法,其特征在于:包括以下步骤:
S1:将纯净语音与噪声按不同信噪比混合,生成训练数据;
S2:选择训练数据的对数功率谱LPS作为特征进行提取,以纯净语音的LPS作为目标;
S3:使用标准结构深度神经网络DNN进行训练;
S4:对训练结果进行损失估计;
S5:输入损失语音,基于损失估计进行损失补偿。


2.根据权利要求1所述的基于深度神经网络的语音特征增强后置滤波方法,其特征在于:步骤S2中,选择训练数据的LPS作为特征,纯净语音的LPS作为目标,维度均为257。


3.根据权利要求1所述的基于深度神经网络的语音特征增强后置滤波方法,其特征在于:步骤S2中,输出层包含257个神经元,Dropout比例为0.2。


4.根据权利要求1所述的基于深度神经网络的语音特征增强后置滤波方法,其特...

【专利技术属性】
技术研发人员:武鹏飞周翊
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1