一种基于深度学习的噪声估计和语音降噪方法及系统技术方案

技术编号：35352527 阅读：19 留言：0更新日期：2022-10-26 12:23

本发明专利技术涉及一种基于深度学习的噪声估计和语音降噪方法及系统，通过获取噪音并生成语音原始信号数据，将语音原始信号数据进行短时傅里叶变换并进行图像映射生成信号语谱图；将经过图像映射生成的信号语谱图进行语谱图切分；将通过语谱图切分生成长度为W的语谱子图中的语音事件部分进行标注，生成正负样本；将生成的正负样本整理并制作数据集；通过卷积神经网络对整理并制作的数据集进行训练；并对预测结果进行降噪处理。本发明专利技术达到的有益效果是：实现了在没有先验知识的情况下自动进行噪声的估计和降噪处理，降低了人工的成本，提高了降噪的灵活性和适应性；更易克服误去噪和过度降噪等问题减小了对噪声估计的误差。度降噪等问题减小了对噪声估计的误差。度降噪等问题减小了对噪声估计的误差。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的噪声估计和语音降噪方法及系统

[0001]本专利技术涉及语音预测及处理
，特别是一种基于深度学习的噪声估计和语音降噪方法及系统。

技术介绍

[0002]语音在信号通信中被广泛应用于外交、气象、邮电、军事、交通等众多领域，和人们的日常生活息息相关。但在信号实际通信中，经常会因为气候、干扰、衰减等等因素，影响信号通信的传输效果。在大量场景里需要获取信号中的语音内容，这往往需要大量人员通过持续接收并播放固定频点的语音信号来进行内容的识别，且这些语音信号中往往伴随着大量且严重的噪声，这无疑增加了获取语音内容的难度。现阶段深度学习技术在图像识别和检测方面发展成熟，将深度学习技术和传统降噪结合起来，降低获取语音内容的难度，语音质量得到改善，降噪的效果也会有很大的提高。
[0003]现阶段，主流的语音降噪技术都是基于传统方法，虽然能够取得一定效果，但难以应对复杂环境中的噪声，往往出现对噪声估计不准确、噪声去除不明显等问题。同时在语音中特征强弱变化很大，在同一个语音中，噪声可能强弱变换明显，增大了噪声估计的难度，容易出现误去噪和过度降噪等问题。

技术实现思路

[0004]本专利技术的目的在于克服现有技术的缺点，提供一种基于深度学习的噪声估计和语音降噪方法及系统。
[0005]本专利技术的目的通过以下技术方案来实现：一种基于深度学习的噪声估计和语音降噪方法，包括获取噪音并生成语音原始信号数据，将所述语音原始信号数据进行短时傅里叶变换并进行图像映射生成信号语谱图；将经过图像映射生成...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的噪声估计和语音降噪方法，其特征在于：包括获取噪音并生成语音原始信号数据，将所述语音原始信号数据进行短时傅里叶变换并进行图像映射生成信号语谱图；将经过图像映射生成的信号语谱图进行语谱图切分，通过所述语谱图切分生成长度为W的语谱子图；将所述通过所述语谱图切分生成长度为W的语谱子图中的语音事件部分进行标注，生成正负样本；将所述生成的正负样本整理并制作数据集；通过卷积神经网络对所述整理并制作的数据集进行训练；根据卷积神经网络和训练模型对所述信号语谱图进行预测，并对预测结果进行降噪处理。2.根据权利要求1所述一种基于深度学习的噪声估计和语音降噪方法，其特征在于：所述将经过图像映射生成的信号语谱图进行语谱图切分，包括通过所述语谱图切分生成长度为W的语谱子图以及长度不足W的语谱部分，将所述长度不足W的语谱部分进行填充0处理。3.根据权利要求2所述一种基于深度学习的噪声估计和语音降噪方法，其特征在于：所述将所述通过所述语谱图切分生成长度为W的语谱子图中的语音事件部分进行标注，生成正负样本，包括：对切分后的所述语谱子图中包含的话音事件部分进行标注，生成正负样本并按照比例整理正负样本。4.根据权利要求3所述一种基于深度学习的噪声估计和语音降噪方法，其特征在于：所述对切分后的所述语谱子图中包含的话音事件部分进行标注，生成正负样本并按照比例整理正负样本；根据所述生成正负样本并按照比例整理正负样本，将所述正负样本制作成数据集。5.根据权利要求1所述一种基于深度学习的噪声估计和语音降噪方法，其特征在于：所述通过卷积神经网络对所述整理并制作的数据集进行训练；当Loss收敛后训练停止，得到训练后的权重文件；根据所述训练后的权重文件生成预测信号。6.根据权利要求1所述一种基于...

【专利技术属性】
技术研发人员：梁新宇，王圣川，景亮，周祥明，蒋波，
申请(专利权)人：电信科学技术第五研究所有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人