一种基于深度学习的噪声估计和语音降噪方法及系统技术方案

技术编号:35352527 阅读:19 留言:0更新日期:2022-10-26 12:23
本发明专利技术涉及一种基于深度学习的噪声估计和语音降噪方法及系统,通过获取噪音并生成语音原始信号数据,将语音原始信号数据进行短时傅里叶变换并进行图像映射生成信号语谱图;将经过图像映射生成的信号语谱图进行语谱图切分;将通过语谱图切分生成长度为W的语谱子图中的语音事件部分进行标注,生成正负样本;将生成的正负样本整理并制作数据集;通过卷积神经网络对整理并制作的数据集进行训练;并对预测结果进行降噪处理。本发明专利技术达到的有益效果是:实现了在没有先验知识的情况下自动进行噪声的估计和降噪处理,降低了人工的成本,提高了降噪的灵活性和适应性;更易克服误去噪和过度降噪等问题减小了对噪声估计的误差。度降噪等问题减小了对噪声估计的误差。度降噪等问题减小了对噪声估计的误差。

【技术实现步骤摘要】
一种基于深度学习的噪声估计和语音降噪方法及系统


[0001]本专利技术涉及语音预测及处理
,特别是一种基于深度学习的噪声估计和语音降噪方法及系统。

技术介绍

[0002]语音在信号通信中被广泛应用于外交、气象、邮电、军事、交通等众多领域,和人们的日常生活息息相关。但在信号实际通信中,经常会因为气候、干扰、衰减等等因素,影响信号通信的传输效果。在大量场景里需要获取信号中的语音内容,这往往需要大量人员通过持续接收并播放固定频点的语音信号来进行内容的识别,且这些语音信号中往往伴随着大量且严重的噪声,这无疑增加了获取语音内容的难度。现阶段深度学习技术在图像识别和检测方面发展成熟,将深度学习技术和传统降噪结合起来,降低获取语音内容的难度,语音质量得到改善,降噪的效果也会有很大的提高。
[0003]现阶段,主流的语音降噪技术都是基于传统方法,虽然能够取得一定效果,但难以应对复杂环境中的噪声,往往出现对噪声估计不准确、噪声去除不明显等问题。同时在语音中特征强弱变化很大,在同一个语音中,噪声可能强弱变换明显,增大了噪声估计的难度,容易出现误去噪和过度降噪等问题。

技术实现思路

[0004]本专利技术的目的在于克服现有技术的缺点,提供一种基于深度学习的噪声估计和语音降噪方法及系统。
[0005]本专利技术的目的通过以下技术方案来实现:一种基于深度学习的噪声估计和语音降噪方法,包括获取噪音并生成语音原始信号数据,将所述语音原始信号数据进行短时傅里叶变换并进行图像映射生成信号语谱图;将经过图像映射生成的信号语谱图进行语谱图切分,通过所述语谱图切分生成长度为W的语谱子图;将所述通过所述语谱图切分生成长度为W的语谱子图中的语音事件部分进行标注,生成正负样本;将所述生成的正负样本整理并制作数据集;通过卷积神经网络对所述整理并制作的数据集进行训练;
[0006]根据卷积神经网络和训练模型对所述信号语谱图进行预测,并对预测结果进行降噪处理。
[0007]优选的,所述将经过图像映射生成的信号语谱图进行语谱图切分,包括通过所述语谱图切分生成长度为W的语谱子图以及长度不足W的语谱部分,将所述长度不足W的语谱部分进行填充0处理。
[0008]优选的,所述将所述通过所述语谱图切分生成长度为W的语谱子图中的语音事件部分进行标注,生成正负样本,包括:对切分后的所述语谱子图中包含的话音事件部分进行标注,生成正负样本并按照比例整理正负样本。
[0009]优选的,所述对切分后的所述语谱子图中包含的话音事件部分进行标注,生成正负样本并按照比例整理正负样本;
[0010]根据所述生成正负样本并按照比例整理正负样本,将所述正负样本制作成数据集。
[0011]优选的,所述通过卷积神经网络对所述整理并制作的数据集进行训练;当Loss收敛后训练停止,得到训练后的权重文件;根据所述训练后的权重文件生成预测信号。
[0012]优选的,所述根据卷积神经网络和训练模型对所述信号语谱图进行预测,包括将预测信号转化为语谱图并进行切分、归一化;
[0013]通过设计的卷积神经网络和训练好的模型对所述信号语谱图进行预测;将切分后的语谱图按照顺序整理为一组特征向量。
[0014]优选的,将所述特征向量进行连续性处理,并生成一维向量;同时,得到语音事件的位置分布信息。
[0015]优选的,将所述一维向量进行噪声连续性处理,得到噪声的位置分布信息;根据噪声近邻原则,通过谱减法对所述语音信号数据进行降噪。
[0016]优选的,所述通过谱减法对所述语音信号数据进行降噪,包括通过反向短时傅里叶变换,得到降噪后的语音信号。
[0017]一种基于深度学习的噪声估计和语音降噪系统,包括:
[0018]语音数据生成单元,用于获取噪音并生成语音原始信号数据;
[0019]数据处理单元,用于将所述语音原始信号数据进行短时傅里叶变换;将所述生成的正负样本整理并制作数据集;将所述一维向量进行噪声连续性处理,得到噪声的位置分布信息以及所述通过谱减法对所述语音信号数据进行降噪,包括通过反向短时傅里叶变换;
[0020]语音图谱处理单元,用于对语音原始信号数据进行图像映射生成信号语谱图;
[0021]将经过图像映射生成的信号语谱图进行语谱图切分,通过所述语谱图切分生成长度为W的语谱子图;将所述通过所述语谱图切分生成长度为W的语谱子图中的语音事件部分进行标注,生成正负样本;
[0022]噪音预测及降噪单元,用于根据卷积神经网络和训练模型对所述信号语谱图进行预测,并对预测结果进行降噪处理。
[0023]本专利技术具有以下优点:基于上述方案,本专利技术通过获取噪音并生成语音原始信号数据,将语音原始信号数据进行短时傅里叶变换并进行图像映射生成信号语谱图;将经过图像映射生成的信号语谱图进行语谱图切分,通过语谱图切分生成长度为W的语谱子图;将通过语谱图切分生成长度为W的语谱子图中的语音事件部分进行标注,生成正负样本;将生成的正负样本整理并制作数据集;通过卷积神经网络对整理并制作的数据集进行训练;根据卷积神经网络和训练模型对信号语谱图进行预测,并对预测结果进行降噪处理。实现了在没有先验知识的情况下自动进行噪声的估计和降噪处理,降低了人工的成本,提高了降噪的灵活性和适应性;更易克服误去噪和过度降噪等问题减小了对噪声估计的误差。
附图说明
[0024]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这
些附图获得其他相关的附图。
[0025]图1为本专利技术一种基于深度学习的噪声估计和语音降噪方法的流程意图;
[0026]图2为本专利技术一种基于深度学习的噪声估计和语音降噪方法结构示意图;
[0027]图3为本专利技术数据集制作过程示意图;
[0028]图4为本专利技术预测流程示意图;
[0029]图5为本专利技术一维压缩神经网络结构示意图;
[0030]图6为本专利技术特征连续性处理过程示意图;
[0031]图7为本专利技术噪声连续性处理过程示意图;
[0032]图8为本专利技术一种基于深度学习的噪声估计和语音降噪系统结构示意图。
具体实施方式
[0033]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0034本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的噪声估计和语音降噪方法,其特征在于:包括获取噪音并生成语音原始信号数据,将所述语音原始信号数据进行短时傅里叶变换并进行图像映射生成信号语谱图;将经过图像映射生成的信号语谱图进行语谱图切分,通过所述语谱图切分生成长度为W的语谱子图;将所述通过所述语谱图切分生成长度为W的语谱子图中的语音事件部分进行标注,生成正负样本;将所述生成的正负样本整理并制作数据集;通过卷积神经网络对所述整理并制作的数据集进行训练;根据卷积神经网络和训练模型对所述信号语谱图进行预测,并对预测结果进行降噪处理。2.根据权利要求1所述一种基于深度学习的噪声估计和语音降噪方法,其特征在于:所述将经过图像映射生成的信号语谱图进行语谱图切分,包括通过所述语谱图切分生成长度为W的语谱子图以及长度不足W的语谱部分,将所述长度不足W的语谱部分进行填充0处理。3.根据权利要求2所述一种基于深度学习的噪声估计和语音降噪方法,其特征在于:所述将所述通过所述语谱图切分生成长度为W的语谱子图中的语音事件部分进行标注,生成正负样本,包括:对切分后的所述语谱子图中包含的话音事件部分进行标注,生成正负样本并按照比例整理正负样本。4.根据权利要求3所述一种基于深度学习的噪声估计和语音降噪方法,其特征在于:所述对切分后的所述语谱子图中包含的话音事件部分进行标注,生成正负样本并按照比例整理正负样本;根据所述生成正负样本并按照比例整理正负样本,将所述正负样本制作成数据集。5.根据权利要求1所述一种基于深度学习的噪声估计和语音降噪方法,其特征在于:所述通过卷积神经网络对所述整理并制作的数据集进行训练;当Loss收敛后训练停止,得到训练后的权重文件;根据所述训练后的权重文件生成预测信号。6.根据权利要求1所述一种基于...

【专利技术属性】
技术研发人员:梁新宇王圣川景亮周祥明蒋波
申请(专利权)人:电信科学技术第五研究所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1