【技术实现步骤摘要】
多维度的RNN的语音降噪方法、装置、设备及介质
[0001]本专利技术涉及语音降噪
,尤其涉及多维度的RNN的语音降噪方法、装置、设备及介质。
技术介绍
[0002]语音,即语言的物质外壳,是语言的外部形式,是最直接地记录人的思维活动的符号体系。它是人的发音器官发出的具有一定社会意义的声音,语音数据就是关于一些声音的数据,有些语音数据在录取时,易掺杂一些噪声,为了提升语音数据的整体质量,需要对于语音进行降噪处理。
[0003]中国专利公开了(CN109584895B)一种语音降噪方法及装置,其中,该方法包括:将目标带噪语音信号按照预定格式中的采样频率进行采样,得到目标带噪语音信号的采样点一;通过语音增强模型,确定与目标带噪语音信号的采样点一对应的目标去噪语音信号的采样点二,其中,语音增强模型为使用多组训练数据通过机器学习训练得到的,多组训练数据中的每组训练数据均包括:带噪语音信号的采样点和与带噪语音信号的采样点对应的去噪语音信号的采样点;将目标去噪语音信号的采样点二转换目标语音的去噪语音。该方案解决了相关技术中 ...
【技术保护点】
【技术特征摘要】
1.一种多维度的RNN的语音降噪方法,其特征在于,包括:S101:获取指定预置占存阈值的原始语音数据;S102:去除所述原始语音数据中存在有杂音的段落,得到去杂语音数据;S103:基于预置降噪算法,将所述去杂语音数据进行降噪处理,得到降噪数据;S104:基于预置RNN算法,对步骤S103进行循环训练,得到趋真降噪数据。2.根据权利要求1所述的多维度的RNN的语音降噪方法,其特征在于,所述S102包括:增强所述去杂语音数据的语谱图,得到增强语音数据;提取所述增强语音数据中的低层音频特征,其中,所述低层音频特征包括短时平均过零率、梅尔频率倒谱系数、频谱均方根值、频谱中心矩、频谱单调值、频谱带宽以及频谱多项式系数;将所述低层音频特征输入至预置训练模型中进行训练,得到用于音频分类的高层音频特征;根据所述高层音频特征,提取所述语音数据中的内容并对所述语音数据进行筛选,得到去杂语音数据。3.根据权利要求1所述的多维度的RNN的语音降噪方法,其特征在于,所述S102包括:对所述语音数据进行MFCC特征提取,得到特征数据;基于稀疏编码算法,对所述特征数据进行计算,得到稀疏系数;将所述稀疏系数作为特征并输入至预置的GMM分类器进行分类处理,得到分类特征,根据所述分类特征,对所述语音数据进行分类,得到去杂语音数据。4.根据权利要求1所述的多维度的RNN的语音降噪方法,其特征在于,在所述S102之后,还包括:对所述去杂语音数据分别进行功率谱分析、片频谱分析以及频谱包络倒频谱分析。5.根据权利要求1所述的多维度的RNN的语音降噪方法,其特征在于,所述S103包括:对所述去杂语音数据进行滤波处理以及加窗分帧处理,得到处理语音数据;将从所述处理语音数据中所提取的特征与预置标准样本进行对比,得到对比值;判断所述对比值是否大于预置差...
【专利技术属性】
技术研发人员:韦伟才,
申请(专利权)人:深圳市龙芯威半导体科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。