基于深度学习的光纤语音增强方法、系统、介质及设备技术方案

技术编号:37682801 阅读:14 留言:0更新日期:2023-05-28 09:36
本发明专利技术公开了一种基于深度学习的光纤语音增强方法、系统、介质及设备,其方法包括以下步骤:对纯净光纤语音信号及带噪光纤语音信号分别进行短时傅里叶变换,对应获取纯净光纤语音复数域时频信号及带噪光纤语音复数域时频信号;对纯净光纤语音复数域时频信号及带噪光纤语音复数域时频信号进行复数比例掩蔽计算,获得目标光纤语音复数比例掩蔽理论值;根据带噪光纤语音复数域时频信号及目标光纤语音复数比例掩蔽理论值,基于复数卷积神经网络,获取目标光纤语音复数域时频信号估计值;对目标光纤语音复数域时频信号估计值进行逆短时傅里叶变换,获取带噪光纤增强语音信号;达到了对光纤麦克风中的带噪光纤语音信号的噪声抑制作用。制作用。制作用。

【技术实现步骤摘要】
基于深度学习的光纤语音增强方法、系统、介质及设备


[0001]本专利技术涉及语音增强
,特别涉及一种基于深度学习的光纤语音增强方法、系统、介质及设备。

技术介绍

[0002]语音增强技术主要目的是为了去除语音信号中的非平稳环境噪声以及一些平稳的系统内部噪声,提高语音的可懂性与通讯质量,为下一步进行语音识别以及情感分析等方面提供更好质量的声源。
[0003]近年来,随着光纤麦克风技术的发展,因其具有高灵敏度、抗电磁干扰、无源等优势被广泛应用于地震监测、安防侦听和海洋测量等众多领域。在地下工程、公共安全和一些恶劣环境中,传感器周围总是存在较大的环境噪声,严重的噪声会降低语音通信的质量和语音清晰度,因此可能需要语音增强技术。在现阶段,众多研究者都着重于研究电麦克风的语音增强,而光纤麦克风因其内部构造与传声介质不同,声音信号需要光纤传感器进行接收并由解调系统对信号进行解调以恢复声音信号,同时一些光学参数(如光强、相位、偏振状态)也会影响光纤麦克风的声学特性,导致其与电麦克风具有不同的声音频率响应曲线与噪声类型,因此现有很多语音增强工具对于光纤麦克风中的噪声抑制效果欠佳,急需一种有效的语音增强方法来解决光纤麦克风在应用中的现实问题。

技术实现思路

[0004]本专利技术的提供一种基于深度学习的光纤语音增强方法、系统、介质及设备,达到了对光纤麦克风中的带噪光纤语音信号的噪声抑制作用。
[0005]第一方面,提供一种基于深度学习的光纤语音增强方法,包括以下步骤:
[0006]获取光纤麦克风的原始电信号,对所述原始电信号进行预采样处理,获取纯净光纤语音信号与带噪光纤语音信号;
[0007]对所述纯净光纤语音信号及所述带噪光纤语音信号分别进行剪辑对齐处理后进行短时傅里叶变换,对应获取纯净光纤语音复数域时频信号及带噪光纤语音复数域时频信号;
[0008]对所述纯净光纤语音复数域时频信号及所述带噪光纤语音复数域时频信号进行复数比例掩蔽计算,获得带噪光纤语音信号的目标光纤语音复数比例掩蔽理论值;
[0009]根据所述带噪光纤语音复数域时频信号及所述目标光纤语音复数比例掩蔽理论值,并基于复数卷积神经网络,获取目标光纤语音复数域时频信号估计值;
[0010]对所述目标光纤语音复数域时频信号估计值进行逆短时傅里叶变换,获取带噪光纤增强语音信号。
[0011]根据第一方面,在第一方面的第一种可能的实现方式中,所述“根据所述带噪光纤语音复数域时频信号及所述目标光纤语音复数比例掩蔽理论值,并基于复数卷积神经网络,获取目标光纤语音复数域时频信号估计值”步骤,具体包括以下步骤:
[0012]使用所述带噪光纤语音复数域时频信号及所述目标光纤语音复数比例掩蔽理论值对复数卷积神经网络进行训练得到光纤语音增强模型;
[0013]根据所述光纤语音增强模型对所述带噪光纤语音复数域时频信号进行预测,获取目标光纤语音复数比例掩蔽估计值;
[0014]使用所述目标光纤语音复数比例掩蔽估计值对所述带噪光纤语音复数域时频信号进行语音增强,获取目标光纤语音复数域时频信号估计值。
[0015]根据第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述“使用所述目标光纤语音复数比例掩蔽估计值对所述带噪光纤语音复数域时频信号进行语音增强,获取目标光纤语音复数域时频信号估计值”步骤,具体包括以下步骤:
[0016]使用所述目标光纤语音复数比例掩蔽估计值M
n
对所述带噪光纤语音复数域时频信号X
n
进行语音增强;
[0017]获取目标光纤语音复数域时频信号估计值E如下:
[0018]E=X
n
*M
n

[0019]根据第一方面,在第一方面的第三种可能的实现方式中,所述纯净光纤语音复数域时频信号及所述带噪光纤语音复数域时频信号中的复数域时频信号均表示如下:
[0020]W=A+iB;
[0021]式中,i为复数虚部单位,A为复数域时频信号的实数部分,B为复数域时频信号的虚数部分。
[0022]根据第一方面,在第一方面的第四种可能的实现方式中,所述带噪光纤语音信号的目标光纤语音复数比例掩蔽理论值如下:
[0023][0024]式中,Y
r
与Y
i
分别为带噪光纤语音复数域时频信号的实数部分与虚数部分;S
r
与S
i
分别为纯净光纤语音复数域时频信号的实部与虚部;j为比例掩蔽虚部单位。
[0025]根据第一方面,在第一方面的第五种可能的实现方式中,所述“对所述原始电信号进行预采样处理,获取纯净光纤语音信号与带噪光纤语音信号”步骤,具体包括以下步骤:
[0026]对处于预设电压范围内的原始电信号以预设采样率值进行采样,将采样后的原始电信号映射至预设int值范围内,并通过PCM编码方式获取纯净光纤语音信号与带噪光纤语音信号。
[0027]第二方面,提供了一种基于深度学习的光纤语音增强系统,包括以下步骤:
[0028]光纤语音信号模块,用于获取光纤麦克风的原始电信号,对所述原始电信号进行预采样处理,获取纯净光纤语音信号与带噪光纤语音信号;
[0029]复数域时频信号模块,与所述光纤语音信号模块通信连接,用于对所述纯净光纤语音信号及所述带噪光纤语音信号分别进行剪辑对齐处理后进行短时傅里叶变换,对应获取纯净光纤语音复数域时频信号及带噪光纤语音复数域时频信号;
[0030]复数比例掩蔽计算模块,与所述复数域时频信号模块通信连接,用于对所述纯净光纤语音复数域时频信号及所述带噪光纤语音复数域时频信号进行复数比例掩蔽计算,获得带噪光纤语音信号的目标光纤语音复数比例掩蔽理论值;
[0031]训练模块,与所述复数域时频信号模块及所述复数比例掩蔽计算模块通信连接,用于根据所述带噪光纤语音复数域时频信号及所述目标光纤语音复数比例掩蔽理论值,并基于复数卷积神经网络,获取目标光纤语音复数域时频信号估计值;
[0032]逆变换模块,与所述训练模块通信连接,用于对所述目标光纤语音复数域时频信号估计值进行逆短时傅里叶变换,获取带噪光纤增强语音信号。
[0033]根据第一方面,在第一方面的第一种可能的实现方式中,所述训练模块,用于使用所述带噪光纤语音复数域时频信号及所述目标光纤语音复数比例掩蔽理论值对复数卷积神经网络进行训练得到光纤语音增强模型;根据所述光纤语音增强模型对所述带噪光纤语音复数域时频信号进行预测,获取目标光纤语音复数比例掩蔽估计值;使用所述目标光纤语音复数比例掩蔽估计值对所述带噪光纤语音复数域时频信号进行语音增强,获取目标光纤语音复数域时频信号估计值。
[0034]第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述所述的基于深度学习的光纤语音增强方法。
[0035]第四方面,提本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的光纤语音增强方法,其特征在于,包括以下步骤:获取光纤麦克风的原始电信号,对所述原始电信号进行预采样处理,获取纯净光纤语音信号与带噪光纤语音信号;对所述纯净光纤语音信号及所述带噪光纤语音信号分别进行剪辑对齐处理后进行短时傅里叶变换,对应获取纯净光纤语音复数域时频信号及带噪光纤语音复数域时频信号;对所述纯净光纤语音复数域时频信号及所述带噪光纤语音复数域时频信号进行复数比例掩蔽计算,获得带噪光纤语音信号的目标光纤语音复数比例掩蔽理论值;根据所述带噪光纤语音复数域时频信号及所述目标光纤语音复数比例掩蔽理论值,并基于复数卷积神经网络,获取目标光纤语音复数域时频信号估计值;对所述目标光纤语音复数域时频信号估计值进行逆短时傅里叶变换,获取带噪光纤增强语音信号。2.如权利要求1所述的基于深度学习的光纤语音增强方法,其特征在于,所述“根据所述带噪光纤语音复数域时频信号及所述目标光纤语音复数比例掩蔽理论值,并基于复数卷积神经网络,获取目标光纤语音复数域时频信号估计值”步骤,具体包括以下步骤:使用所述带噪光纤语音复数域时频信号及所述目标光纤语音复数比例掩蔽理论值对复数卷积神经网络进行训练得到光纤语音增强模型;根据所述光纤语音增强模型对所述带噪光纤语音复数域时频信号进行预测,获取目标光纤语音复数比例掩蔽估计值;使用所述目标光纤语音复数比例掩蔽估计值对所述带噪光纤语音复数域时频信号进行语音增强,获取目标光纤语音复数域时频信号估计值。3.如权利要求2所述的基于深度学习的光纤语音增强方法,其特征在于,所述“使用所述目标光纤语音复数比例掩蔽估计值对所述带噪光纤语音复数域时频信号进行语音增强,获取目标光纤语音复数域时频信号估计值”步骤,具体包括以下步骤:使用所述目标光纤语音复数比例掩蔽估计值M
n
对所述带噪光纤语音复数域时频信号X
n
进行语音增强;获取目标光纤语音复数域时频信号估计值E如下:E=X
n
*M
n
。4.如权利要求1所述的基于深度学习的光纤语音增强方法,其特征在于,所述纯净光纤语音复数域时频信号及所述带噪光纤语音复数域时频信号中的复数域时频信号均表示如下:W=A+iB;式中,i为复数虚部单位,A为复数域时频信号的实数部分,B为复数域时频信号的虚数部分。5.如权利要求1所述的基于深度学习的光纤语音增强方法,其特征在于,所述带噪光纤语音信号的目标光纤语音复数比例掩蔽理论值如下:式中,Y
r
与Y
i
分别为带噪光纤语音复数域时频信号的实数部...

【专利技术属性】
技术研发人员:柴世一曹巍郭灿陈浩秦海鑫
申请(专利权)人:杭州楚芯光电科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1