【技术实现步骤摘要】
一种用于带噪语音信号的处理恢复方法和控制系统
[0001]本申请涉及无线通信领域,更具体地,涉及一种用于无线通信中带噪语音信号的处理恢复方法和控制系统。
技术介绍
[0002]随着物联网的发展,除了手机以外,人们频繁且广泛地使用各种小型化便携式智能设备,例如智能眼镜、无线蓝牙耳机、无线蓝牙音箱等,在各种多变的噪声背景下,例如地铁、商圈人群、赛场、户外场地等,来执行语音通话功能。与手机不同之处在于,这些小型化便携式智能设备通常对成本和尺寸有严格的要求,配备的芯片也比较小,存储空间和算力有限,也称为“边缘计算”。
[0003]目前虽然采用了一些语音通信降噪技术,但通常在频域对噪声能量高的频率分量进行强度抑制,往往会在大噪声情况下损失语音清晰度,使得降噪后的语音质量很差,不可避免地会损伤语音,影响用户听音体验。此外,这些语音通话降噪技术受限于小型化便携式智能设备的芯片配置,算法通常较为粗糙,或者计算缓慢导致听音滞后,不能满足人们对高语音质量和实时性的需求。
技术实现思路
[0004]提供了本申请以解决现有技 ...
【技术保护点】
【技术特征摘要】
1.一种用于带噪语音信号的处理恢复方法,其特征在于,包括:获取要处理的带噪语音信号;对所述带噪语音信号进行STFT变换,以得到声谱图;基于所述声谱图,确定时频语音特征;基于所述时频语音特征,利用抑噪学习网络来估计各个频点的掩蔽值,作为各个频点的抑噪量;基于各个频点的掩蔽值和声谱图,确定抑噪后的频域语音信号;基于所述频域语音信号,计算功率谱密度;基于所述功率谱密度,通过执行LPC处理,来预测抑噪后的时域语音信号的线性部分和残差部分;对所述频域语音信号进行ISTFT变换,以得到抑噪后的时域语音信号;基于所述抑噪后的时域语音信号、所述线性部分和残差部分,利用恢复学习网络来恢复出增强后的残差部分;将预测的线性部分和增强后的残差部分求和,来得到恢复后的语音信号,使其语音清晰度高于预定阈值。2.根据权利要求1所述的处理恢复方法,其特征在于,所述语音特征包括MFCC特征。3.根据权利要求1所述的处理恢复方法,其特征在于,所述抑噪学习网络为LSTM神经网络,而所述恢复学习网络为GRU神经网络。4.根据权利要求1所述的处理恢复方法,其特征在于,基于所述时频语音特征,利用抑噪学习网络来估计各个频点的掩蔽值具体包括:先将语音特征馈送到第一组全连接层进行降维处理,再馈送到所述抑噪学习网络。5.根据权利要求1或4所述的处理恢复方法,其特征在于,基于所述时频语音特征,利用抑噪学习网络来估计各个频点的掩蔽值具体还包括:基于所述...
【专利技术属性】
技术研发人员:李倩,
申请(专利权)人:恒玄科技上海股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。