语音增强方法、电子设备、程序产品及存储介质技术

技术编号：42130955 阅读：23 留言：0更新日期：2024-07-25 00:45

一种语音增强方法、电子设备、程序产品及计算机可读存储介质，获取待去噪语音信号的多个不同频谱图(202)；利用与每个所述频谱图对应的注意力网络，分别获取每个频谱图的加权频谱图(204)；其中，注意力网络在训练时采用注意力机制，使得注意力网络通过预先学习到的频谱图中不同子频带对区分语音和噪声的影响程度，为频谱图的各个子频带分配权重；利用携带有幅度信息的加权频谱图，获取多个子带的频谱信息(206)；获取每个加权频谱图的全频带频谱信息(208)；利用多个子带的频谱信息和每个加权频谱图的全频带频谱信息预测出时频掩膜后，对待去噪语音信号进行去噪(210)。