语音增强方法、电子设备、程序产品及存储介质技术

技术编号:42130955 阅读:23 留言:0更新日期:2024-07-25 00:45
一种语音增强方法、电子设备、程序产品及计算机可读存储介质,获取待去噪语音信号的多个不同频谱图(202);利用与每个所述频谱图对应的注意力网络,分别获取每个频谱图的加权频谱图(204);其中,注意力网络在训练时采用注意力机制,使得注意力网络通过预先学习到的频谱图中不同子频带对区分语音和噪声的影响程度,为频谱图的各个子频带分配权重;利用携带有幅度信息的加权频谱图,获取多个子带的频谱信息(206);获取每个加权频谱图的全频带频谱信息(208);利用多个子带的频谱信息和每个加权频谱图的全频带频谱信息预测出时频掩膜后,对待去噪语音信号进行去噪(210)。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍


技术实现思路

【技术保护点】

PCT国内申请,权利要求书已公开。

【技术特征摘要】
【国外来华专利技术】

pct国内申请,权...

【专利技术属性】
技术研发人员:吴志勇康世胤陈鋆王子林陀得意
申请(专利权)人:清华大学深圳国际研究生院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1