一种改进的基于自注意力机制的高性能降噪算法制造技术

技术编号:38671212 阅读:21 留言:0更新日期:2023-09-02 22:49
本发明专利技术提供一种改进的基于自注意力机制的高性能降噪算法,利用深层神经网络强大的映射能力,减少自注意力机制的计算复杂度,并结合频谱掩模的策略,实现了一种应对复杂噪声环境的高性能降噪算法。本发明专利技术的算法相较于其他语音增强算法,有着更小的计算复杂度、能够有效地捕捉输入语音的时频特征、可以在低信噪比环境下实现更好的降噪效果。环境下实现更好的降噪效果。环境下实现更好的降噪效果。

【技术实现步骤摘要】
一种改进的基于自注意力机制的高性能降噪算法


[0001]本专利技术涉及语音降噪
,具体涉及一种改进的基于自注意力机制的高性能降噪算法。

技术介绍

[0002]语音在我们的日常生活中广泛使用,例如移动通信,音频聊天,远程会议和语音控制。随着生活质量的持续改善,人们对语音的质量和清晰度有了更高的要求。但是,语音会受到许多噪音的干扰,严重影响听众的体验。目前主流的语音增强方案是基于神经网络的频域方法,该方法在频域上进行操作,能够关注到更多的特征与信息。除此,还可以提高系统的鲁棒性并一定程度降低计算成本。但是目前这些算法仍存在计算复杂度高、复杂环境时性能较差等问题。

技术实现思路

[0003]为了解决现有技术中的问题,本专利技术利用深层神经网络强大的映射能力,减少self

attention的计算复杂度,并结合频谱掩模的策略,实现了一种应对复杂噪声环境的高性能降噪算法。
[0004]实现本专利技术目的的技术方案为:
[0005]本专利技术针对传统self

attention算本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种改进的基于自注意力机制的高性能降噪算法,其特征在于:包括如下步骤:1)将输入经过层标准化处理,然后再经过逐点卷积捕捉跨通道信息,接着使用深度卷积提取时频维度的特征信息,最后分割得到Q、K、V三个投影矩阵,计算公式为:积提取时频维度的特征信息,最后分割得到Q、K、V三个投影矩阵,计算公式为:积提取时频维度的特征信息,最后分割得到Q、K、V三个投影矩阵,计算公式为:其中,Q表示Query,K表示Key,V表示Value,和分别表示逐点卷积和深度卷积中的投影矩阵;2)将Q、K、V三个矩阵的维度重新变化为R
(C,L
×
F)
、R
(L
×
F,C)
和R
(C,L
×
F)
,其中R表示实数域,C表示通道维度,L表示时间帧数,F表示频率点数;3)计算Q、K矩阵的点积来跨通道地隐式编码全局信息,经过归一化指数函数计算后,得到的通道注意力图的尺寸为R
...

【专利技术属性】
技术研发人员:吴德钦冉启海王明江
申请(专利权)人:深圳市宇思半导体有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1