【技术实现步骤摘要】
一种改进的基于自注意力机制的高性能降噪算法
[0001]本专利技术涉及语音降噪
,具体涉及一种改进的基于自注意力机制的高性能降噪算法。
技术介绍
[0002]语音在我们的日常生活中广泛使用,例如移动通信,音频聊天,远程会议和语音控制。随着生活质量的持续改善,人们对语音的质量和清晰度有了更高的要求。但是,语音会受到许多噪音的干扰,严重影响听众的体验。目前主流的语音增强方案是基于神经网络的频域方法,该方法在频域上进行操作,能够关注到更多的特征与信息。除此,还可以提高系统的鲁棒性并一定程度降低计算成本。但是目前这些算法仍存在计算复杂度高、复杂环境时性能较差等问题。
技术实现思路
[0003]为了解决现有技术中的问题,本专利技术利用深层神经网络强大的映射能力,减少self
‑
attention的计算复杂度,并结合频谱掩模的策略,实现了一种应对复杂噪声环境的高性能降噪算法。
[0004]实现本专利技术目的的技术方案为:
[0005]本专利技术针对传统self
‑
...
【技术保护点】
【技术特征摘要】
1.一种改进的基于自注意力机制的高性能降噪算法,其特征在于:包括如下步骤:1)将输入经过层标准化处理,然后再经过逐点卷积捕捉跨通道信息,接着使用深度卷积提取时频维度的特征信息,最后分割得到Q、K、V三个投影矩阵,计算公式为:积提取时频维度的特征信息,最后分割得到Q、K、V三个投影矩阵,计算公式为:积提取时频维度的特征信息,最后分割得到Q、K、V三个投影矩阵,计算公式为:其中,Q表示Query,K表示Key,V表示Value,和分别表示逐点卷积和深度卷积中的投影矩阵;2)将Q、K、V三个矩阵的维度重新变化为R
(C,L
×
F)
、R
(L
×
F,C)
和R
(C,L
×
F)
,其中R表示实数域,C表示通道维度,L表示时间帧数,F表示频率点数;3)计算Q、K矩阵的点积来跨通道地隐式编码全局信息,经过归一化指数函数计算后,得到的通道注意力图的尺寸为R
...
【专利技术属性】
技术研发人员:吴德钦,冉启海,王明江,
申请(专利权)人:深圳市宇思半导体有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。