一种轻量化多轴Transformer的单通道降噪方法技术

技术编号:40421763 阅读:21 留言:0更新日期:2024-02-20 22:40
本发明专利技术涉及降噪方法,尤其涉及一种轻量化多轴Transformer的单通道降噪方法。可以充分提取语音信号潜在的时频特征。采用多头动态局部自关注模块高效提取局部特征。本文提出的方法具有更少的网络参数和更低的计算成本,同时与最先进的方法相比,在语音信号的质量和可懂度方面具有竞争力。可以充分提取语音信号潜在的时频特征,能够有效降低计算机的资源消耗。提示块以使得模型更好学得频率特征信息。

【技术实现步骤摘要】

本专利技术涉及降噪方法,尤其涉及一种轻量化多轴transformer的单通道降噪方法。


技术介绍

1、语音增强能够有效抑制环境噪声,提高语音信号的可理解性,是语音信号前端处理的关键任务。在语音通话和视频会议等互动过程中,经常会面临语音信号受到噪声干扰的问题,这严重影响了用户体验。为了改善这一情况,许多降噪解决方案已经被提出。目前的单通道语音增强方法存在的问题是对音频的时频特征分析不足,这会使得算法在复杂声学场景中性能大幅下降。同时,基于经典transformer结构的模型存在计算量大的缺点,特别是随着音频时长的增加,计算量会呈现指数增长,这会大幅提高模型对计算机资源的占用。

2、此外,在现有的transformer设计中,查询和键之间的所有相似性都用于特征聚合。然而,由于并非所有查询都与键相关,因此使用所有相似度不能有效地促进高效的语音信号增强。


技术实现思路

1、针对现有技术中存在的缺陷或不足,本专利技术所要解决的技术问题是:提供一种有效的轻量级动态多尺度自关注网络来解决单通道语音增强问题。具体本文档来自技高网...

【技术保护点】

1.一种轻量化多轴Transformer的单通道降噪方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的轻量化多轴Transformer的单通道降噪方法,其特征在于:嵌入融合块进一步提取和压缩这些高级特征,系统通过类似于密集编码块的密集解码块产生屏蔽值M(t,f)和补偿值C(t,f)。增强后的复谱可表示为:

3.根据权利要求2所述的轻量化多轴Transformer的单通道降噪方法,其特征在于:提示块(Prompt Block)用于促进改进的频率特征提取,提取计算如下,输入特征X通过全局平均池化转换为XGAP,同时引入提示张量P,它是一个随机初始化的可学习张量...

【技术特征摘要】

1.一种轻量化多轴transformer的单通道降噪方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的轻量化多轴transformer的单通道降噪方法,其特征在于:嵌入融合块进一步提取和压缩这些高级特征,系统通过类似于密集编码块的密集解码块产生屏蔽值m(t,f)和补偿值c(t,f)。增强后的复谱可表示为:

3.根据权利要求2所述的轻量化多轴transformer的单通道降噪方法,其特征在于:提示块(prompt block)用于促进改进的频率特征提取,提取计算如下,输入特征x通过全局平均池化转换为xgap,同时引入提示张量p,它是一个随机初始化的可学习张量,通过对xgap应用线性层,我们得到xlinear,softmax函数完成后,将xlinear与提示张量p相乘,得到pmul,pmul在第一维...

【专利技术属性】
技术研发人员:张泽华王明江
申请(专利权)人:哈尔滨工业大学深圳哈尔滨工业大学深圳科技创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1