【技术实现步骤摘要】
基于通道注意力模型的音乐去噪方法及系统
[0001]本专利技术属于智慧音乐处理
,具体涉及一种基于通道注意力模型的音乐去噪方法、系统、电子设备以及存储介质。
技术介绍
[0002]随着多媒体技术的快速发展,人们可以在社交平台上录制和分享他们的音乐录音。与专业录音作品相比,普通用户的音乐录音通常会受到背景噪音和录音设备的影响而出现质量降低的情况。因此,在实际应用中迫切需要针对自然环境录音的自动音乐去噪方法。
[0003]传统的音乐去噪过程是一个依赖于优秀的音响工程师的劳动密集型的过程。音乐去噪任务属于音频去噪范畴,在音频去噪领域,现有技术中Boll公开了一种频谱减法算法,以减少语音中声学噪声的频谱效应。Ephraim和Van Trees提出了一种基于感知的线性信号估计器,用于增强语音信号。上述方法从噪声中估计参数,建立不同的噪声模型,但是由于噪声模型中假设条件的简化,这些方法对非平稳噪声的处理效果较差。
[0004]随着深度学习的发展,现有技术中出现了利用深度学习提升去噪模型性能的技术。其中,Hu等人提出 ...
【技术保护点】
【技术特征摘要】
1.一种基于通道注意力模型的音乐去噪方法,其特征在于,包括:获取待处理的含噪音乐数据,并将所述含噪音乐数据进行转换格式和添加通道预处理;将所述预处理后的含噪音乐数据输入预设的基于有效通道注意力的特征学习网络进行特征提取,获得与所述含噪音乐数据对应的增强注意力特征;其中,所述基于有效通道注意力的特征学习网络为通过含噪音乐数据集训练获得,所述含噪音乐数据集中的含噪音乐数据由噪声数据和音乐数据随机生成;所述噪声数据包括电路噪声、人群噪声、天气噪声、交通噪声和平稳噪声5种类别;所述音乐数据包括钢琴、架子鼓、竖琴、大提琴、琵琶、小号、古筝、多乐器和歌曲9种类别;将所述增强注意力特征输入预设的噪声过滤网络进行噪声过滤,获得去噪后的音乐特征;对所述音乐特征经过逆短时傅里叶变换转换到时域,获得去噪后的音乐数据。2.根据权利要求1所述的基于通道注意力模型的音乐去噪方法,其特征在于,将待处理的含噪音乐数据进行所述转换格式和添加通道预处理的方法包括:将待处理的含噪音乐数据进行采样频率转换,获得设定采样频率的单声道音频数据;将所述设定采样频率的单声道音频数据进行短时傅里叶变换并添加10个频率
‑
位置嵌入向量,获得设定通道数的预处理后的含噪音乐数据。3.根据权利要求1所述的基于通道注意力模型的音乐去噪方法,其特征在于,所述基于有效通道注意力的特征学习网络的训练方法包括:获取含噪音乐数据集;其中,所述含噪音乐数据集由纯净音乐、含噪音乐数据对组成;对所述含噪音乐数据集中的音乐数据进行转换格式和添加通道预处理,获得设定通道数的预处理后的音乐数据;将所述设定通道数的预处理后的音乐数据经过卷积层和指数线性单元处理,获取早期卷积特征;将所述早期卷积特征通过U
‑
net网络进行特征提取;所述U
‑
net网络包括四个编码器模块和四个解码器模块,设置在所述编码器模块和所述解码器模块之间的有效通道注意力模块以及设置在所述解码器模块之后的监督注意模块;利用损失函数对基于有效通道注意力的特征学习网络的参数进行训练约束,进而确定基于有效通道注意力的特征学习网络的参数值;完成基于有效通道注意力的特征学习网络的训练。4.根据权利要求3所述的基于通道注意力模型的音乐去噪方法,其特征在于,每个编码器由一个具有残差连接的三层DenseNet块组成;所述编码器和所述解码器共享相同的超参数,且每个编码器和对应的镜像解码器之间跳跃连接。5.根据权利要求1所述的基于通道注意力模型的音乐去噪方法,其特征在于,将所述增强注意力特征输入预设的噪声过滤网络进行噪声过滤,获得去噪后的音乐特征;对所述音乐特征经过逆短时傅里叶变换转换到时域,获得去噪后的音乐数据的方法,通过以下公式实现:R
DM
(t)=ISTFT(Filtering(Learning(cat[STFT(R
NM
(t)),FP])))其中,IST...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。