一种基于CNN--Bi-LSTM网络的钢琴转录方法技术

技术编号:33617838 阅读:25 留言:0更新日期:2022-06-02 00:36
本发明专利技术公开了一种基于CNN

【技术实现步骤摘要】
一种基于CNN
‑‑
Bi

LSTM网络的钢琴转录方法


[0001]本专利技术属于多音调音符转录领域,是一种基于CNN
‑‑
Bi

LSTM网络的钢琴转录方法,可应用于钢琴转录。

技术介绍

[0002]音乐是日常生活中最常见的艺术表现形式,既能够作为一种载体,表达人们的思想感情,极大的满足人们的精神文化需求;同时,其作为人们休闲娱乐的主要方式,也充实了人们的业余生活。目前,大部分音乐主要是以音频的格式存在(如wav,mp3),极少数以曲谱的形式呈现,这非常不利于音乐家们对音乐的进一步研究,如果能够实时的将音频转换为曲谱,这将极大的方便作曲家对音乐的进一步改善;同时,大多数音乐是以名字的形式存在,在不知到歌曲名的情况下,很难检索到需要的歌曲,如果能够将歌曲转换成曲谱,那么便可以通过片段的音乐去检索完整或相似的歌曲,从而极大的减少标注的成本。因此,音乐自动转录(AutomaticMusic Transcription,AMT)都有着巨大的经济需求和应用前景。
[0003本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于CNN
‑‑
Bi

LSTM网络的钢琴转录方法,其特征在于,包括以下步骤:(1)数据预处理:对获取的一段钢琴音频信号进行预处理,本发明训练DRNN神经网络,对音频进行降噪处理,以达到消除音乐信号噪声的目的;(2)特征提取:对得到的纯净音频采用CQT+MFCC提取特征并进行融合,使得特征参数能够完整精确的表示音频信息;(3)音符识别:将得到的特征参数送入所构建的神经网络模块,进行音符的起始与结束检测,最后输出MIDI格式。2.根据权利要求1所述一种基于CNN
‑‑
Bi

LSTM网络的钢琴转录方法,其特征在于:所述的数据预处理将对获取的钢琴音频信号进行降噪预处理,以得到纯净的音频;DRNN降噪模型有三层隐含层,可以通过增加隐藏层数,提升每次迭代中带噪信号向纯净信号的逼近速度;只在中间一个隐含层上加入连接层,减少训练过程中的计算量;在训练过程中,需要纯净信号以及输出信号;输出信号与纯净信号之间的损失函数可以用两者矢量差平方的均值来衡量,其中,若大于预设值,则对权重等参数求关于的偏导,计算新的参数并进行正向传递,直到小于预设值,训练结束。3.根据权利要求1所述一种基于CNN
‑‑
Bi

LSTM网络的钢琴转录方法,其特征在于:所述的特征提...

【专利技术属性】
技术研发人员:卢迪李梦园王月
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1