【技术实现步骤摘要】
一种基于神经网络的乐曲主旋律音轨识别方法
本专利技术涉及乐曲主旋律音轨识别方法,尤其涉及一种基于神经网络的乐曲主旋律音轨识别方法。
技术介绍
MIDI(MusicalInstrumentDigitalInterface乐器数字接口)文件是新的音乐数据记录格式,其记录的是音乐演奏指令序列而非实际声音信息,更利于计算机处理,为音乐特征的自动识别及音乐序列自动生成的研究提供了极大的方便。但在音乐序列自动生成的研究中,如果训练集是多音轨乐曲,生成出的结果是多轨道的音聚集在了单轨道,这不仅偏离了模型学习的目的,而且也会导致自动生成的乐曲序列质量很差;另外,主旋律的提取在哼唱检索、音乐转录、音乐流派分类与歌手识别方面都具有重要应用,对于数字媒体和数字娱乐产品提高交互体验具有重要意义。现有的主旋律提取算法主要利用乐曲中包含的声音模拟数据信息:一种用于语音识别的鲁棒特征提取算法原理是基于子带主频率信息,实现子带主频率信息与子带能量信息相结合,在特征参数中保留语谱中子带峰值位置信息,使用该算法可以设计抗噪孤立词语音识别系统;而针对复调 ...
【技术保护点】
1.一种基于神经网络的乐曲主旋律音轨识别方法,其特征在于,利用MID文件提取多个特征来度量和刻画乐曲中的每个音轨,通过构建神经网络模型,根据音乐的基本特征自动识别判断出音乐的主旋律音轨,包括步骤如下:/n(1)提取乐曲中音符的信息并计算各个音轨的特征值;/n(2)将音轨特征值变换成二维的神经网络输入矩阵;/n(3)训练基于神经网络的主旋律音轨识别模型;/n(4)使用训练完成的主旋律音轨识别模型,进行乐曲主旋律音轨识别。/n
【技术特征摘要】
1.一种基于神经网络的乐曲主旋律音轨识别方法,其特征在于,利用MID文件提取多个特征来度量和刻画乐曲中的每个音轨,通过构建神经网络模型,根据音乐的基本特征自动识别判断出音乐的主旋律音轨,包括步骤如下:
(1)提取乐曲中音符的信息并计算各个音轨的特征值;
(2)将音轨特征值变换成二维的神经网络输入矩阵;
(3)训练基于神经网络的主旋律音轨识别模型;
(4)使用训练完成的主旋律音轨识别模型,进行乐曲主旋律音轨识别。
2.根据权利要求1所述的基于神经网络的乐曲主旋律音轨识别方法,其特征在于,所述步骤(1)提取乐曲中音符中的特征并计算各个音轨,包括以下步骤:
(11)遍历每首乐曲中每段音轨的音符,利用MIDI文件获取音符信息中的速度、时值、时值类型和音高;
(12)计算乐曲中每段音轨音符平均速度;
(13)计算乐曲中每段音轨音符总时值;
(14)设置乐曲中每段音轨音符时值类型集合;
(15)计算乐曲中每段音轨音符最高音与最低音的音程;
(16)计算乐曲中每段音轨音符第二高音和第二低音的音程。
3.根据权利要求1所述的基于神经网络的乐曲主旋律音轨识别方法,其特征在于,所述步骤(2)的实现步骤如下:
(21)将任一乐曲每个音轨的特征值顺序装入一维数组作为其特征集合;
(22)连接数据集中多首乐曲的特征集合得到二维的神经网络输入矩阵;
(23)按照Tensorflow框架的输入标准,得到最终的输入矩阵。
4.根据权利要求1所述的基于神经网络的乐曲主旋律音轨识别方法,其特征在于,所述步骤(3)中的主旋律音轨识别模型,实现步骤如下:
(31)定义三层神经网络:设置25个神经元为输入层,定义偏置参数为...
【专利技术属性】
技术研发人员:张静宣,梁嘉慧,刘思远,骆君鹏,
申请(专利权)人:南京航空航天大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。