一种基于神经网络的音乐生成方法、系统技术方案

技术编号:29590327 阅读:17 留言:0更新日期:2021-08-06 19:50
本发明专利技术公开了一种基于神经网络的音乐生成方法及系统,该方法包括数据采集模块获取特定音乐人的原始音乐序列数据;数据处理系统采用深度学习模型对原始音乐序列数据进行处理,并采用监管员机制对所述深度学习模型进行音乐特征约束,输出得到混轨音乐和单轨音乐;后期处理系统将得到的混轨音乐和单轨音乐,通过音乐修剪,以单轨作为整体音乐的补充合并,最后得到生成的音乐。该方法针对特定风格音乐进行长时间、连续方式的生成,实现自动化生成风格高度相似音乐的效果。

【技术实现步骤摘要】
一种基于神经网络的音乐生成方法、系统
本专利技术涉及深度学习算法
,特别是涉及一种基于神经网络的音乐生成方法、系统。
技术介绍
音乐创作是指专业人员或作曲家创造具有音乐美的乐曲的复杂的精神与技能生茶过程。主要方式是按照不同音节对应时间序列关系进行组和,如旋律和和声,并配以相宜的节奏进行组织生产的具有特殊音色和纹理动态声波。音乐创作通常是受过专业音乐培训和教育的作曲家创造具有优美音乐美的乐曲,是一项极其复杂的技术和任务。现有的音乐生成方法主要是通过专业人士的长时间灵感创作,耗时耗力,最终可能达不到理想的结果。另外,现有研究中出现的一些基于深度学习的音乐生成算法是对特定节律进行分析,而缺乏针对特定风格音乐进行长时间、连续方式的生成,缺乏自动化生成风格高度相似音乐的方法。
技术实现思路
本专利技术的目的是提供一种基于神经网络的音乐生成方法、系统,以针对特定风格音乐进行长时间、连续方式的生成,实现自动化生成风格高度相似的音乐。为解决上述技术问题,本专利技术提供一种基于神经网络的音乐生成方法,包括:数据采集模块获取特定音乐人的原始音乐序列数据;数据处理系统采用深度学习模型对原始音乐序列数据进行处理,并采用监管员机制对所述深度学习模型进行音乐特征约束,输出得到混轨音乐和单轨音乐;后期处理系统将得到的混轨音乐和单轨音乐,通过音乐修剪,以单轨作为整体音乐的补充合并,最后得到生成的音乐。优选的,所述数据采集模块从音乐数据库中选择出特定音乐人的多首音乐作为训练数据集1,对所述多首音乐进行分轨提取后,将分轨音乐作为训练数据集2,由训练数据集1和训练数据集2组成原始音乐序列数据。优选的,所述深度学习模型采用基于RNN机制的LSTM模型,实现遗忘和记忆机制,从而学习利用以前的信息对当前任务进行相应的操作。优选的,所述监管员机制用于对LSTM模型的中间生产序列结果进行检查,对不满足音乐特征约束的序列进行剔除,使得LSTM模型的输入单个音乐序列不用过长。优选的,所述音乐特征约束包括音调约束和音乐风格约束。优选的,所述数据处理系统采用深度学习模型对原始音乐序列数据进行处理之前,还包括:采用训练数据集1和训练数据集2对深度学习模型进行训练,得到训练后的深度学习模型。本专利技术还提供一种基于神经网络的音乐生成系统,用于实现上述方法,包括:数据采集模块,用于获取特定音乐人的原始音乐序列数据;数据处理系统,用于采用深度学习模型对原始音乐序列数据进行处理,并采用监管员机制对所述深度学习模型进行音乐特征约束,输出得到混轨音乐和单轨音乐;后期处理系统,用于将得到的混轨音乐和单轨音乐,通过音乐修剪,以单轨作为整体音乐的补充合并,最后得到生成的音乐。本专利技术所提供的一种基于神经网络的音乐生成方法、系统,通过深度学习模型对原始音乐序列数据进行处理,并对数据进行音乐条件约束,通过后期音乐修剪得到自动化生成的音乐。本专利技术可以对特定风格音乐进行长时间、连续方式的生成,实现自动化生成风格高度相似的音乐,取得了优秀的音乐生成效果。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术所提供的一种基于神经网络的音乐生成方法的流程图;图2为本专利技术所提供的RNN模型网络结构示意图;图3为本专利技术所提供的一种基于神经网络的音乐生成系统的结构示意图。具体实施方式本专利技术的核心是提供一种基于神经网络的音乐生成方法、系统,以针对特定风格音乐进行长时间、连续方式的生成,实现自动化生成风格高度相似的音乐。为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1,图1为本专利技术所提供的一种基于神经网络的音乐生成方法的流程图。结合图1,本方法具体包含以下流程:1、数据采集模块获取特定音乐人的原始音乐序列数据;本实施例收集了著名音乐人周杰伦所作音乐的midi格式作曲素材,共250首。平均每首时长约2到4分钟,从中选择了满足3-4分钟时长的60首作为训练数据集1(Dataset1)。而后对60首midi歌曲进行了分轨提取与处理,将分轨音乐作为训练数据集2(Dataset2)。训练数据集1和训练数据集2作为原始音乐序列数据。2、数据处理系统采用深度学习模型对原始音乐序列数据进行处理,并采用监管员机制对所述深度学习模型进行音乐特征约束;其中,关于音乐数据结构与模型选择,具体如下:定义1:如果M为音乐数据,则Mt∈N,N为有限集,Mt为t时刻该音乐的音节;定义2:如果M为序列数据集,则Mt=f(M(t-1),M(t-2),……M(t-n));定义3:如果M为音乐数据,则f(M)≤C,C为约束条件集。音乐数据结构是一种标准化的时序数据,不同时刻的数据对应的是一个有限集,如定义1所述。同时,音乐又是一种时序关联数据,所具有的特性如定义2所述。最后,由于音乐的生产最后是需要满足一定美学和艺术功能需求的,所以音乐数据本身最后得需要对应的约束条件,如定义3所述。基于上述定义1,定义2,定义3的音乐数据结构的特性,潜在的满足处理该类特征数据的模型方案有基于RNN结构的深度学习模型,基于专家设计的音乐规则组和模型的生成模型,基于神经网络进行音乐生成的模型,基于隐马尔可夫HMM的音乐序列生成模型,基于神经网络和搜索树结合的音乐生成模型,基于蒙特卡洛模拟采样进行的音乐生成模型,基于对抗生成网络GAN的音乐生成模型等。结合生成音乐需求,除了满足时序特征处理的功能,还需要基于处理建模后进行音乐生成,本实施例优选能够捕捉更多时序信息的RNN(RecurrentNeuralNetwork,循环神经网络)结构的LSTM(LongShort-TermMemory,长短期记忆网络)模型进行音乐序列数据处理,进行音乐合成。LSTM模型是一种特殊的RNN网络,该网络设计目的是为了解决长依赖问题。所有神经网络都具有神经网络的重复模块链的形式,该重复模块链具有简单的结构。例如单个tanh层。标准的RNN网络模型如图2所示。本文中利用深度学习模型对原始音乐序列数据进行时序特征处理。对应的LSTM结构是基于RNN结构的改良模型,LSTM网络能够通过一种被称为“门”的结构对细胞状态进行删除或添加信息,“门”能够有选择性的决定让哪些信息通过,可以实现遗忘和记忆机制。所以利用其在进行音乐时序数据处理时,可将以前的信息与当本文档来自技高网
...

【技术保护点】
1.一种基于神经网络的音乐生成方法,其特征在于,包括:/n数据采集模块获取特定音乐人的原始音乐序列数据;/n数据处理系统采用深度学习模型对原始音乐序列数据进行处理,并采用监管员机制对所述深度学习模型进行音乐特征约束,输出得到混轨音乐和单轨音乐;/n后期处理系统将得到的混轨音乐和单轨音乐,通过音乐修剪,以单轨作为整体音乐的补充合并,最后得到生成的音乐。/n

【技术特征摘要】
1.一种基于神经网络的音乐生成方法,其特征在于,包括:
数据采集模块获取特定音乐人的原始音乐序列数据;
数据处理系统采用深度学习模型对原始音乐序列数据进行处理,并采用监管员机制对所述深度学习模型进行音乐特征约束,输出得到混轨音乐和单轨音乐;
后期处理系统将得到的混轨音乐和单轨音乐,通过音乐修剪,以单轨作为整体音乐的补充合并,最后得到生成的音乐。


2.如权利要求1所述的基于神经网络的音乐生成方法,其特征在于,所述数据采集模块从音乐数据库中选择出特定音乐人的多首音乐作为训练数据集1,对所述多首音乐进行分轨提取后,将分轨音乐作为训练数据集2,由训练数据集1和训练数据集2组成原始音乐序列数据。


3.如权利要求1所述的基于神经网络的音乐生成方法,其特征在于,所述深度学习模型采用基于RNN机制的LSTM模型,实现遗忘和记忆机制,从而学习利用以前的信息对当前任务进行相应的操作。


4.如权利要求3所述的基于神经网络的音乐生成方法,其特征在于,所述监管员机制用于对L...

【专利技术属性】
技术研发人员:马鹏程卢树强王晓岸
申请(专利权)人:北京脑陆科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1