基于神经网络的音乐生成方法及装置制造方法及图纸

技术编号:20548090 阅读:35 留言:0更新日期:2019-03-09 20:42
本发明专利技术实施例公开了一种基于神经网络的音乐生成方法及装置,该方法包括:获取目标音乐数据,对目标音乐数据进行聚类处理得到全局音乐序列;获取第一音乐序列,将全局音乐序列与第一音乐序列输入长短时记忆LSTM网络模型,基于LSTM网络模型的第一网络层确认第一音乐序列对应的序列上下文信息并输出上述序列上下文信息对应的目标音符;将目标音符输入上述LSTM网络模型的第二网络层,通过第二网络层获得目标音符的输入持续时长信息;根据目标音符的输入持续时长信息与目标音符,生成第二音乐序列,基于第二音乐序列得到合成音乐。采用本发明专利技术实施例,可以有效提高音乐合成的效率,增强合成音乐的趣味性,适用性更强。

【技术实现步骤摘要】
基于神经网络的音乐生成方法及装置
本专利技术涉及电子
,尤其涉及一种基于神经网络的音乐生成方法及装置。
技术介绍
在现代社会,流行音乐已经深入渗透到群众的生活当中,越来越多热爱音乐的人群走上音乐创作之路。目前,音乐创作通常采取的方式为利用特征提取算法从特定音乐流派中提取音乐特征,并以此来创作相似的音乐作品,或者根据音乐的特殊语法构造简单的音乐片段,或者通过一个模型将已有的一些非音乐媒介信息(如图像、文字等)翻译成声音进行音乐合成的方法等。这些音乐创作方法尽管能够获得简单的、易于理解的音乐曲段和整个音乐结构,但在生成音乐的过程中比较容易出错,且每一种音乐创作方法生成的音乐旋律比较单一、简单,同时采取上述方法进行音乐创作的效率较低。
技术实现思路
本专利技术实施例提供一种基于神经网络的音乐生成方法及装置,可以提高音乐合成的效率,增强音乐合成的趣味性,适用性更强。第一方面,本专利技术实施例提供了一种基于神经网络的音乐生成方法,该方法包括:获取目标音乐数据,对上述目标音乐数据进行聚类处理得到全局音乐序列;获取第一音乐序列,将上述全局音乐序列与上述第一音乐序列输入长短时记忆LSTM网络模型,本文档来自技高网...

【技术保护点】
1.一种基于神经网络的音乐生成方法,其特征在于,包括:获取目标音乐数据,对所述目标音乐数据进行聚类处理得到全局音乐序列;获取第一音乐序列,将所述全局音乐序列与所述第一音乐序列输入长短时记忆LSTM网络模型,基于所述LSTM网络模型的第一网络层确认所述第一音乐序列对应的序列上下文信息并输出所述序列上下文信息对应的目标音符;将所述目标音符输入所述LSTM网络模型的第二网络层,通过所述第二网络层获得所述目标音符的输入持续时长信息;根据所述目标音符的输入持续时长信息与所述目标音符,生成第二音乐序列,基于所述第二音乐序列得到合成音乐。

【技术特征摘要】
1.一种基于神经网络的音乐生成方法,其特征在于,包括:获取目标音乐数据,对所述目标音乐数据进行聚类处理得到全局音乐序列;获取第一音乐序列,将所述全局音乐序列与所述第一音乐序列输入长短时记忆LSTM网络模型,基于所述LSTM网络模型的第一网络层确认所述第一音乐序列对应的序列上下文信息并输出所述序列上下文信息对应的目标音符;将所述目标音符输入所述LSTM网络模型的第二网络层,通过所述第二网络层获得所述目标音符的输入持续时长信息;根据所述目标音符的输入持续时长信息与所述目标音符,生成第二音乐序列,基于所述第二音乐序列得到合成音乐。2.根据权利要求1所述的方法,其特征在于,所述对所述目标音乐数据进行聚类处理得到全局音乐序列,包括:获取所述目标音乐数据中的多个连续音符,并计算所述多个连续音符对应的音符直方图;基于聚类分析对所述音符直方图进行分类,得到目标聚类集合,所述目标聚类集合包括至少两个聚类,且各个聚类均由至少一个音符直方图组成;选择所述目标聚类集合中的任一聚类,根据所述任一聚类得到全局音乐序列。3.根据权利要求1所述的方法,其特征在于,所述第一音乐序列中包括至少7个连续的音符;所述第一网络层包括KeyLayer,所述KeyLayer由第一循环神经网络RNN构成;所述基于所述LSTM网络模型的第一网络层确认所述第一音乐序列对应的序列上下文信息并输出所述序列上下文信息对应的目标音符,包括:获取所述全局音乐序列与所述第一音乐序列对应的音符表示信息,基于所述第一RNN中的LSTM单元根据所述全局音乐序列与所述第一音乐序列,以及所述音符表示信息确定所述第一音乐序列对应的序列上下文信息;根据所述序列上下文信息确定所述第一音乐序列的最后一个音符的下一个音符,输出所述下一个音符以得到所述序列上下文信息对应的目标音符。4.根据权利要求1或3所述的方法,其特征在于,所述第二音乐序列中包括旋律,所述第二网络层包括PressLayer,所述PressLayer由第二RNN构成;所述将所述目标音符输入所述LSTM网络模型的第二网络层,通过所述第二网络层获得所述目标音符的输入持续时长信息,包括:将所述目标音符输入所述LSTM网络模型的第二网络层,通过所述第二网络层中的所述第二RNN,获得所述目标音符的输入持续时长信息;其中,所述目标音符的输入持续时长信息用于与所述目标音符生成旋律。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:判断所述旋...

【专利技术属性】
技术研发人员:王义文王健宗肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1