基于特定风格的音乐生成方法、装置、设备及存储介质制造方法及图纸

技术编号:29213055 阅读:7 留言:0更新日期:2021-07-10 00:50
本发明专利技术涉及人工智能领域,公开了一种基于特定风格的音乐生成方法、装置、设备及存储介质,用于根据特定的风格生成音乐作品,提高了音乐的生成效率和音乐作品的可控性。基于特定风格的音乐生成方法包括:获取原始数据;对原始数据进行标记,生成中间数据,中间数据包含多个事件;将中间数据输入预置的演奏编码器和预置的旋律编码器,基于相对注意力机制和前馈神经网络生成编码数据;将编码数据输入预置的解码器,生成解码数据;基于预置的调节机制对解码数据进行错误修正,得到目标数据,根据目标数据生成最终的音乐作品,调节机制包括旋律调节、演奏调节和输入干扰。此外,本发明专利技术还涉及区块链技术,生成的佛乐作品可存储于区块链节点中。点中。点中。

【技术实现步骤摘要】
基于特定风格的音乐生成方法、装置、设备及存储介质


[0001]本专利技术涉及音频转换领域,尤其涉及一种基于特定风格的音乐生成方法、装置、设备及存储介质。

技术介绍

[0002]随着深度学习的发展,音乐生成模型及其变体在音乐生成中尤为重要,在音乐自动生成领域中,Transformer模型能在短时间内生成时长超过一分钟的作品,在语言模型和翻译任务方面也有广泛的应用。
[0003]然而,目前已有的音乐生成模型具有很大的局限性,音乐生成的效率低,且生成的音乐作品风格不可控。

技术实现思路

[0004]本专利技术提供了一种基于特定风格的音乐生成方法、装置、设备及存储介质,用于根据特定的风格生成音乐作品,提高了音乐的生成效率和音乐作品的可控性。
[0005]本专利技术第一方面提供了一种基于特定风格的音乐生成方法,包括:获取原始数据,所述原始数据包括钢琴演奏的乐器数字接口MIDI文件和钢琴演奏的音频数据;对所述原始数据进行标记,生成中间数据,所述中间数据包含多个事件;将所述中间数据输入预置的演奏编码器和预置的旋律编码器,基于相对注意力机制和前馈神经网络生成编码数据;将所述编码数据输入预置的解码器,生成解码数据;基于预置的调节机制对所述解码数据进行错误修正,得到目标数据,根据所述目标数据生成最终的音乐作品,所述调节机制包括旋律调节、演奏调节和输入干扰。
[0006]可选的,在本专利技术第一方面的第一种实现方式中,所述对所述原始数据进行标记,生成中间数据,所述中间数据包含多个事件包括:基于音符开始时刻和音符结束时刻对所述原始数据进行标记,生成第一标记数据,所述第一标记数据包括预置数量的音符开启事件和预置数量的音符关闭事件;基于预置的时间增量值对所述原始数据进行标记,生成第二标记数据,所述第二标记数据包括预置数量的时移事件;基于预置的量化速度对所述原始数据进行标记,生成第三标记数据,所述第三标记数据包括预置数量的音符播放速度事件;将所述第一标记数据、所述第二标记数据和所述第三标记数据合并,生成中间数据,所述中间数据包含多个事件。
[0007]可选的,在本专利技术第一方面的第二种实现方式中,所述将所述中间数据输入预置的演奏编码器和预置的旋律编码器,基于相对注意力机制和前馈神经网络生成编码数据包括:对所述中间数据进行特征提取,生成演奏输入数据和旋律输入数据;将所述演奏输入数据输入预置的演奏编码器,经过所述预置的演奏编码器的多头相对注意力层,并传输至前馈神经网络,得到演奏编码数据;将所述旋律输入数据输入预置的旋律编码器,经过所述预置的旋律编码器的多头相对注意力层,并传输至前馈神经网络,得到旋律编码数据;基于所述演奏编码数据和所述旋律编码数据生成编码数据。
[0008]可选的,在本专利技术第一方面的第三种实现方式中,所述将所述演奏输入数据输入预置的演奏编码器,经过所述预置的演奏编码器的多头相对注意力层,并传输至前馈神经网络,得到演奏编码数据包括:将所述演奏输入数据输入所述预置的演奏编码器的第一层堆栈,经过所述第一层堆栈的多头相对注意力层,并传输至所述第一层堆栈的前馈神经网络,生成第一演奏片段;将所述第一演奏片段输入所述预置的演奏编码器的第二层堆栈,按照预置的次数进行迭代,基于最后一层堆栈的前馈神经网络输出的数据,生成演奏时间片段;将所述演奏时间片段进行压缩处理,生成演奏编码数据。
[0009]可选的,在本专利技术第一方面的第四种实现方式中,所述基于预置的调节机制对所述解码数据进行错误修正,得到目标数据,根据所述目标数据生成最终的音乐作品,所述调节机制包括旋律调节、演奏调节和输入干扰包括:基于预置的旋律和演奏机制对所述目标数据进行修正,删除异常数据,生成第一调节数据;根据所述第一调节数据进行降噪处理,减少输入干扰,生成最终的音乐作品。
[0010]可选的,在本专利技术第一方面的第五种实现方式中,在所述基于预置的调节机制对所述解码数据进行错误修正,得到目标数据,根据所述目标数据生成最终的音乐作品之后,所述方法还包括:进行性能特征的相似评估。
[0011]可选的,在本专利技术第一方面的第六种实现方式中,所述进行性能特征的相似评估包括:获取待评估的两首音乐作品,确定评估指标,所述评估指标包括音符密度、音高范围、音高的平均变化、音高的整体变化、平均速度、速度变化、平均持续时间和持续时间变化;基于所述评估指标分别生成所述两首音乐作品的多个评估指标直方图,并计算每一个评估指标的均值和方差,得到多组均值和方差;根据所述每一个评估指标的均值和方差生成正态分布图,得到多组正态分布图;计算所述两首音乐作品对应评估指标正态分布图的重叠面积,基于所述重叠面积进行相似度评估。
[0012]本专利技术第二方面提供了一种基于特定风格的音乐生成装置,包括:获取模块,用于获取原始数据,所述原始数据包括钢琴演奏的乐器数字接口MIDI文件和钢琴演奏的音频数据;标记模块,用于对所述原始数据进行标记,生成中间数据,所述中间数据包含多个事件;编码模块,用于将所述中间数据输入预置的演奏编码器和预置的旋律编码器,基于相对注意力机制和前馈神经网络生成编码数据;解码模块,用于将所述编码数据输入预置的解码器,生成解码数据;调节模块,用于基于预置的调节机制对所述解码数据进行错误修正,得到目标数据,生成最终的音乐作品,所述调节机制包括旋律调节、演奏调节和输入干扰。
[0013]可选的,在本专利技术第二方面的第一种实现方式中,所述标记模块包括:第一标记单元,用于基于音符开始时刻和音符结束时刻对所述原始数据进行标记,生成第一标记数据,所述第一标记数据包括预置数量的音符开启事件和预置数量的音符关闭事件;第二标记单元,用于基于预置的时间增量值对所述原始数据进行标记,生成第二标记数据,所述第二标记数据包括预置数量的时移事件;第三标记单元,用于基于预置的量化速度对所述原始数据进行标记,生成第三标记数据,所述第三标记数据包括预置数量的音符播放速度事件;合并单元,用于将所述第一标记数据、所述第二标记数据和所述第三标记数据合并,生成中间数据,所述中间数据包含多个事件。
[0014]可选的,在本专利技术第二方面的第二种实现方式中,所述编码模块包括:特征提取单元,用于对所述中间数据进行特征提取,生成演奏输入数据和旋律输入数据;第一输入单
元,用于将所述演奏输入数据输入预置的演奏编码器,经过所述预置的演奏编码器的多头相对注意力层,并传输至前馈神经网络,得到演奏编码数据;第二输入单元,用于将所述旋律输入数据输入预置的旋律编码器,经过所述预置的旋律编码器的多头相对注意力层,并传输至前馈神经网络,得到旋律编码数据;第一生成单元,用于基于所述演奏编码数据和所述旋律编码数据生成编码数据。
[0015]可选的,在本专利技术第二方面的第三种实现方式中,所述第一输入单元具体用于:将所述演奏输入数据输入所述预置的演奏编码器的第一层堆栈,经过所述第一层堆栈的多头相对注意力层,并传输至所述第一层堆栈的前馈神经网络,生成第一演奏片段;将所述第一演奏片段输入所述预置的演奏编码器的第二层堆栈,按照预置的次数进行迭代,基本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于特定风格的音乐生成方法,其特征在于,所述基于特定风格的音乐生成方法包括:获取原始数据,所述原始数据包括钢琴演奏的乐器数字接口MIDI文件和钢琴演奏的音频数据;对所述原始数据进行标记,生成中间数据,所述中间数据包含多个事件;将所述中间数据输入预置的演奏编码器和预置的旋律编码器,基于相对注意力机制和前馈神经网络生成编码数据;将所述编码数据输入预置的解码器,生成解码数据;基于预置的调节机制对所述解码数据进行错误修正,得到目标数据,根据所述目标数据生成最终的音乐作品,所述调节机制包括旋律调节、演奏调节和输入干扰。2.根据权利要求1所述的基于特定风格的音乐生成方法,其特征在于,所述对所述原始数据进行标记,生成中间数据,所述中间数据包含多个事件包括:基于音符开始时刻和音符结束时刻对所述原始数据进行标记,生成第一标记数据,所述第一标记数据包括预置数量的音符开启事件和预置数量的音符关闭事件;基于预置的时间增量值对所述原始数据进行标记,生成第二标记数据,所述第二标记数据包括预置数量的时移事件;基于预置的量化速度对所述原始数据进行标记,生成第三标记数据,所述第三标记数据包括预置数量的音符播放速度事件;将所述第一标记数据、所述第二标记数据和所述第三标记数据合并,生成中间数据,所述中间数据包含多个事件。3.根据权利要求1所述的基于特定风格的音乐生成方法,其特征在于,所述将所述中间数据输入预置的演奏编码器和预置的旋律编码器,基于相对注意力机制和前馈神经网络生成编码数据包括:对所述中间数据进行特征提取,生成演奏输入数据和旋律输入数据;将所述演奏输入数据输入预置的演奏编码器,经过所述预置的演奏编码器的多头相对注意力层,并传输至前馈神经网络,得到演奏编码数据;将所述旋律输入数据输入预置的旋律编码器,经过所述预置的旋律编码器的多头相对注意力层,并传输至前馈神经网络,得到旋律编码数据;基于所述演奏编码数据和所述旋律编码数据生成编码数据。4.根据权利要求3所述的基于特定风格的音乐生成方法,其特征在于,所述将所述演奏输入数据输入预置的演奏编码器,经过所述预置的演奏编码器的多头相对注意力层,并传输至前馈神经网络,得到演奏编码数据包括:将所述演奏输入数据输入所述预置的演奏编码器的第一层堆栈,经过所述第一层堆栈的多头相对注意力层,并传输至所述第一层堆栈的前馈神经网络,生成第一演奏片段;将所述第一演奏片段输入所述预置的演奏编码器的第二层堆栈,按照预置的次数进行迭代,基于最后一层堆栈的前馈神经网络输出的数据,生成演奏时间片段;将所述演奏时间片段进行压缩处理,生成演奏编码数据。5.根据权利要求1所述的基于特定风格的...

【专利技术属性】
技术研发人员:刘奡智韩宝强肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1