基于特定风格的音乐生成方法、装置、设备及存储介质制造方法及图纸

技术编号：29213055 阅读：7 留言：0更新日期：2021-07-10 00:50

本发明专利技术涉及人工智能领域，公开了一种基于特定风格的音乐生成方法、装置、设备及存储介质，用于根据特定的风格生成音乐作品，提高了音乐的生成效率和音乐作品的可控性。基于特定风格的音乐生成方法包括：获取原始数据；对原始数据进行标记，生成中间数据，中间数据包含多个事件；将中间数据输入预置的演奏编码器和预置的旋律编码器，基于相对注意力机制和前馈神经网络生成编码数据；将编码数据输入预置的解码器，生成解码数据；基于预置的调节机制对解码数据进行错误修正，得到目标数据，根据目标数据生成最终的音乐作品，调节机制包括旋律调节、演奏调节和输入干扰。此外，本发明专利技术还涉及区块链技术，生成的佛乐作品可存储于区块链节点中。点中。点中。

全部详细技术资料下载

【技术实现步骤摘要】
基于特定风格的音乐生成方法、装置、设备及存储介质

[0001]本专利技术涉及音频转换领域，尤其涉及一种基于特定风格的音乐生成方法、装置、设备及存储介质。

技术介绍

[0002]随着深度学习的发展，音乐生成模型及其变体在音乐生成中尤为重要，在音乐自动生成领域中，Transformer模型能在短时间内生成时长超过一分钟的作品，在语言模型和翻译任务方面也有广泛的应用。
[0003]然而，目前已有的音乐生成模型具有很大的局限性，音乐生成的效率低，且生成的音乐作品风格不可控。

技术实现思路

[0004]本专利技术提供了一种基于特定风格的音乐生成方法、装置、设备及存储介质，用于根据特定的风格生成音乐作品，提高了音乐的生成效率和音乐作品的可控性。
[0005]本专利技术第一方面提供了一种基于特定风格的音乐生成方法，包括：获取原始数据，所述原始数据包括钢琴演奏的乐器数字接口MIDI文件和钢琴演奏的音频数据；对所述原始数据进行标记，生成中间数据，所述中间数据包含多个事件；将所述中间数据输入预置的演奏编码器和预置的旋律编码器，基于相对注意力机制和前馈神经网络生成编码数据；将所述编码数据输入预置的解码器，生成解码数据；基于预置的调节机制对所述解码数据进行错误修正，得到目标数据，根据所述目标数据生成最终的音乐作品，所述调节机制包括旋律调节、演奏调节和输入干扰。
[0006]可选的，在本专利技术第一方面的第一种实现方式中，所述对所述原始数据进行标记，生成中间数据，所述中间数据包含多个事件包括：基于音符开...

【技术保护点】

【技术特征摘要】
1.一种基于特定风格的音乐生成方法，其特征在于，所述基于特定风格的音乐生成方法包括：获取原始数据，所述原始数据包括钢琴演奏的乐器数字接口MIDI文件和钢琴演奏的音频数据；对所述原始数据进行标记，生成中间数据，所述中间数据包含多个事件；将所述中间数据输入预置的演奏编码器和预置的旋律编码器，基于相对注意力机制和前馈神经网络生成编码数据；将所述编码数据输入预置的解码器，生成解码数据；基于预置的调节机制对所述解码数据进行错误修正，得到目标数据，根据所述目标数据生成最终的音乐作品，所述调节机制包括旋律调节、演奏调节和输入干扰。2.根据权利要求1所述的基于特定风格的音乐生成方法，其特征在于，所述对所述原始数据进行标记，生成中间数据，所述中间数据包含多个事件包括：基于音符开始时刻和音符结束时刻对所述原始数据进行标记，生成第一标记数据，所述第一标记数据包括预置数量的音符开启事件和预置数量的音符关闭事件；基于预置的时间增量值对所述原始数据进行标记，生成第二标记数据，所述第二标记数据包括预置数量的时移事件；基于预置的量化速度对所述原始数据进行标记，生成第三标记数据，所述第三标记数据包括预置数量的音符播放速度事件；将所述第一标记数据、所述第二标记数据和所述第三标记数据合并，生成中间数据，所述中间数据包含多个事件。3.根据权利要求1所述的基于特定风格的音乐生成方法，其特征在于，所述将所述中间数据输入预置的演奏编码器和预置的旋律编码器，基于相对注意力机制和前馈神经网络生成编码数据包括：对所述中间数据进行特征提取，生成演奏输入数据和旋律输入数据；将所述演奏输入数据输入预置的演奏编码器，经过所述预置的演奏编码器的多头相对注意力层，并传输至前馈神经网络，得到演奏编码数据；将所述旋律输入数据输入预置的旋律编码器，经过所述预置的旋律编码器的多头相对注意力层，并传输至前馈神经网络，得到旋律编码数据；基于所述演奏编码数据和所述旋律编码数据生成编码数据。4.根据权利要求3所述的基于特定风格的音乐生成方法，其特征在于，所述将所述演奏输入数据输入预置的演奏编码器，经过所述预置的演奏编码器的多头相对注意力层，并传输至前馈神经网络，得到演奏编码数据包括：将所述演奏输入数据输入所述预置的演奏编码器的第一层堆栈，经过所述第一层堆栈的多头相对注意力层，并传输至所述第一层堆栈的前馈神经网络，生成第一演奏片段；将所述第一演奏片段输入所述预置的演奏编码器的第二层堆栈，按照预置的次数进行迭代，基于最后一层堆栈的前馈神经网络输出的数据，生成演奏时间片段；将所述演奏时间片段进行压缩处理，生成演奏编码数据。5.根据权利要求1所述的基于特定风格的...

【专利技术属性】
技术研发人员：刘奡智，韩宝强，肖京，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人