【技术实现步骤摘要】
一种音乐生成方法、装置、系统以及存储介质
[0001]本专利技术主要涉及语言处理
,具体涉及一种音乐生成方法、装置、系统以及存储介质。
技术介绍
[0002]音乐生成是指创作一首原创音乐的过程,是人类的创作活动之一。为了学习音符、时间和旋律之间的数学关系等这类规则和概念,与人工智能相关的各种音乐计算技术最早的研究出现在20世纪50年代。近年来,随着深度学习的发展,各种深度学习算法模型在图像识别、视频检测、语音处理等各个领域得到了广泛的应用,各种相关的算法模型也被应用到音乐生成问题的研究中。
[0003]自动生成音乐经历了与人工智能和音乐相关的计算技术的重大变化。过去,大多数传统的音乐生成方法都是基于音乐知识辨识,这是用某种作曲规则来解决问题的自然方式,大量的深度学习网络现在解决了这个领域的许多问题。Hong提出了分层循环神经网络的方法,通过对流行音乐的先验知识进行分层编码,通过这种编码的方式结合神经网络在上层产生和弦,下层生成旋律;为了更好的得到全局相关性,又有学者通过使用循环神经网络的变体结构LSTM来进行学 ...
【技术保护点】
【技术特征摘要】
1.一种音乐生成方法,其特征在于,包括如下步骤:S1:导入多个音频文件,并分别对各个所述音频文件进行预处理,得到多个处理后频谱图;S2:构建生成器和鉴别器,并导入与多个所述处理后频谱图一一对应的多个随机噪声向量;S3:基于所述生成器,对各个所述随机噪声向量进行频谱图映射处理,得到各个所述随机噪声向量的待鉴别频谱图;S4:基于所述鉴别器,分别对各个所述处理后频谱图以及各个所述随机噪声向量的待鉴别频谱图进行鉴别分析,得到各个所述处理后频谱图的第一权值以及各个所述随机噪声向量的第二权值;S5:根据所有所述处理后频谱图的第一权值以及所有所述随机噪声向量的第二权值进行损失函数计算,得到损失函数;S6:根据所述损失函数分别对所述生成器和所述鉴别器进行参数更新,以参数更新后的所述生成器和所述鉴别器为基础,返回所述S3,并循环迭代执行,直至达到预设迭代次数,且将最后一次参数更新后的生成器作为目标生成器;S7:导入待生成随机噪声向量,基于所述目标生成器,对所述待生成随机噪声向量进行频谱图处理,得到目标频谱图;S8:对所述目标频谱图进行频谱图的转化,得到音乐生成结果。2.根据权利要求1所述的音乐生成方法,其特征在于,所述S1的过程包括:导入多个音频文件,并基于python标准库将各个所述音频文件转化为各个所述音频文件的原始时域波形图;利用离散傅里叶变换方法分别将各个所述音频文件的原始时域波形图转化为各个所述音频文件的原始频谱图;分别将各个所述音频文件的原始频谱图进行dB转化,得到各个所述音频文件的转化后频谱图;集合所有所述音频文件的转化后频谱图,得到转化后频谱图数据集;按照同等频段间隔大小将所述转化后频谱图数据集中的转化后频谱图进行切分,得到多个处理后频谱图。3.根据权利要求1所述的音乐生成方法,其特征在于,所述生成器包括第一长短期记忆网络和多个卷积层,所述S3的过程包括:基于所述第一长短期记忆网络,分别对各个所述随机噪声向量进行学习,得到各个所述随机噪声向量的第一隐藏层向量;基于多个所述卷积层,分别对各个所述随机噪声向量的第一隐藏层向量进行特征提取,得到各个所述随机噪声向量的待鉴别频谱图。4.根据权利要求1所述的音乐生成方法,其特征在于,所述鉴别器包括第二长短期记忆网络和多个反卷积层,所述S4的过程包括:基于所述第二长短期记忆网络,分别对各个所述处理后频谱图以及各个所述随机噪声向量的待鉴别频谱图进行学习,得到各个所述处理后频谱图的第二隐藏层向量以及各个所述随机噪声向量的第三隐藏层向量;
基于多个所述反卷积层,分别对各个所述处理后频谱图的第二隐藏层向量以及各个所述随机噪声向量的第三隐藏层向量进行特征提取,得到各个所述处理后频谱图的第一权值以及各个所述随机噪声向量的第二权值。5.根据权利要求1所述的音乐生成方法,其特征在于,所述S5的过程包括:基于第一式,根据所有所述处理后频谱图的第一权值以及所有所述随机噪声向量的第二权...
【专利技术属性】
技术研发人员:丁数学,王蔓蔓,李玉洁,谭本英,李广伟,
申请(专利权)人:桂林电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。