【技术实现步骤摘要】
一种特定情感音乐生成方法及系统
[0001]本专利技术涉及人工智能
,尤其涉及一种特定情感音乐生成方法及系统。
技术介绍
[0002]音乐作为艺术领域里一种重要的表达方式,体现了一系列人类所特有的思维模式,是规则性和创造性的统一。创作一首包含丰富多样元素的乐曲需要许多艺术专家共同参与,同时合作、授权也需要大量时间和资金成本。为了能够解决上述问题,可以借助计算机来自动生成音乐。早期,研究者们提出了基于统计分析的方法进行音乐创作,根据概率模型计算每一个时间步长内音符出现的概率,并通过音高、节奏和和弦等相关的基本乐理规则来调试这些音符,从而随机生成不同的音乐,典型的方法如马尔可夫链模型。近年来,深度神经网络在计算机视觉和自然语言处理领域发挥了重要作用,许多研究人员提出了基于深度神经网络的音乐生成模型,以从中学习不同的音乐创作结构和风格。例如,循环神经网络模型(RNN)可用于捕获嵌入在音符时间序列中的时间信息。变分自编码器(VAE)可通过潜在空间正则化技术学习一组代表音乐内在语义特征的隐变量,并根据该变量进行重构生成符合该特征 ...
【技术保护点】
【技术特征摘要】
1.一种特定情感音乐生成方法,其特征在于,包括以下步骤:获取生成音乐的情感类别,构建MIDI音乐数据集;将原始MIDI数据集转化为特定的结构化数据集,对得到的结构化数据集进行预处理;提取每一首MIDI音乐的不同属性特征,构建并训练基于Transformer网络和高斯混合变分自编码器的深度潜在变量模型,生成特定情感的音乐。2.如权利要求1所述的特定情感音乐生成方法,其特征在于:所述将原始MIDI数据集转化为特定的结构化数据集,对MIDI音乐进行解析,将其划分为多个小节,并读取其中的事件信息,将音乐表示为一组事件序列,用作深度潜在变量模型的输入。3.如权利要求2所述的特定情感音乐生成方法,其特征在于:所述提取每一首MIDI音乐的不同属性特征,采用音乐的复调特征和调式特征作为音乐与情感相关的特征,通过深度潜在变量模型解耦学习两种特征在情感空间内的潜在分布。4.如权利要求3所述的特定情感音乐生成方法,其特征在于:所述对得到的结构化数据集进行预处理,包括,将整个数据集划分为训练集、验证集和测试集,从每个MIDI事件序列中随机提取固定数量的连续小节,将这些小节中的事件信息标记化为Token序列,并统一序列长度,将得到的标准化输入序列加载到神经网络模型中。5.如权利要求4所述的特定情感音乐生成方法,其特征在于:所述构建并训练基于Transformer网络和高斯混合变分自编码器的深度潜在变量模型,利用LVM的编码器模块对输入序列进行解耦表征学习,得到关于每一组音乐属性特征的潜在变量表示,利用半监督聚类方法在有标签数据集和无标签数据集上学习每组潜在变量上的情感概率分布,并通过优化目标损失函数使得相同情感的音乐具有相同的潜在空间,将多组潜在变量聚合后馈送到LVM的解码器模块。6.如权利要求5所述的特定情感音乐生成方法,其特征在于:所述构建并训练深度潜在变量模型用于情感音乐的生成模型,包括以下步骤:对音乐输入序列 进行Token嵌入和位置编码,得到输入向量;采用Transformer网络编码组件解耦学习音乐在复调特征和调式特征的潜在分布,主要由编码组件输出的隐藏状态来学习的均值向量和标准差向量;对编码组件学习到的潜在分布进行重采样得到相应特征的潜在变量;采用高斯混合模型学习潜在变量相应的情感概率分布来近似得...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。