基于密集网络和多头注意力机制的音乐自动生成方法技术

技术编号:35599104 阅读:27 留言:0更新日期:2022-11-16 15:19
一种基于密集网络和多头注意力机制的音乐自动生成方法,由获取音乐数据集、对数据集进行预处理、划分训练集和测试集、构建音乐自动生成网络、训练音乐自动生成网络、自动生成音乐文件步骤组成。本发明专利技术以长短期记忆网络作为基础,加入密集网络提取音乐的特征,并且在一定程度上缓解训练过程中出现的梯度消失问题,引入多头注意力机制关注不同音乐特征在音乐序列中的占比,在长短期记忆网络的门机制中引入二元贝塔分布,加强门控单元捕捉音乐序列前后信息长期依赖关系的性能,整体上优化了神经网络的性能,提升了计算机自动音乐生成的效果。本发明专利技术可应用于音乐自动生成技术领域。本发明专利技术可应用于音乐自动生成技术领域。本发明专利技术可应用于音乐自动生成技术领域。

【技术实现步骤摘要】
基于密集网络和多头注意力机制的音乐自动生成方法


[0001]本专利技术属于计算机
,具体涉及到基于密集网络和多头注意力机制的音乐自动生成方法。
技术背景
[0002]音乐是一种复杂的艺术表现形式,音乐创作不仅需要创作者具有相关的乐理知识,还需要对艺术有良好的感知和鉴赏能力,音乐创作这项工作具有较大的难度。一般来说,人工音乐创作的周期较长,时间成本较大,难以满足人们对音乐日渐增长的需求。如何高效、快速且低成本实现音乐生成,解决音乐生成供不应求的现象,是当前音乐自动生成领域面临的主要难题。
[0003]随着人工智能和深度学习技术的发展,深度学习方法在图像生成、自然语言处理等领域应用广泛并取得了很大的成就。由于音乐是具有时间序列的数据形式,序列前后的关联性较大,一般的深度学习方法难以处理这样的时序数据,所以将这些生成方法迁移到音乐自动生成领域,仍是一个具有挑战性的问题。
[0004]循环神经网络的出现,为处理时序数据问题带来了很好的解决方案。循环神经网络用于处理序列数据,例如一段文字、一段声音等,因此它在语言建模、声音识别、机器翻译等方面有极为广泛应用。就标准循环神经网络体系结构而言,其可使用的上下文的范围是极为有限的。在这种情况下,伴随循环连接的循环,会记录每一步输出的状态,将会导致误差积累,进而引发梯度消失的问题。
[0005]随着循环神经网络的发展,有人提出了一种循环神经网络的改进方法,即长短期记忆网络。它在循环神经网络中引入了门机制,将当前信息与之前的信息建立长期依赖关系。
[0006]音乐序列的时序特性对神经网络记忆长期信息的能力提出了更高的要求,增强长短期记忆网络中两个门控单元对推测信息前后长期依赖关系的性能是十分有必要的。同时,在不同风格的音乐中,音乐各项特征的占比也不同。
[0007]在音乐自动生成领域,当前需迫切解决的一个技术问题是提供一种增强音乐序列上下文前后依赖关系和提升对重要音乐事件信息处理能力的音乐自动生成方法。

技术实现思路

[0008]本专利技术所要解决的技术问题在于克服上述现有技术的不足,提供一种网络结构简单、生成的音乐质量高的基于密集网络和多头注意力机制的音乐自动生成方法。
[0009]解决上述技术问题所采用的技术方案是由下述步骤组成:
[0010](1)获取音乐数据集
[0011]获取乐器数字接口类型的音乐文件作为训练音乐自动生成网络的数据集。
[0012](2)对数据集进行预处理
[0013]用音高、音强、音长、和弦事件的形式表示乐器数字接口文件中的音乐,其中音高
事件包含128个事件,对应0

127的数字作为索引;音强事件包含32个事件,对应0

31的数字作为索引;音长事件包含100个事件,对应0

99的数字作为索引;和弦事件包含60个事件,对应0

59的数字作为索引,对音乐数据进行音高调整、添加和删除音符、拆分和移动音符的数据增强操作,将音乐事件序列切分成预设长度为30秒的音乐片段,根据音乐事件对应的数字索引将音乐事件序列转换为对应的数字序列。
[0014](3)划分训练集和测试集
[0015]将数据集划分为训练集和测试集,训练集与测试集的比为8:2。
[0016](4)构建音乐自动生成网络
[0017]音乐自动生成网络模型由输入层与激活层、密集网络层、长短期记忆网络层、多头注意力层、输出层依次串联构成。
[0018](5)训练音乐自动生成网络
[0019]将训练集输入到音乐自动生成网络进行训练,使用Adam优化器动态调整音乐自动生成网络的学习率,按照下式的交叉熵损失函数L(a,b)作为损失函数比较输出音符序列和原始音符序列,获取损失值L(a,b):
[0020]L(a,b)=alnb+(1

a)ln(1

b)
[0021]其中,a表示原始音符序列,b表示输出音符序列;训练时数据的批次大小为采样率的1~8倍,迭代至交叉熵损失函数收敛,得到训练好的音乐自动生成网络。
[0022](6)自动生成音乐文件
[0023]将测试集输入到训练好的音乐自动生成网络中,用训练好的模型在指定路径下生成对应的乐器数字接口类型音乐文件。
[0024]在本专利技术的(4)构建音乐自动生成网络中,所述的密集网络层由第一批归一化层a1与第一激活层b1、第一卷积层c1、第二批归一化层a2、第二激活层b2、第二卷积层c2、密集网络随机失活层d依次串联构成。
[0025]在本专利技术的(4)构建音乐自动生成网络中,所述的长短期记忆网络层由第一长短期记忆层f1与长短期记忆网络第一随机失活层d1、第二长短期记忆层f2、长短期记忆网络第二随机失活层d2、第三长短期记忆层f3、全连接层m依次串联构成。
[0026]在本专利技术的(4)构建音乐自动生成网络中,所述的第一激活层b1和第二激活层b2的激活函数R(x)如下式:
[0027][0028]其中,x表示输入数据,α为系数、α∈(0,1)。
[0029]在本专利技术的(4)构建音乐自动生成网络中,所述的第一卷积层c1和第二卷积层c2的卷积核大小为3
×
3。
[0030]在本专利技术的(4)构建音乐自动生成网络中,所述的密集网络随机失活层d的丢弃率为0.3~0.5。
[0031]在本专利技术的(4)构建音乐自动生成网络中,所述的第一长短期记忆层f1、第二长短期记忆层f2、第三长短期记忆层f3中引入二元贝塔分布函数替换其中输入门与遗忘门的Sigmoid函数,按下式确定第t时刻输入门输出值i
t
,确定第t时刻遗忘门输出值f
t

[0032][0033][0034][0035][0036]其中,表示服从伽马分布函数的随机变量,表示参数为速率参数设置为常数1的伽马分布函数,j表示随机变量的序号,j取值为1、2、3,表示伽马分布函数的形状参数,g
j
表示当前输入x
t
与上一时刻的隐藏状态h
t
‑1的多层感知机函数。
[0037]在本专利技术的(4)构建音乐自动生成网络中,所述的全连接层m按照下式的激活函数S(z
i
)确定:
[0038][0039]其中,z
i
表示全连接层第i个节点的输出值,C表示输出节点的个数,z
c
表示第c个节点的输出值。
[0040]在本专利技术的(4)构建音乐自动生成网络中,所述的多头注意力层(5)有N个自注意力头,N取值为2~8的整数。
[0041]本专利技术以乐器数字接口数据类型的音乐文件作为数据集,训练音乐自动生成网络。对音乐数据进行预处理,用事件表示乐器数字接口数据类型的音乐文件,这些事件分为音高、音强、音长、和弦,音乐自动生成网络是由长短期记忆网络作为基本的网络结构本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于密集网络和多头注意力机制的音乐自动生成方法,其特征在于由下述步骤组成:(1)获取音乐数据集获取乐器数字接口类型的音乐文件作为训练音乐自动生成网络的数据集;(2)对数据集进行预处理用音高、音强、音长、和弦事件的形式表示乐器数字接口文件中的音乐,其中音高事件包含128个事件,对应0

127的数字作为索引;音强事件包含32个事件,对应0

31的数字作为索引;音长事件包含100个事件,对应0

99的数字作为索引;和弦事件包含60个事件,对应0

59的数字作为索引,对音乐数据进行音高调整、添加和删除音符、拆分和移动音符的数据增强操作,将音乐事件序列切分成预设长度为30秒的音乐片段,根据音乐事件对应的数字索引将音乐事件序列转换为对应的数字序列;(3)划分训练集和测试集将数据集划分为训练集和测试集,训练集与测试集的比为8:2;(4)构建音乐自动生成网络音乐自动生成网络模型由输入层(1)与激活层(2)、密集网络层(3)、长短期记忆网络层(4)、多头注意力层(5)、输出层(6)依次串联构成;(5)训练音乐自动生成网络将训练集输入到音乐自动生成网络进行训练,使用Adam优化器动态调整音乐自动生成网络的学习率,按照下式的交叉熵损失函数L(a,b)作为损失函数比较输出音符序列和原始音符序列,获取损失值L(a,b):L(a,b)=alnb+(1

a)ln(1

b)其中,a表示原始音符序列,b表示输出音符序列;训练时数据的批次大小为采样率的1~8倍,迭代至交叉熵损失函数收敛,得到训练好的音乐自动生成网络;(6)自动生成音乐文件将测试集输入到训练好的音乐自动生成网络中,用训练好的模型在指定路径下生成对应的乐器数字接口类型音乐文件。2.根据权利要求1所述的基于密集网络和多头注意力机制的音乐自动生成方法,其特征在于:在(4)构建音乐自动生成网络中,所述的密集网络层(3)由第一批归一化层a1与第一激活层b1、第一卷积层c1、第二批归一化层a2、第二激活层b2、第二卷积层c2、密集网络随机失活层d依次串联构成。3.根据权利要求1所述的基于密集网络和多头注意力...

【专利技术属性】
技术研发人员:张玉梅吕小姣李琦吴晓军杨红红苏玉萍亢欣
申请(专利权)人:陕西师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1