【技术实现步骤摘要】
音乐作品的生成方法、装置、设备及存储介质
[0001]本专利技术涉及音频转换领域,尤其涉及一种音乐作品的生成方法、装置、设备及存储介质。
技术介绍
[0002]音乐是用组织音构成的听觉意象,是表达人们的思想感情与社会现实生活的一种艺术形式,远非机械的节奏与音高的输出。音乐的作用很大程度上来源于其的感染力,这种感染力来自于每位演奏家独特的乐曲处理方式和演奏风格,不同演奏者会将自己的经历和对乐曲的独特理解带入演奏中,从而产生具有感染力的音乐效果。
[0003]在现有技术中,通过将乐谱展示作为输入生成乐曲,忽略了音乐表演情感和表达上的独特性,具体表现为节奏的准确性和音高的控制,并且只能处理有限种类的乐器,造成了音乐效果的损失。
技术实现思路
[0004]本专利技术提供了一种音乐作品的生成方法,用于根据预置的矢量量化变分自动编码VQ
‑
VAE模型和原始音频数据生成音乐作品,提高了音乐生成效率,提升了音高和节奏的准确度,使音乐作品更有独特性和表现力。
[0005]本专利技术第一方面提供了一种音乐作品的生成方法,包括:获取原始数据,所述原始数据为待处理的音频数据;调用预置的自回归离散自编码器对所述原始数据进行特征提取,生成查询向量,所述查询向量用于查询关键信息;将所述查询向量进行量化处理,得到量化向量,所述量化向量包括数量化的音高和节奏信息;调用预置的矢量量化变分自动编码VQ
‑
VAE模型,将所述查询向量和所述量化向量代入预置的公式,计算并得到目标数据;将所述目 ...
【技术保护点】
【技术特征摘要】
1.一种音乐作品的生成方法,其特征在于,所述音乐作品的生成方法包括:获取原始数据,所述原始数据为待处理的音频数据;调用预置的自回归离散自编码器对所述原始数据进行特征提取,生成查询向量,所述查询向量用于查询关键信息;将所述查询向量进行量化处理,得到量化向量,所述量化向量包括数量化的音高和节奏信息;调用预置的矢量量化变分自动编码VQ
‑
VAE模型,将所述查询向量和所述量化向量代入预置的公式,计算并得到目标数据;将所述目标数据输入预置的解码器,生成音乐作品。2.根据权利要求1所述的音乐作品的生成方法,其特征在于,所述调用预置的矢量量化变分自动编码VQ
‑
VAE模型,将所述查询向量和所述量化向量代入预置的公式,计算并得到目标数据包括:基于所述查询向量和所述量化向量按照预置的公式计算并得到目标数据,所述预置的公式为:L
VQ
‑
VAE
=
‑
logp(x|q')+(q'
‑
[q])2+β([q']
‑
q)2;其中,L
VQ
‑
VAE
为损失函数,p(x|q')为所述量化向量q'在分类x的情况下出现的概率,q为所述查询向量,q'为所述量化向量,β为所述查询向量与所述量化向量之差的平均值的权重。3.根据权利要求1所述的音乐作品的生成方法,其特征在于,所述调用预置的自回归离散自编码器对所述原始数据进行特征提取,生成查询向量,所述查询向量用于查询关键信息包括:将所述原始数据输入预置的自回归离散自编码器,所述预置的自回归离散自编码器直接将原始数据作为学习的对象;对所述原始数据进行特征提取,得到多个目标特征,并基于预置的算法将所述多个目标特征转换为初始向量;对所述初始向量进行过滤处理,生成查询向量,所述查询向量用于查询关键信息。4.根据权利要求3所述的音乐作品的生成方法,其特征在于,所述对所述原始数据进行特征提取,得到多个目标特征,并基于预置的算法将所述多个目标特征转换为初始向量包括:基于预置的自回归离散自编码器,对所述原始数据进行特征提取,得到多个初始特征;调用预置的音乐知识库对所述多个初始特征进行归一化处理,得到多个目标特征,所述多个目标特征包括音高、节奏、速度和音色;将所述多个目标特征按照预置的算法...
【专利技术属性】
技术研发人员:刘奡智,党艺飞,韩宝强,肖京,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。