音乐概率分布模型的学习方法和音乐生成方法技术

技术编号:39242458 阅读:7 留言:0更新日期:2023-10-30 11:55
本发明专利技术公开了一种音乐概率分布模型的学习方法和音乐生成方法。学习方法包括:分别对各样本音乐解析图中的特征

【技术实现步骤摘要】
音乐概率分布模型的学习方法和音乐生成方法


[0001]本专利技术涉及计算机
及音乐
,尤其涉及一种音乐概率分布模型的学习方法和音乐生成方法。

技术介绍

[0002]现有的音乐生成法一般分为符号生成法和音频生成法。在利用音频生成法(例如MusicLM音频生成模型)生成音频时,可控性差,即存在显著的可控性问题。并且,控制音频生成通常是基于自然语言的方法来实现的,但是自然语言难以描述音乐、频谱,其自身也缺乏直观性,因此符号生成法在音乐生成任务中控制更加复杂,具有更差的可控性。
[0003]为此,相关技术中提出了基于深度学习的音乐生成技术,但是该技术通常注重于单一亚领域,如和声生成、结构生成、旋律与伴奏生成以及配器等,没有整体概念与泛化性,亦并不反映真实的作曲过程。并且,对于音符层面的整体生成也缺少令人信服的损失函数的定义,难以施加生成控制。

技术实现思路

[0004]本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的目的在于提出一种音乐概率分布模型的学习方法和音乐生成方法,以实现音乐的泛化表示,并实现对音乐的可控生成,使用户能够对音乐作品进行精细控制。
[0005]为解决上述技术问题,本专利技术第一方面提出了一种音乐概率分布模型的学习方法,包括:获取多个样本音乐解析图,并分别对各所述样本音乐解析图中的特征

关系进行统计,得到第一统计量;在每个学习周期,根据该学习周期的音乐概率分布模型和预设控制需求分别对多个所述样本音乐解析图进行采样,得到多个合成音乐解析图,并分别对各所述合成音乐解析图中的特征

关系进行统计,得到第二统计量;分别计算各所述特征

关系的第二统计量与对应的第一统计量之间的统计量差异,并选择最大统计量差异对应的特征

关系作为目标特征

关系,以及将所述目标特征

关系对应的统计量差异作为损失函数,使用反向传播和梯度下降法,迭代更新所述音乐概率分布模型的参数,直到所述目标特征

关系对应的统计量差异小于或等于预设阈值;当所述样本音乐解析图中的所有特征

关系对应的统计量差异均小于或等于预设阈值时,结束学习,并将当前的音乐概率分布模型作为学习好的音乐概率分布模型。
[0006]本专利技术实施例的音乐概率分布模型的学习方法,首先分别对各样本音乐解析图中的特征

关系进行统计,得到第一统计量;然后根据该学习周期的音乐概率分布模型和预设控制需求分别对多个样本音乐解析图进行采样,得到多个合成音乐解析图,并分别对各合成音乐解析图中的特征

关系进行统计,得到第二统计量;之后选择最大统计量差异对应的特征

关系作为目标特征

关系,以及基于目标特征

关系对应的统计量差异,使用反向传播和梯度下降法,迭代更新音乐概率分布模型的参数,以学习得到音乐概率分布模型。该学习方法采用层次化表示方法表示符号音乐,泛化性好,且有助于实现对音乐的可控生成,使用
户能够对音乐作品进行精细控制。
[0007]另外,本专利技术实施例的音乐概率分布模型的学习方法还可以具有如下附加的技术特征:
[0008]根据本专利技术的一个实施例,所述样本音乐解析图和所述合成音乐解析图均采用层次化结构,所述层次化结构包括节点集、关系集、产生子节点的规则集、属性集,所述节点集包括和节点和或节点,所述第一统计量和所述第二统计量包括或节点的子节点数、和节点上的属性分布、关系两边节点的属性差异、父子节点之间的属性差异,并通过或节点直方图、和节点直方图和关系直方图表征。
[0009]根据本专利技术的一个实施例,所述音乐概率分布模型采用吉布斯形式表示如下:
[0010][0011]其中,p(pg;Θ,E,Δ)表示音乐解析图pg的概率,Θ表示所述音乐概率分布模型的参数,Z(Θ)表示吉布斯函数,E表示pg中的关系集,Δ表示pg中的特征集,所述特征集包括节点集、产生子节点的规则集和属性集,表示音乐解析图pg的能量,λ
v
(w(v))表示pg中第v个或节点w(v)的统计量,λ
t
(α(t))表示pg中第t个和节点α(t)的统计量,λ
i,j
(v
i
,v
j
)表示pg中节点v
i
和节点v
j
之间关系的统计量。
[0012]根据本专利技术的一个实施例,所述预设控制需求包括初始温度T0和温度步长ΔT,所述关系集包括变化关系,根据音乐概率分布模型和预设控制需求对所述样本音乐解析图进行采样,包括:在第k个采样周期,根据当前采样周期的温度T
k
‑1从解析图pg
(k

1)
中选择属性、节点和关系,其中,1≤k≤K,k≥2时,T
k
‑1=T
k
‑2‑
ΔT,pg
(0)
为所述样本音乐解析图;对于所选的属性、节点和关系进行更改操作,并对更改操作后的解析图添加变化关系E
var
概率,得到解析图pg';
[0013]基于所述音乐概率分布模型计算pg'与pg
(k

1)
的能量差,并根据所述能量差计算接受概率;在预设范围内生成随机数,并在所述随机数小于或等于所述接受概率时,设置pg
(k)
=pg',否则设置pg
(k)
=pg
(k

1)
,以进行下一周期的采样。
[0014]根据本专利技术的一个实施例,所述对于所选的属性、节点和关系进行更改操作,包括:对于所选的属性和节点,根据经验分布进行翻转属性、添加或删除节点的操作,并对操作后的解析图中的属性、节点和关系进行递归重采样;对于所选的关系,删除能量满足的关系。
[0015]根据本专利技术的一个实施例,通过下式计算所述接受概率:
[0016][0017]其中,α表示所述接受概率,表示所述能量差,表示pg'的能量。
[0018]根据本专利技术的一个实施例,所述根据当前采样周期的温度T
k
‑1从解析图pg
(k

1)
中选择属性、节点和关系,包括:根据T
k
‑1分别计算解析图pg
(k

1)
中各结构的能量选择值,其中,所述结构包括属性、节点和关系;若所述能量选择值大于预设选择阈值,则选择对应的结构。
[0019]根据本专利技术的一个实施例,通过下式计算所述能量选择值:
[0020][0021]其中,p
select
表示所述能量选择值,表示节点v
i
或属性α
j
或关系e
mn
的能量,表示解析图p本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音乐概率分布模型的学习方法,其特征在于,包括:获取多个样本音乐解析图,并分别对各所述样本音乐解析图中的特征

关系进行统计,得到第一统计量;在每个学习周期,根据该学习周期的音乐概率分布模型和预设控制需求分别对多个所述样本音乐解析图进行采样,得到多个合成音乐解析图,并分别对各所述合成音乐解析图中的特征

关系进行统计,得到第二统计量;分别计算各所述特征

关系的第二统计量与对应的第一统计量之间的统计量差异,并选择最大统计量差异对应的特征

关系作为目标特征

关系,以及将所述目标特征

关系对应的统计量差异作为损失函数,使用反向传播和梯度下降法,迭代更新所述音乐概率分布模型的参数,直到所述目标特征

关系对应的统计量差异小于或等于预设阈值;当所述样本音乐解析图中的所有特征

关系对应的统计量差异均小于或等于预设阈值时,结束学习,并将当前的音乐概率分布模型作为学习好的音乐概率分布模型。2.根据权利要求1所述的音乐概率分布模型的学习方法,其特征在于,所述样本音乐解析图和所述合成音乐解析图均采用层次化结构,所述层次化结构包括节点集、关系集、产生子节点的规则集、属性集,所述节点集包括和节点和或节点,所述第一统计量和所述第二统计量包括或节点的子节点数、和节点上的属性分布、关系两边节点的属性差异、父子节点之间的属性差异,并通过或节点直方图、和节点直方图和关系直方图表征。3.根据权利要求2所述的音乐概率分布模型的学习方法,其特征在于,所述音乐概率分布模型采用吉布斯形式表示如下:其中,p(pg;Θ,E,Δ)表示音乐解析图pg的概率,Θ表示所述音乐概率分布模型的参数,Z(Θ)表示吉布斯函数,E表示pg中的关系集,Δ表示pg中的特征集,所述特征集包括节点集、产生子节点的规则集和属性集,表示音乐解析图pg的能量,λ
v
(w(v))表示pg中第v个或节点w(v)的统计量,λ
t
(α(t))表示pg中第t个和节点α(t)的统计量,λ
i,j
(v
i
,v
j
)表示pg中节点v
i
和节点v
j
之间关系的统计量。4.根据权利要求3所述的音乐概率分布模型的学习方法,其特征在于,所述预设控制需求包括初始温度T0和温度步长ΔT,所述关系集包括变化关系,根据音乐概率分布模型和预设控制需求对所述样本音乐解析图进行采样,包括:在第k个采样周期,根据当前采样周期的温度T
k
‑1从解析图pg
(k

1)
中选择属性、节点和关系,其中,1≤k≤K,k≥2时,T
k
‑1=T
k
‑2‑
ΔT,pg
(0)
为所述样本音乐解析图;对于所选的属性、节点和关系进行更改操作,并对更改操作后的解析图添加变化关系E
var
概率,得到解析图pg';基于所述音乐概率分布模型计算pg'与pg
(k

1)
...

【专利技术属性】
技术研发人员:钱轶恺王天乐童心怡郑子隆许多金鑫董乐朱松纯
申请(专利权)人:北京通用人工智能研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1