【技术实现步骤摘要】
基于辅助任务的符号音乐情感分类系统及方法
[0001]本专利技术属于情感分类领域,尤其涉及基于辅助任务的符号音乐情感分类方法及系统。
技术介绍
[0002]音乐自诞生之初就与情感紧密相连,李斯特等人认为音乐本身就是为了表达情感而生的。因而,对音乐进行情感识别是音乐心理研究的重要方向。音乐有多种形式,如音频模态的音乐(展现形式为音频,存储格式为mp3,wav等)还有符号模态的音乐(展现形式为乐谱类的符号化表达,存储为MIDI和MusicXML等格式)。符号音乐一般编码了音乐的节拍,节奏,每个音符的音高、时长和力度等信息。现有研究表明,符号模态的音乐更加适合机器学习或者深度学习模型进行自动情感分类。
[0003]音乐的情感根据Russell的情感维度理论可以划分为两个维度:效价(Valence)和唤醒度 (Arousal)。其中效价代表情感是积极的还是消极的,唤醒度表示情感的强烈程度。进一步的,根据这种效价
‑
唤醒度模型,可以将音乐的情感分为四个类别:开心(高效价高唤醒度),愤怒或恐惧(低效价高唤醒度) ...
【技术保护点】
【技术特征摘要】
1.基于辅助任务的符号音乐情感分类系统,其特征在于,包括符号音乐编码模块、嵌入层、特征提取器、汇聚层、情感分类器、调式分类器和力度分类器,其中:符号音乐编码模块用于将符号音乐编码为事件组或事件序列;嵌入层用于对事件组或事件序列进行嵌入后得到事件嵌入表征,增加位置信息得到位置嵌入表征,将事件嵌入表征和位置嵌入表征相加得到最终的嵌入表征l1;特征提取器用于对嵌入表征进行特征提取,输出具有上下文信息的表征序列l2;汇聚层用于汇聚序列的信息,其中,对于情感分类主任务和调性分类辅助任务,汇聚层将注意力权重与表征序列l2相乘得到汇聚向量l3,对于音符的力度分类辅助任务,汇聚层采用等值映射方式得到每个音符对应的汇聚向量;情感分类器和调式分类器用于分别根据汇聚向量l3对情感类别和调式进行预测,力度分类器用于对根据每个音符对应的汇聚向量来对力度进行预测。2.根据权利要求1所述的基于辅助任务的符号音乐情感分类系统,其特征在于,符号音乐编码模块采用的符号音乐编码方法包括CP表示方法和Ferreira表示方法中的任一种,其中,所述CP表示方法将符号音乐编码成的事件汇聚成组,每个组编码了一个音符的音高、时长、音符开始发音时所在的小节和在该小节内的次拍,所述Ferreira表示方法是将符号音乐编码为的事件序列,其中分别表示第i个音符的力度、时长和音高,n表示事件序列共有n组事件。3.根据权利要求1所述的基于辅助任务的符号音乐情感分类系统,其特征在于,嵌入层中,得到最终的嵌入表征l1的过程为:当符号音乐编码模块采用CP表示方法符号音乐编码为事件组时,编码得到的序列是x={x1,...,x
n
},n是序列长度,每个位置的x
i
∈R4包含小节、次拍、音高和时长四个维度,对每个维度分别进行嵌入表征,得到每个维度的嵌入表征后,将其进行拼接得到该位置x
i
的嵌入表征e
i
,公式表达为:式中表示第i个事件组中第k个属性的独热表示,为该组内第k个属性的嵌入矩阵,N
k
为第k个属性的事件数量,H
k
是该属性嵌入维度的大小,Concat表示张量拼接操作,均是二维矩阵;对每一种维度进行嵌入后,将拼接后的嵌入向量转化为特征提取器需要的维度H,公式如下:g
i
=e
i
W(2)式中,为线性层权重参数,g
i
∈R
H
为经过线性变化层的嵌入表征;是N
k
是第k个属性的事件数量;当符号音乐编码模块采用Ferreira表示法符号音乐编码为事件序列时,则直接将事件进行嵌入可得到g
i
,公式表达为:g
i
=x
i
W
P
(3)式中,x
i
∈R
V
为第i个事件的独热表示,V为事件词表大小,W
P
∈R
V
×
H
为嵌入矩阵;增加位置信息得到位置嵌入表征,则第i个位置的位置信息p
i
∈R
h
计算公式如下:
p
i
=Z
i
W
P
(4)其中,Z
i
∈R1×
n
是位置i的独热编码,W
P
∈R
n
×
H
是位置嵌入矩阵;将事件嵌入表征与位置嵌入表征相加则可得到第i个事件的最终的输入的嵌入表征I
i
,I
i
∈R
H
:I
i
=g
i
+p
i
(5)4.根据权利要求1所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。