【技术实现步骤摘要】
一种融合知识图谱的音乐流派分类方法及系统
[0001]本专利技术属于音乐信号分析与处理
,具体涉及一种融合知识图谱的音乐流派分类方法及系统。
技术介绍
[0002]音乐流派分类可以在许多现实应用中使用,例如音乐流媒体平台可以为特定用户创建更合适的推荐播放列表、用户可以发现与他们喜欢的音乐风格相似的其他音乐等。然而,不同音乐流派之间分类的界限仍然是模糊的,这使得从音频样本中自动识别音乐流派类型(Music Genre Recognition,MGR)成为一项重要的任务。
[0003]相关领域的专家已经提出了一些方法去试图解决这个问题。早期的方法通过探索使用不同输入(即波形或时频谱图)或不同分类器来进行音乐分类,例,使用由多种音频特征(如MFCC、Chroma、Tempogram等)进行重构的自监督学习模型来提高分类性能。最近的研究提出利用相关任务(例如艺术家标签)来获得多层次和多尺度的音乐表征,并利用迁移学习来增强流派分类器。以上解决方案均只使用音频样本作为输入。还有其他的方法使用了额外信息(如歌词、评论等)进行流派分类,例如,使用对音乐内容的自然语言描述来监督学习音频表征,或者结合歌词和音频来提取融合特征进行流派分类。然而,值得注意的是,许多开源数据集或现实任务并没有提供如此详细的信息,这些方法为每段音频获取准确的歌词或描述需要一定的音乐API或搜索引擎的帮助,这是一个非常耗费人力且耗时的过程。
技术实现思路
[0004]本专利技术所要解决的技术问题在于针对上述现有技术中的不足,提供一种 ...
【技术保护点】
【技术特征摘要】
1.一种融合知识图谱的音乐流派分类方法,其特征在于,包括以下步骤:S1、将音频数据转化为梅尔谱图,将梅尔谱图输入音频特征提取网络学习音频表征,同时在音频特征提取网络的最后添加一个线性层获得对每种流派的预测分数;S2、构建与流派相关的知识图谱;S3、使用步骤S1得到的每种流派的预测分数对步骤S2构建的知识图谱中的流派节点进行初始化,然后使用图神经网络学习每个流派节点的特征向量,并将所有特征向量串联获得最终的知识表征;S4、使用SE模块给步骤S1中得到的音频表征和步骤S3得到的知识表征分配不同的注意力权重,然后对加权后的表征进行拼接获得增强后的音频表征,将增强后的音频表征输入全连接层构成音乐流派分类模型,实现音乐流派分类。2.根据权利要求1所述的融合知识图谱的音乐流派分类方法,其特征在于,步骤S1具体为:S101、将音频χ裁剪成多个时长为1秒的不重叠片段,并使用librosa库将裁剪后的音频片段转换为128维的梅尔谱图,获得时频表示S;S102、将步骤S101得到的时频表示S输入主干网络f(.)学习音频表征Z
a
;S103、在步骤S102中的主干网络f(.)后添加一个线性层g(.),通过对网络进行预训练获得一个C维向量Z
s
,表示网络对每种流派的预测分数,C代表流派的数量。3.根据权利要求2所述的融合知识图谱的音乐流派分类方法,其特征在于,步骤S102中,主干网络f(.)使用Inception
‑
ResNet
‑
V2的架构。4.根据权利要求1所述的融合知识图谱的音乐流派分类方法,其特征在于,步骤S2中,知识图谱包含实体集和边集;实体集V包含G+A+I个元素,G是音乐流派的数量,A是艺术家的数量,I是乐器的数量;边集E在知识图谱中为连接各个实体之间的边的集合。5.根据权利要求4所述的融合知识图谱的音乐流派分类方法,其特征在于,知识图谱中的边集E为:其中,0
G
×
G
是大小为G
×
G的零矩阵,P
G
×
A
是大小为G
×
A的音乐流派与艺术家的相关概率矩阵,P
G
×
I
是大小为G
×
I的音乐流派与乐器的相关概率矩阵,P
A
×
G
是大小为A
×
G的艺术家与音乐流派的相关概率矩阵,0
A
×
A
是大小为A
×
A的零矩阵,0
A
×
I
是大小为A
×
I的零矩阵,P
I
×
G
是大小为I
×
G的乐器与音乐流派的相关概率矩阵...
【专利技术属性】
技术研发人员:丁菡,宋文静,赵衰,王鸽,赵鲲,惠维,赵季中,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。