一种基于多模态的音乐分类方法、系统及存储介质技术方案

技术编号：32485914 阅读：22 留言：0更新日期：2022-03-02 09:51

本发明专利技术公开了一种基于多模态的音乐分类方法、系统及存储介质，涉及音乐分析技术领域，本发明专利技术首先从目标音乐中获取音频数据和歌词数据，进而获取词向量、音频高层特征、乐器种类等数据，同时结合权重信息，得到第一权重统计值、第二权重统计值、第三权重统计值，将所述各个统计值进行归一化处理和分类求和，得到第四权重统计值，依据所述第四权重统计值，即可得到目标音乐的分类结果。本发明专利技术采用基于词向量、音频高层特征、乐器种类的多模态分类方法，综合考虑目标音乐中的各种因素和所占权重，最终得到了更加准确的分类结果。终得到了更加准确的分类结果。终得到了更加准确的分类结果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多模态的音乐分类方法、系统及存储介质

[0001]本专利技术涉及音乐分析
，更具体的说是涉及一种基于多模态的音乐分类方法、系统及存储介质。

技术介绍

[0002]自上个世纪70年代以来，电子音乐的风格种类不断增加，维基百科至今已收录超过200种细分类型，海量的电子音乐亟待通过分类改善数据库的管理，以及实现更多用户化的行为，如音乐检索，音乐推荐等。
[0003]而进行音乐检索、音乐推荐等行为的基础，是将录入的音乐进行准确细分类。目前对音乐进行分类的方法一般采用神经网络模型或分类器进行分类，分类结果不够精确，并没有很好地融合音乐中的歌词、音频等多项因素，分类准确率不高。
[0004]基于此，如何提供一种分类更精确的音乐分类方法，是本领域技术人员亟需解决的问题。

技术实现思路

[0005]有鉴于此，本专利技术提供了一种基于多模态的音乐分类方法、系统及存储介质。
[0006]为了实现上述目的，本专利技术提供如下技术方案：
[0007]一种基于多模态的音乐分类方法，包括以下步骤：
[0008]步骤1、获取目标音乐的音频数据和歌词数据；
[0009]步骤2、依据所述歌词数据，获取第一权重统计值；
[0010]步骤2.1、对所述歌词数据进行分词，得到歌词数据中的词向量；
[0011]步骤2.2、使用循环神经网络，基于自注意力机制和上下文语境，确定词向量的权重；
[0012]步骤2.3、使用分类器获取词向量的情感类别；
[0...

【技术保护点】

【技术特征摘要】
1.一种基于多模态的音乐分类方法，其特征在于，包括以下步骤：步骤1、获取目标音乐的音频数据和歌词数据；步骤2、依据所述歌词数据，获取第一权重统计值；步骤2.1、对所述歌词数据进行分词，得到歌词数据中的词向量；步骤2.2、使用循环神经网络，基于自注意力机制和上下文语境，确定词向量的权重；步骤2.3、使用分类器获取词向量的情感类别；步骤2.4、依据词向量的权重和情感类别，对相同情感类别的词向量权重进行求和，得到基于词向量的不同情感类别的权重统计值，作为第一权重统计值；步骤3、依据所述音频数据，获取第二权重统计值；步骤3.1、对所述音频数据进行音频高层特征提取；步骤3.2、将音频高层特征输入随机森林分类器，依据决策树得到的不同情感类别结果节点个数作为不同情感类别的权重，即得到基于音频高层特征的不同情感类别的权重统计值，作为第二权重统计值；步骤4、依据所述音频数据，获取第三权重统计值；步骤4.1、对所述音频数据进行乐器识别；步骤4.2、获取乐器对应的情感类别；步骤4.3、获取乐器弹奏的持续时间，作为乐器的权重；步骤4.4、依据乐器的权重和情感类别，得到基于乐器的不同情感类别的权重统计值，作为第三权重统计值；步骤5、分别对所述第一权重统计值、所述第二权重统计值、所述第三权重统计值进行归一化；步骤6、将归一化后的第一权重统计值、第二权重统计值、第三权重统计值中相同情感类别的权值进行求和，得到第四权重统计值；步骤7、依据所述第四权重统计值，得到目标音乐的分类结果。2.根据权利要求1所述的一种基于多模态的音乐分类方法，其特征在于，所述步骤2.2中，使用循环神经网络学习词向量的上下文信息，并结合自注意力机制，获取词向量的权重。3.根据权利要求1所述的一种基于多模态的音乐分类方法，其特征在于，所述步骤2.3中，使用分类...

【专利技术属性】
技术研发人员：刘向丽，
申请(专利权)人：淄博职业学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人