音乐分类方法、音乐分类装置、电子设备及存储介质制造方法及图纸

技术编号:38430138 阅读:13 留言:0更新日期:2023-08-07 11:27
本申请提供了一种音乐分类方法、音乐分类装置、电子设备及存储介质,属于人工智能技术领域。方法包括:获取样本音乐的样本音频数据和样本歌词数据;对样本音频数据进行音频特征提取,得到样本音频特征;对样本歌词数据进行歌词特征提取,得到样本歌词特征;基于样本音频特征和样本歌词特征,构建正音乐样本对和负音乐样本对;基于正音乐样本对和负音乐样本对对神经网络模型进行模型训练,得到音乐分类模型;获取目标音乐的目标数据;对目标数据进行特征提取,得到目标音乐的目标音乐特征;基于音乐分类模型和目标音乐特征对目标音乐进行流派评分,得到流派评分数据,并根据流派评分数据得到目标音乐的流派类别。本申请能够提高音乐分类的准确性。音乐分类的准确性。音乐分类的准确性。

【技术实现步骤摘要】
音乐分类方法、音乐分类装置、电子设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及一种音乐分类方法、音乐分类装置、电子设备及存储介质。

技术介绍

[0002]目前,在音乐分类任务中常常依赖于提取到的音乐特征信息来确定音乐的流派类别,而在特征提取阶段往往存在特征信息缺失等情况,会导致音乐分类的准确性不高,因此,如何提高音乐分类的准确性,成为了亟待解决的技术问题。

技术实现思路

[0003]本申请实施例的主要目的在于提出一种音乐分类方法、音乐分类装置、电子设备及存储介质,旨在提高音乐分类的准确性。
[0004]为实现上述目的,本申请实施例的第一方面提出了一种音乐分类方法,所述方法包括:
[0005]获取样本音乐的样本音频数据和样本歌词数据;
[0006]对所述样本音频数据进行音频特征提取,得到样本音频特征;
[0007]对所述样本歌词数据进行歌词特征提取,得到样本歌词特征;
[0008]基于所述样本音频特征和所述样本歌词特征,构建正音乐样本对和负音乐样本对;
[0009]基于所述正音乐样本对和所述负音乐样本对对预设的神经网络模型进行模型训练,得到音乐分类模型;
[0010]获取目标音乐的目标数据;
[0011]对所述目标数据进行特征提取,得到所述目标音乐的目标音乐特征;
[0012]基于所述音乐分类模型和所述目标音乐特征对所述目标音乐进行流派评分,得到流派评分数据,并根据所述流派评分数据得到所述目标音乐的流派类别。/>[0013]在一些实施例,所述对所述样本音频数据进行音频特征提取,得到样本音频特征,包括:
[0014]对所述样本音频数据进行格式转换,得到样本频谱数据;
[0015]将所述样本频谱数据输入至预设的特征提取模型中,其中,所述特征提取模型包括卷积层和池化层;
[0016]基于所述卷积层对所述样本频谱数据进行二维卷积处理,得到初步频谱特征;
[0017]基于所述池化层对所述初步频谱特征进行最大池化处理,得到所述样本音频特征。
[0018]在一些实施例,所述对所述样本歌词数据进行歌词特征提取,得到样本歌词特征,包括:
[0019]将所述样本歌词数据输入至预设的文本编码模型中,其中,所述文本编码模型包
括嵌入层和transformer编码器;
[0020]基于所述嵌入层对所述样本歌词数据进行嵌入处理,得到样本歌词嵌入表示;
[0021]基于所述transformer编码器对所述样本歌词嵌入表示进行特征编码,得到所述样本歌词特征。
[0022]在一些实施例,所述正音乐样本对和所述负音乐样本对均包括一个样本音频特征和一个样本歌词特征,所述基于所述样本音频特征和所述样本歌词特征,构建正音乐样本对和负音乐样本对,包括:
[0023]基于来源于同一样本音乐的所述样本音频特征和所述样本歌词特征,构建所述正音乐样本对;
[0024]基于来源于不同样本音乐的所述样本音频特征和所述样本歌词特征,构建所述负音乐样本对。
[0025]在一些实施例,所述基于所述正音乐样本对和所述负音乐样本对对预设的神经网络模型进行模型训练,得到音乐分类模型,包括:
[0026]对所述正音乐样本对进行特征降维,得到正音乐特征对,并对所述负音乐样本对进行特征降维,得到负音乐特征对,其中,所述负音乐特征对包括第一负特征对、第二负特征对;
[0027]对所述正音乐特征对进行特征相似评分,得到第一相似数据,对所述第一负特征对进行特征相似评分,得到第二相似数据,并对所述第二负特征对进行特征相似评分,得到第三相似数据;
[0028]基于所述第一相似数据和所述第二相似数据进行损失计算,得到第一损失数据;
[0029]基于所述第一相似数据和所述第三相似数据进行损失计算,得到第二损失数据;
[0030]基于所述第一损失数据和所述第二损失数据对所述神经网络模型进行参数优化,得到所述音乐分类模型。
[0031]在一些实施例,所述目标数据包括所述目标音乐的目标音频数据和目标歌词数据,所述对所述目标数据进行特征提取,得到所述目标音乐的目标音乐特征,包括:
[0032]对所述目标音频数据进行音频特征提取,得到目标音频特征;
[0033]对所述目标歌词数据进行歌词特征提取,得到目标歌词特征;
[0034]对所述目标音频特征和所述目标歌词特征进行特征拼接,得到所述目标音乐特征。
[0035]在一些实施例,所述基于所述音乐分类模型和所述目标音乐特征对所述目标音乐进行流派评分,得到流派评分数据,并根据所述流派评分数据得到所述目标音乐的流派类别,包括:
[0036]基于所述音乐分类模型的预设函数和候选流派类别对所述目标音乐特征进行流派评分,得到所述流派评分数据,其中,所述流派评分数据用于表示所述目标音乐属于每个所述候选流派类别的概率;
[0037]选取所述流派评分数据最大的候选流派类别作为所述目标音乐的流派类别。
[0038]为实现上述目的,本申请实施例的第二方面提出了一种音乐分类装置,所述装置包括:
[0039]样本数据获取模块,用于获取样本音乐的样本音频数据和样本歌词数据;
[0040]音频特征提取模块,用于对所述样本音频数据进行音频特征提取,得到样本音频特征;
[0041]歌词特征提取模块,用于对所述样本歌词数据进行歌词特征提取,得到样本歌词特征;
[0042]样本对构建模块,用于基于所述样本音频特征和所述样本歌词特征,构建正音乐样本对和负音乐样本对;
[0043]模型训练模块,用于基于所述正音乐样本对和所述负音乐样本对对对预设的神经网络模型进行模型训练,得到音乐分类模型;
[0044]目标数据获取模块,用于获取目标音乐的目标数据;
[0045]目标特征提取模块,用于对所述目标数据进行特征提取,得到所述目标音乐的目标音乐特征;
[0046]流派分类模块,用于基于所述音乐分类模型和所述目标音乐特征对所述目标音乐进行流派评分,得到流派评分数据,并根据所述流派评分数据得到所述目标音乐的流派类别。
[0047]为实现上述目的,本申请实施例的第三方面提出了一种电子设备,所述电子设备包括存储器、处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的方法。
[0048]为实现上述目的,本申请实施例的第四方面提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的方法。
[0049]本申请提出的音乐分类方法、音乐分类装置、电子设备及存储介质,其通过获取样本音乐的样本音频数据和样本歌词数据;对样本音频数据进行音频特征提取,得到样本音频特征;对样本歌词数据进行歌词特征提取,得到样本歌词特征,这一方式能够同时提取到样本音乐的歌词信息和音频信息,提高本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种音乐分类方法,其特征在于,所述方法包括:获取样本音乐的样本音频数据和样本歌词数据;对所述样本音频数据进行音频特征提取,得到样本音频特征;对所述样本歌词数据进行歌词特征提取,得到样本歌词特征;基于所述样本音频特征和所述样本歌词特征,构建正音乐样本对和负音乐样本对;基于所述正音乐样本对和所述负音乐样本对对预设的神经网络模型进行模型训练,得到音乐分类模型;获取目标音乐的目标数据;对所述目标数据进行特征提取,得到所述目标音乐的目标音乐特征;基于所述音乐分类模型和所述目标音乐特征对所述目标音乐进行流派评分,得到流派评分数据,并根据所述流派评分数据得到所述目标音乐的流派类别。2.根据权利要求1所述的音乐分类方法,其特征在于,所述对所述样本音频数据进行音频特征提取,得到样本音频特征,包括:对所述样本音频数据进行格式转换,得到样本频谱数据;将所述样本频谱数据输入至预设的特征提取模型中,其中,所述特征提取模型包括卷积层和池化层;基于所述卷积层对所述样本频谱数据进行二维卷积处理,得到初步频谱特征;基于所述池化层对所述初步频谱特征进行最大池化处理,得到所述样本音频特征。3.根据权利要求1所述的音乐分类方法,其特征在于,所述对所述样本歌词数据进行歌词特征提取,得到样本歌词特征,包括:将所述样本歌词数据输入至预设的文本编码模型中,其中,所述文本编码模型包括嵌入层和transformer编码器;基于所述嵌入层对所述样本歌词数据进行嵌入处理,得到样本歌词嵌入表示;基于所述transformer编码器对所述样本歌词嵌入表示进行特征编码,得到所述样本歌词特征。4.根据权利要求1所述的音乐分类方法,其特征在于,所述正音乐样本对和所述负音乐样本对均包括一个样本音频特征和一个样本歌词特征,所述基于所述样本音频特征和所述样本歌词特征,构建正音乐样本对和负音乐样本对,包括:基于来源于同一样本音乐的所述样本音频特征和所述样本歌词特征,构建所述正音乐样本对;基于来源于不同样本音乐的所述样本音频特征和所述样本歌词特征,构建所述负音乐样本对。5.根据权利要求1所述的音乐分类方法,其特征在于,所述基于所述正音乐样本对和所述负音乐样本对对预设的神经网络模型进行模型训练,得到音乐分类模型,包括:对所述正音乐样本对进行特征降维,得到正音乐特征对,并对所述负音乐样本对进行特征降维,得到负音乐特征对,其中,所述负音乐特征对包括第一负特征对、第二负特征对;对所述正音乐特征对进行特征相似评分,得到第一相似数据,对所述第一负特征对进行特征相似评分,得到第二相似数据,并对所述第二负特征对...

【专利技术属性】
技术研发人员:张旭龙王健宗程宁茹港徽
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1