翻唱识别模型训练方法、翻唱识别方法、设备和存储介质技术

技术编号:39039412 阅读:11 留言:0更新日期:2023-10-10 11:52
本申请涉及一种翻唱识别模型训练方法、翻唱识别方法、计算机设备和存储介质。所述翻唱识别模型训练方法包括:获取样本音乐对应的原唱歌曲与翻唱歌曲,并提取原唱歌曲对应的原唱歌曲特征,以及翻唱歌曲对应的翻唱歌曲特征;将翻唱歌曲特征与原唱歌曲特征进行混合处理,得到混合歌曲特征;将混合歌曲特征输入待训练的翻唱识别模型的编码器,通过编码器得到混合歌曲特征对应的旋律特征,并将旋律特征输入翻唱识别模型的解码器,通过解码器得到重构歌曲特征;根据重构歌曲特征以及翻唱歌曲特征之间的差异,对翻唱识别模型进行训练,得到训练完成的翻唱识别模型。采用本方法能够提高训练的翻唱识别模型的翻唱识别准确率。翻唱识别模型的翻唱识别准确率。翻唱识别模型的翻唱识别准确率。

【技术实现步骤摘要】
翻唱识别模型训练方法、翻唱识别方法、设备和存储介质


[0001]本申请涉及人工智能
,特别是涉及一种翻唱识别模型训练方法、翻唱识别方法、计算机设备和存储介质。

技术介绍

[0002]随着人工智能技术的发展,出现了一种利用人工智能网络识别翻唱歌曲的技术,该技术通过预先训练翻唱歌曲识别模型,由该模型从歌曲音频中提取旋律信息,根据旋律的相似性来识别出翻唱的歌曲。
[0003]传统技术中,翻唱识别模型通常是通过有监督学习的方式训练,通过输入频谱特征来使翻唱识别模型学习同旋律歌曲整体的相似性和不同旋律歌曲个体的差异性,从而完成翻唱识别模型的训练。
[0004]然而,目前的通过有监督学习的方式训练翻唱识别模型,由于需要学习不同旋律歌曲之间的差异性,会容易受到不同歌曲之间的影响,所训练的模型会和训练集中的音乐类别数有一定的依赖性,因此训练的翻唱识别模型的翻唱识别准确率较低。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种翻唱识别模型训练方法、翻唱识别方法、设备和存储介质。
[0006]第一方面,本申请提供了一种翻唱识别模型训练方法,所述方法包括:
[0007]获取样本音乐对应的原唱歌曲与翻唱歌曲,并提取所述原唱歌曲对应的原唱歌曲特征,以及所述翻唱歌曲对应的翻唱歌曲特征;
[0008]将所述翻唱歌曲特征与所述原唱歌曲特征进行混合处理,得到混合歌曲特征;
[0009]将所述混合歌曲特征输入待训练的翻唱识别模型的编码器,通过所述编码器得到所述混合歌曲特征对应的旋律特征,并将所述旋律特征输入所述翻唱识别模型的解码器,通过所述解码器得到重构歌曲特征;
[0010]根据所述重构歌曲特征以及所述翻唱歌曲特征之间的差异,对所述翻唱识别模型进行训练,得到训练完成的翻唱识别模型。
[0011]在其中一个实施例中,所述提取所述原唱歌曲对应的原唱歌曲特征,以及所述翻唱歌曲对应的翻唱歌曲特征,包括:对第一目标歌曲进行傅里叶变换处理,得到所述第一目标歌曲对应的频谱图,并从所述频谱图中,获取所述第一目标歌曲对应的频率峰值点;所述第一目标歌曲包括所述原唱歌曲,以及所述翻唱歌曲;根据所述频率峰值点,得到所述频率峰值点对应的频谱峰值序列,将所述频谱峰值序列作为所述第一目标歌曲对应的歌曲特征;若所述第一目标歌曲为所述原唱歌曲,则将所述第一目标歌曲对应的歌曲特征,作为所述原唱歌曲对应的原唱歌曲特征;若所述第一目标歌曲为所述翻唱歌曲,则将所述第一目标歌曲对应的歌曲特征,作为所述翻唱歌曲对应的翻唱歌曲特征。
[0012]在其中一个实施例中,所述根据所述频率峰值点,得到所述频率峰值点对应的频
谱峰值序列,包括:获取各所述频率峰值点对应的频率值,根据所述频率值得到所述频谱图对应的频率均值以及频率值方差;利用所述频率均值以及频率值方差,对各所述频率峰值点对应的频率值进行归一化处理,得到归一化频率峰值点;利用所述归一化频率峰值点,构造所述频谱峰值序列。
[0013]在其中一个实施例中,所述将所述翻唱歌曲特征与所述原唱歌曲特征进行混合处理,得到混合歌曲特征,包括:获取预先设定的扰动参数,根据所述扰动参数获取所述翻唱歌曲特征的第一特征权重,以及所述原唱歌曲特征的第二特征权重;利用所述第一特征权重以及所述第二特征权重,对所述翻唱歌曲特征以及所述原唱歌曲特征进行加权处理,得到所述混合歌曲特征。
[0014]在其中一个实施例中,所述提取所述原唱歌曲对应的原唱歌曲特征,以及所述翻唱歌曲对应的翻唱歌曲特征,包括:对第二目标歌曲进行常数Q变换处理,得到所述第二目标歌曲对应的常数Q变换特征;所述第二目标歌曲包括所述原唱歌曲,以及所述翻唱歌曲;若所述第二目标歌曲为所述原唱歌曲,则将所述第二目标歌曲对应的常数Q变换特征,作为所述原唱歌曲对应的原唱歌曲特征;若所述第二目标歌曲为所述翻唱歌曲,则将所述第二目标歌曲对应的常数Q变换特征,作为所述翻唱歌曲对应的翻唱歌曲特征。
[0015]在其中一个实施例中,所述得到训练完成的翻唱识别模型之后,还包括:获取候选歌曲对应的候选歌曲特征;将所述候选歌曲特征输入所述训练完成的翻唱识别模型的编码器,通过所述编码器得到所述候选歌曲特征对应的候选旋律特征;构建所述候选歌曲对应的音乐与所述候选旋律特征的对应关系,并利用所述对应关系构建旋律特征库。
[0016]第二方面,本申请还提供了一种翻唱识别方法,所述方法包括:
[0017]获取待识别翻唱歌曲,以及所述待识别翻唱歌曲对应的歌曲特征;
[0018]将所述待识别翻唱歌曲对应的歌曲特征输入训练完成的翻唱识别模型的编码器,通过所述编码器得到所述待识别翻唱歌曲的旋律特征;所述翻唱识别模型通过如第一方面中任一项实施例所述的翻唱识别模型训练方法训练得到;
[0019]根据所述旋律特征,识别所述待识别翻唱歌曲对应的音乐。
[0020]在其中一个实施例中,所述根据所述旋律特征,识别所述待识别翻唱歌曲对应的歌曲类别,包括:将所述旋律特征输入预先构建的旋律特征库,从所述旋律特征库存储的候选旋律特征中,获取与所述旋律特征相似度最大的目标旋律特征;所述旋律特征库中存储有各候选旋律特征与音乐之间的对应关系;将所述目标旋律特征对应的音乐,作为所述待识别翻唱歌曲对应的音乐。
[0021]第三方面,本申请还提供了一种翻唱识别模型训练装置,所述装置包括:
[0022]歌曲特征获取模块,用于获取样本音乐对应的原唱歌曲与翻唱歌曲,并提取所述原唱歌曲对应的原唱歌曲特征,以及所述翻唱歌曲对应的翻唱歌曲特征;
[0023]歌曲特征混合模块,用于将所述翻唱歌曲特征与所述原唱歌曲特征进行混合处理,得到混合歌曲特征;
[0024]歌曲特征重构模块,用于将所述混合歌曲特征输入待训练的翻唱识别模型的编码器,通过所述编码器得到所述混合歌曲特征对应的旋律特征,并将所述旋律特征输入所述翻唱识别模型的解码器,通过所述解码器得到重构歌曲特征;
[0025]识别模型训练模块,用于根据所述重构歌曲特征以及所述翻唱歌曲特征之间的差
异,对所述翻唱识别模型进行训练,得到训练完成的翻唱识别模型。
[0026]第四方面,本申请还提供了一种翻唱识别装置,所述装置包括:
[0027]待识别歌曲获取模块,用于获取待识别翻唱歌曲,以及所述待识别翻唱歌曲对应的歌曲特征;
[0028]旋律特征提取模块,用于将所述待识别翻唱歌曲对应的歌曲特征输入训练完成的翻唱识别模型的编码器,通过所述编码器得到所述待识别翻唱歌曲的旋律特征;所述翻唱识别模型通过如第一方面中任一项实施例所述的翻唱识别模型训练方法训练得到;
[0029]翻唱歌曲识别模块,用于根据所述旋律特征,识别所述待识别翻唱歌曲对应的音乐。
[0030]第五方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0031]获取样本音本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种翻唱识别模型训练方法,其特征在于,所述方法包括:获取样本音乐对应的原唱歌曲与翻唱歌曲,并提取所述原唱歌曲对应的原唱歌曲特征,以及所述翻唱歌曲对应的翻唱歌曲特征;将所述翻唱歌曲特征与所述原唱歌曲特征进行混合处理,得到混合歌曲特征;将所述混合歌曲特征输入待训练的翻唱识别模型的编码器,通过所述编码器得到所述混合歌曲特征对应的旋律特征,并将所述旋律特征输入所述翻唱识别模型的解码器,通过所述解码器得到重构歌曲特征;根据所述重构歌曲特征以及所述翻唱歌曲特征之间的差异,对所述翻唱识别模型进行训练,得到训练完成的翻唱识别模型。2.根据权利要求1所述的方法,其特征在于,所述提取所述原唱歌曲对应的原唱歌曲特征,以及所述翻唱歌曲对应的翻唱歌曲特征,包括:对第一目标歌曲进行傅里叶变换处理,得到所述第一目标歌曲对应的频谱图,并从所述频谱图中,获取所述第一目标歌曲对应的频率峰值点;所述第一目标歌曲包括所述原唱歌曲,以及所述翻唱歌曲;根据所述频率峰值点,得到所述频率峰值点对应的频谱峰值序列,将所述频谱峰值序列作为所述第一目标歌曲对应的歌曲特征;若所述第一目标歌曲为所述原唱歌曲,则将所述第一目标歌曲对应的歌曲特征,作为所述原唱歌曲对应的原唱歌曲特征;若所述第一目标歌曲为所述翻唱歌曲,则将所述第一目标歌曲对应的歌曲特征,作为所述翻唱歌曲对应的翻唱歌曲特征。3.根据权利要求2所述的方法,其特征在于,所述根据所述频率峰值点,得到所述频率峰值点对应的频谱峰值序列,包括:获取各所述频率峰值点对应的频率值,根据所述频率值得到所述频谱图对应的频率均值以及频率值方差;利用所述频率均值以及频率值方差,对各所述频率峰值点对应的频率值进行归一化处理,得到归一化频率峰值点;利用所述归一化频率峰值点,构造所述频谱峰值序列。4.根据权利要求1所述的方法,其特征在于,所述将所述翻唱歌曲特征与所述原唱歌曲特征进行混合处理,得到混合歌曲特征,包括:获取预先设定的扰动参数,根据所述扰动参数获取所述翻唱歌曲特征的第一特征权重,以及所述原唱歌曲特征的第二特征权重;利用所述第一特征权重以及所述第二特征权重,对所述翻唱歌曲特征以及所述原唱歌曲特征进行加权处理,得到所述混合...

【专利技术属性】
技术研发人员:王武城龚韬
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1