合唱歌曲识别网络的训练方法及合唱歌曲的评价方法技术

技术编号:37635718 阅读:19 留言:0更新日期:2023-05-20 08:55
本发明专利技术实施例公开了合唱歌曲识别网络的训练方法、合唱歌曲的评价方法及相关装置,用于提高合唱歌曲评价的准确性。本发明专利技术实施例方法包括:获取带标签的第一训练样本,第一训练样本包括多个合唱用户演唱多首合唱歌曲歌声样本的梅尔谱和多个合唱用户的音色向量;将演唱同一合唱歌曲的每个合唱用户歌声样本的梅尔谱输入合唱歌曲识别网络,以得到输出的对应合唱用户的音色向量;根据用户标签,获取合唱歌曲识别网络输出的每个合唱用户的音色向量与第一训练样本中同一合唱用户的音色向量;利用损失函数计算合唱歌曲识别网络输出的每个合唱用户的音色向量与训练样本中同一合唱用户音色向量之间的差值;根据差值和反向传播算法对合唱歌曲识别网络做修正。法对合唱歌曲识别网络做修正。法对合唱歌曲识别网络做修正。

【技术实现步骤摘要】
合唱歌曲识别网络的训练方法及合唱歌曲的评价方法


[0001]本专利技术涉及歌曲数据处理
,尤其涉及一种合唱歌曲识别网络的训练方法、合唱歌曲的评价方法及相关装置。

技术介绍

[0002]无论是线上K歌软件还是线下K歌,合唱都是一种非常重要的演唱场景。通常流行歌曲的合唱都是轮唱叠加少量重唱的方式,即A一个段落,B一个段落,部分段落被标记为合唱段落,即两个人同时演唱一句。
[0003]两个用户演唱全曲或各自合唱的段落,双人合唱的音轨,都是按照内置的段落划分叠加起来的,对应的作品分数也是按照各自的部分进行累加,也即合唱得分是A的演唱得分和B的演唱得分进行累加,而这样的评分方式比较简单和单一,不能对合唱场景中的合唱用户进行针对性的评价。

技术实现思路

[0004]本专利技术实施例提供了一种合唱歌曲识别网络的训练方法、合唱歌曲的评价方法及相关装置,用于先对评价合唱歌曲的识别网络进行训练,并进一步利用合唱歌曲识别网络对合唱用户的音色默契度进行评分,并利用合唱默契度评分对合唱者的合唱歌曲进行评价,从而提升对合唱者合唱歌曲评价的针对性和准确性。
[0005]本申请实施例第一方面提供了一种合唱歌曲识别网络的训练方法,包括:
[0006]获取带标签的第一训练样本,所述第一训练样本包括多个合唱用户演唱多首合唱歌曲歌声样本的梅尔谱和多个合唱用户的音色向量;
[0007]将演唱同一合唱歌曲的每个合唱用户歌声样本的梅尔谱输入合唱歌曲识别网络,以得到所述合唱歌曲识别网络输出的对应合唱用户的音色向量;
[0008]根据用户标签,获取所述合唱歌曲识别网络输出的每个合唱用户的音色向量与所述第一训练样本中同一合唱用户的音色向量;
[0009]利用损失函数计算所述合唱歌曲识别网络输出的每个合唱用户的音色向量与所述第一训练样本中同一合唱用户的音色向量之间的差值;
[0010]根据所述差值和反向传播算法对所述合唱歌曲识别网络进行修正。
[0011]优选的,所述合唱歌曲识别网络包括长短期记忆网络和全连接层;
[0012]将演唱同一合唱歌曲的每个合唱用户歌声样本的梅尔谱输入合唱歌曲识别网络,以得到所述合唱歌曲识别网络输出的对应合唱用户的音色向量,包括:
[0013]将演唱同一合唱歌曲的每个合唱用户歌声样本的梅尔谱输入所述长短期记忆网络,以提取每个合唱用户音色向量的特征值;
[0014]将每个合唱用户音色向量的特征值输入所述全连接层,以对每个合唱用户音色向量的特征值进行整合输出,得到合唱歌曲识别网络输出的对应合唱用户的音色向量。
[0015]优选的,根据所述差值和反向传播算法对所述合唱歌曲识别网络进行修正,包括:
[0016]根据所述差值和反向传播算法对所述长短期记忆网络和所述全连接层进行修正。
[0017]优选的,同一合唱用户歌声样本梅尔谱向量之间的类内距离小于或等于预设参考值,不同合唱用户歌声样本梅尔谱向量之间的类间距离大于所述预设参考值。
[0018]优选的,所述方法还包括:
[0019]获取带标签的第二训练样本,所述第二训练样本包括多个合唱用户演唱多首合唱歌曲的音色向量,以及每首合唱歌曲中多个合唱用户的音色默契度得分;
[0020]将演唱同一合唱歌曲的多个合唱用户歌曲片段的音色向量进行拼接,得到拼接后的音色向量;
[0021]将所述拼接后的音色向量输入至全连接网络,以得到全连接网络输出的合唱者音色默契度得分;
[0022]根据用户标签,获取所述全连接网络输出的合唱者音色默契度得分与所述第二训练样本中相同合唱者的音色默契度得分;
[0023]利用损失函数计算所述全连接网络输出的合唱者音色默契度得分与所述第二训练样本中相同合唱者的音色默契度得分之间的差值;
[0024]根据所述差值和反向传播算法对所述全连接网络进行修正。
[0025]优选的,所述全连接网络包括特征层、池化层和全连接层;
[0026]将所述拼接后的音色向量输入至全连接网络,以得到全连接网络输出的合唱者音色默契度得分,包括:
[0027]将所述拼接后的音色向量输入至所述特征层,以提取出拼接后音色向量的音色特征值;
[0028]将拼接后音色向量的音色特征值输入至所述池化层,以对拼接后音色向量的音色特征值进行去冗余降维;
[0029]将去冗余降维后的拼接音色向量的音色特征值输入至所述全连接层,以用于将去冗余降维后的拼接音色向量的特征值进行整合输出,以得到合唱者演唱同一合唱歌曲的音色默契度得分。
[0030]优选的,根据所述差值和反向传播算法对所述全连接网络进行修正,包括:
[0031]根据所述差值和反向传播算法对所述特征层、所述池化层和所述全连接层进行修正。
[0032]本申请实施例第二方面提供了一种合唱歌曲的评价方法,所述方法包括:
[0033]获取合唱歌曲中合唱者对应的演唱片段,其中,所述合唱者包括至少两个合唱用户;
[0034]提取所述每个合唱用户对应演唱片段的梅尔谱;
[0035]将每个合唱用户对应演唱片段的梅尔谱输入合唱歌曲识别网络,以得到每个合唱用户的音色向量,其中,所述合唱歌曲识别网络包括长短期记忆网络和全连接层,所述长短期记忆网络用于提取每个合唱用户音色向量的特征值,所述全连接层用于将每个合唱用户音色向量的特征值进行整合输出;
[0036]将所述每个合唱用户的音色向量进行拼接,以得到拼接后的音色向量;
[0037]将所述拼接后的音色向量输入至全连接网络的特征层,以提取拼接后音色向量的特征值;
[0038]将拼接后音色向量的特征值输入至全连接网络的池化层,以用于对拼接后音色向量的特征值进行去冗余降维;
[0039]将去冗余降维后的拼接音色向量的特征值输入至全连接网络的全连接层,以用于将去冗余降维后的拼接音色向量的特征值进行整合输出,得到合唱者演唱同一合唱歌曲的音色默契度得分;
[0040]根据合唱者的音色默契度得分,对合唱者的合唱歌曲进行评价。
[0041]优选的,将所述每个合唱用户的音色向量进行拼接,以得到拼接后的音色向量,包括:
[0042]在时间维度上将每个合唱用户的音色向量进行平均,以得到每个合唱用户不包含时序特征的音色向量,将每个用户不包含时序特征的音色向量进行拼接。
[0043]优选的,将所述每个合唱用户的音色向量进行拼接,以得到拼接后的音色向量,包括:
[0044]在时间维度上将至少两个合唱用户的音色向量进行叠加,然后将叠加后的音色向量按照合唱用户的个数进行平均,以得到包含时序特征的拼接后的音色向量。
[0045]优选的,所述方法还包括:
[0046]获取所述合唱者对同一合唱歌曲的合唱区间;
[0047]计算每个合唱用户在所述合唱区间内的完整度得分;
[0048]根据每个合唱用户在所述合唱区间内的完整度得分,计算所述合唱者对同一合唱歌曲的完整本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种合唱歌曲识别网络的训练方法,其特征在于,所述方法包括:获取带标签的第一训练样本,所述第一训练样本包括多个合唱用户演唱多首合唱歌曲歌声样本的梅尔谱和多个合唱用户的音色向量;将演唱同一合唱歌曲的每个合唱用户歌声样本的梅尔谱输入合唱歌曲识别网络,以得到所述合唱歌曲识别网络输出的对应合唱用户的音色向量;根据用户标签,获取所述合唱歌曲识别网络输出的每个合唱用户的音色向量与所述第一训练样本中同一合唱用户的音色向量;利用损失函数计算所述合唱歌曲识别网络输出的每个合唱用户的音色向量与所述第一训练样本中同一合唱用户的音色向量之间的差值;根据所述差值和反向传播算法对所述合唱歌曲识别网络进行修正。2.根据权利要求1所述的训练方法,其特征在于,所述合唱歌曲识别网络包括长短期记忆网络和全连接层;将演唱同一合唱歌曲的每个合唱用户歌声样本的梅尔谱输入合唱歌曲识别网络,以得到所述合唱歌曲识别网络输出的对应合唱用户的音色向量,包括:将演唱同一合唱歌曲的每个合唱用户歌声样本的梅尔谱输入所述长短期记忆网络,以提取每个合唱用户音色向量的特征值;将每个合唱用户音色向量的特征值输入所述全连接层,以对每个合唱用户音色向量的特征值进行整合输出,得到合唱歌曲识别网络输出的对应合唱用户的音色向量。3.根据权利要求2所述的训练方法,其特征在于,根据所述差值和反向传播算法对所述合唱歌曲识别网络进行修正,包括:根据所述差值和反向传播算法对所述长短期记忆网络和所述全连接层进行修正。4.根据权利要求1至3中任一项所述的训练方法,其特征在于,同一合唱用户歌声样本梅尔谱向量之间的类内距离小于或等于预设参考值,不同合唱用户歌声样本梅尔谱向量之间的类间距离大于所述预设参考值。5.根据权利要求1所述的训练方法,其特征在于,所述方法还包括:获取带标签的第二训练样本,所述第二训练样本包括多个合唱用户演唱多首合唱歌曲的音色向量,以及每首合唱歌曲中多个合唱用户的音色默契度得分;将演唱同一合唱歌曲的多个合唱用户歌曲片段的音色向量进行拼接,得到拼接后的音色向量;将所述拼接后的音色向量输入至全连接网络,以得到全连接网络输出的合唱者音色默契度得分;根据用户标签,获取所述全连接网络输出的合唱者音色默契度得分与所述第二训练样本中相同合唱者的音色默契度得分;利用损失函数计算所述全连接网络输出的合唱者音色默契度得分与所述第二训练样本中相同合唱者的音色默契度得分之间的差值;根据所述差值和反向传播算法对所述全连接网络进行修正。6.根据权利要求5所述的训练方法,其特征在于,所述全连接网络包括特征层、池化层和全连接层;将所述拼接后的音色向量输入至全连接网络,以得到全连接网络输出的合唱者音色默
契度得分,包括:将所述拼接后的音色向量输入至所述特征层,以提取出拼接后音色向量的音色特征值;将拼接后音色向量的音色特征值输入至所述池化层,以对拼接后音色向量的音色特征值进行去冗余降维;将去冗余降维后的拼接音色向量的音色特征值输入至所述全连接层,以用于将去冗余降维后的拼接音色向量的特征值进行整合输出,以得到合唱者演唱同一合唱歌曲的音色默契度得分。7.根据权利要求6所述的训练方法,其特征在于,根据所述差值和反向传播算法对所述全连接网络进行修正,包括:根据所述差值和反向传播算法对所述特征层、所述池化层和所述全连接层进行修正。8.一种合唱歌曲的评价方法,其特征在于,所述方法包括:获取合唱歌曲中合唱者对应的演唱片段,其中,所述合唱者包括至少两个合唱用户;提取所述每个合唱用户对应演唱片段的梅尔谱;将每个合唱用户对应演唱片段的梅尔谱输入合唱歌曲识别网络,以得到每个合唱用户的音色向量,其中,所述合唱歌曲识别网络包括长短期记忆网络和全连接层,所述长短期记忆网络用于提取每个合唱用户音色向量的特征...

【专利技术属性】
技术研发人员:江益靓孔令城赵伟峰姜涛胡鹏
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1