一种伴奏纯净度评估方法以及相关设备技术

技术编号:21688546 阅读:22 留言:0更新日期:2019-07-24 15:20
本发明专利技术实施例公开了一种伴奏纯净度评估方法以及相关设备,其中方法包括:获取多个第一伴奏数据以及各个第一伴奏数据对应的标签;各个第一伴奏数据对应的标签用于指示对应的第一伴奏数据为纯器乐伴奏数据或存在背景噪声的器乐伴奏数据;提取各个第一伴奏数据的音频特征;根据各个第一伴奏数据的音频特征以及各个第一伴奏数据对应的标签进行模型训练,获得用于伴奏纯净度评估的神经网络模型;神经网络模型的模型参数是由各个第一伴奏数据的音频特征以及各个第一伴奏数据对应的标签之间的关联关系确定的。通过实施本发明专利技术实施例,可实现高效准确地分辨消音伴奏和原版伴奏。

A Purity Assessment Method for Accompaniment and Related Equipment

【技术实现步骤摘要】
一种伴奏纯净度评估方法以及相关设备
本专利技术涉及计算机
,尤其涉及一种伴奏纯净度评估方法以及相关设备。
技术介绍
随着生活水平和科技水平的提高,人们已经能够通过移动终端(如手机)实现随时随地想唱就唱的目的。这就需要伴奏给用户提供唱歌支持,如果所唱歌曲的伴奏是原版伴奏,其纯净度高,给人以优美的体验;而如果所唱歌曲的伴奏是消音伴奏,其纯净度低,包含较多的背景噪声,会大大降低用户体验。这些消音伴奏的产生原因是:一方面是很多老歌因为发行年代久远并不存在与其对应的原版伴奏,或者发行年代较新的新歌难以获取到对应的原版伴奏;另一方面是因为音频技术的不断发展,使得人们能够通过音频技术处理一些原唱歌曲,从而获得消音伴奏,而通过音频技术处理得到的消音伴奏仍然存在较多的背景噪声,使得主观听感上比原版伴奏要差。目前,消音伴奏已经在网络中大量出现,音乐内容提供方主要依靠人工标记的方法来分辨消音伴奏,其效率、准确率都较低,且需要消耗大量的人力成本。如何高效准确地分辨消音伴奏和原版伴奏目前仍为一种严峻的技术挑战。
技术实现思路
本专利技术实施例提供一种伴奏纯净度评估方法,可实现高效准确地分辨歌曲伴奏是纯器乐伴奏还是存在背景噪声的器乐伴奏。第一方面,本专利技术实施例提供了一种伴奏纯净度评估方法,该方法包括:获取多个第一伴奏数据以及各个第一伴奏数据对应的标签;所述各个第一伴奏数据对应的标签用于指示对应的第一伴奏数据为纯器乐伴奏数据或存在背景噪声的器乐伴奏数据;提取所述各个第一伴奏数据的音频特征;根据所述各个第一伴奏数据的音频特征以及各个第一伴奏数据对应的标签进行模型训练,获得用于伴奏纯净度评估的神经网络模型;所述神经网络模型的模型参数是由所述各个第一伴奏数据的音频特征以及各个第一伴奏数据对应的标签之间的关联关系确定的。在一些实施例中,在提取所述各个第一伴奏数据的音频特征之前,所述方法还包括:对所述各个第一伴奏数据进行调整,以使所述各个第一伴奏数据的播放时长与预设播放时长相符;对所述各个第一伴奏数据进行归一化处理,以使所述各个第一伴奏数据的音强符合预设音强。在一些实施例中,在根据所述各个第一伴奏数据的音频特征以及各个第一伴奏数据对应的标签进行模型训练之前,所述方法还包括:根据Z-score算法对所述各个第一伴奏数据的音频特征进行处理,以使所述各个第一伴奏数据的音频特征标准化;其中所述各个第一伴奏数据的标准化后的音频特征符合正态分布。在一些实施例中,在获得用于伴奏纯净度评估的神经网络模型之后,所述方法还包括:获取多个第二伴奏数据的音频特征以及各个第二伴奏数据的对应的标签;将所述多个第二伴奏数据的音频特征输入到所述神经网路模型中,以获得各个第二伴奏数据的评估结果;根据所述各个第二伴奏数据的评估结果与所述各个第二伴奏数据的对应的标签的差距,获得所述神经网络模型的准确率;在所述神经网络模型的准确率低于预设阈值的情况下,调节模型参数重新对所述神经网络模型进行训练,直至所述神经网络模型的准确率大于等于预设阈值,且所述模型参数的变化幅度小于等于预设幅度。在一些实施例中,所述音频特征包括:梅尔频谱特征、相关谱感知线性预测特征、谱熵特征、感知线性预测特征中的任意一种或者任意多种组合。第二方面,本专利技术还提供另一种伴奏纯净度评估方法,该方法包括:获取待检测数据,所述待检测数据包括伴奏数据;提取所述伴奏数据的音频特征;将所述音频特征输入到神经网络模型中,获得所述伴奏数据的纯净度评估结果;所述评估结果用于指示所述待检测数据为纯器乐伴奏数据或存在背景噪声的器乐伴奏数据,所述神经网络模型是根据多个样本训练得到的,所述多个样本包括多个伴奏数据的音频特征以及各个伴奏数据对应的标签,所述神经网络模型的模型参数是由所述各个伴奏数据的音频特征以及各个伴奏数据对应的标签之间的关联关系确定的。在一些实施例中,在提取所述伴奏数据的音频特征之前,所述方法还包括:对所述伴奏数据进行调整,以使所述伴奏数据的播放时长与预设播放时长相符;对所述伴奏数据进行归一化处理,以使所述伴奏数据的音强符合预设音强。在一些实施例中,在将所述音频特征输入到神经网络模型中之前,所述方法还包括:根据Z-score算法对所述伴奏数据的音频特征进行处理,以使所述伴奏数据的音频特征标准化;其中所述伴奏数据标准化后的音频特征符合正太分布。在一些实施例中,在获得所述伴奏数据的纯净度评估结果之后,所述方法还包括:若所述伴奏数据的纯净度大于或等于预设阈值,确定所述纯净度评估结果为所述纯器乐伴奏数据;若所述待检测伴奏数据的的纯净度小于所述预设阈值,确定所述纯净度评估结果为所述存在背景噪声的器乐伴奏数据。第三方面,本专利技术还提供一种伴奏纯净度评估装置,该装置包括:通信模块,用于获取多个第一伴奏数据以及各个第一伴奏数据对应的标签;所述各个第一伴奏数据对应的标签用于指示对应的第一伴奏数据为纯器乐伴奏数据或存在背景噪声的器乐伴奏数据;特征提取模块,用于提取所述各个第一伴奏数据的音频特征;训练模块,用于根据所述各个第一伴奏数据的音频特征以及各个第一伴奏数据对应的标签进行模型训练,获得用于伴奏纯净度评估的神经网络模型;所述神经网络模型的模型参数是由所述各个第一伴奏数据的音频特征以及各个第一伴奏数据对应的标签之间的关联关系确定的。在一些实施例中,所述装置还包括数据优化模块,所述数据优化模块用于,对所述各个第一伴奏数据进行调整,以使所述各个第一伴奏数据的播放时长与预设播放时长相符;对所述各个第一伴奏数据进行归一化处理,以使所述各个第一伴奏数据的音强符合预设音强。在一些实施例中,所述装置还包括特征标准化模块,所述特征标准化模块用于,在根据所述各个第一伴奏数据的音频特征以及各个第一伴奏数据对应的标签进行模型训练之前,根据Z-score算法对所述各个第一伴奏数据的音频特征进行处理,以使所述各个第一伴奏数据的音频特征标准化;其中所述各个第一伴奏数据的标准化后的音频特征符合正态分布。在一些实施例中,所述装置还包括验证模块,所述验证模块用于:获取多个第二伴奏数据的音频特征以及各个第二伴奏数据的对应的标签;将所述多个第二伴奏数据的音频特征输入到所述神经网路模型中,以获得各个第二伴奏数据的评估结果;根据所述各个第二伴奏数据的评估结果与所述各个第二伴奏数据的对应的标签的差距,获得所述神经网络模型的准确率;在所述神经网络模型的准确率低于预设阈值的情况下,调节模型参数重新对所述神经网络模型进行训练,直至所述神经网络模型的准确率大于等于预设阈值,且所述模型参数的变化幅度小于等于预设幅度。在一些实施例中,所述音频特征包括:梅尔频谱特征、相关谱感知线性预测特征、谱熵特征、感知线性预测特征中的任意一种或者任意多种组合。第四方面,提供一种伴奏纯净度评估装置,所述装置包括:通信模块,用于获取待检测数据,所述待检测数据包括伴奏数据;特征提取模块,用于提取所述伴奏数据的音频特征;评估模块,用于将所述音频特征输入到神经网络模型中,获得所述伴奏数据的纯净度评估结果;所述评估结果用于指示所述待检测数据为纯器乐伴奏数据或存在背景噪声的器乐伴奏数据,所述神经网络模型是根据多个样本训练得到的,所述多个样本包括多个伴奏数据的音频特征以及各个伴奏数据对应的标签,所述神经网络模型的模型参数是由本文档来自技高网...

【技术保护点】
1.一种伴奏纯净度评估方法,其特征在于,包括:获取多个第一伴奏数据以及各个第一伴奏数据对应的标签;所述各个第一伴奏数据对应的标签用于指示对应的第一伴奏数据为纯器乐伴奏数据或存在背景噪声的器乐伴奏数据;提取所述各个第一伴奏数据的音频特征;根据所述各个第一伴奏数据的音频特征以及各个第一伴奏数据对应的标签进行模型训练,获得用于伴奏纯净度评估的神经网络模型;所述神经网络模型的模型参数是由所述各个第一伴奏数据的音频特征以及各个第一伴奏数据对应的标签之间的关联关系确定的。

【技术特征摘要】
1.一种伴奏纯净度评估方法,其特征在于,包括:获取多个第一伴奏数据以及各个第一伴奏数据对应的标签;所述各个第一伴奏数据对应的标签用于指示对应的第一伴奏数据为纯器乐伴奏数据或存在背景噪声的器乐伴奏数据;提取所述各个第一伴奏数据的音频特征;根据所述各个第一伴奏数据的音频特征以及各个第一伴奏数据对应的标签进行模型训练,获得用于伴奏纯净度评估的神经网络模型;所述神经网络模型的模型参数是由所述各个第一伴奏数据的音频特征以及各个第一伴奏数据对应的标签之间的关联关系确定的。2.根据权利要求1所述的方法,其特征在于,在提取所述各个第一伴奏数据的音频特征之前,所述方法还包括:对所述各个第一伴奏数据进行调整,以使所述各个第一伴奏数据的播放时长与预设播放时长相符;对所述各个第一伴奏数据进行归一化处理,以使所述各个第一伴奏数据的音强符合预设音强。3.根据权利要求1或2所述的方法,其特征在于,在根据所述各个第一伴奏数据的音频特征以及各个第一伴奏数据对应的标签进行模型训练之前,所述方法还包括:根据Z-score算法对所述各个第一伴奏数据的音频特征进行处理,以使所述各个第一伴奏数据的音频特征标准化;其中所述各个第一伴奏数据的标准化后的音频特征符合正态分布。4.根据权利要求1-3任一项所述的方法,其特征在于,在获得用于伴奏纯净度评估的神经网络模型之后,所述方法还包括:获取多个第二伴奏数据的音频特征以及各个第二伴奏数据的对应的标签;将所述多个第二伴奏数据的音频特征输入到所述神经网路模型中,以获得各个第二伴奏数据的评估结果;根据所述各个第二伴奏数据的评估结果与所述各个第二伴奏数据的对应的标签的差距,获得所述神经网络模型的准确率;在所述神经网络模型的准确率低于预设阈值的情况下,调节模型参数重新对所述神经网络模型进行训练,直至所述神经网络模型的准确率大于等于预设阈值,且所述模型参数的变化幅度小于等于预设幅度。5.根据权利要求1-4任一项所述的方法,其特征在于,所述音频特征包括:梅尔频谱特征、相关谱感知线性预测特征、谱熵特征、感知线性预测特征中的任意一种或者任意多种组合。6.一种伴奏纯净度评估方法,其特征在于,包括:获取待检测数据,所述待检测数据包括伴奏数据;提取所述伴奏数据的音频特征;将所述音频特征输入到神经网络模型中,获得所述伴奏数据的纯净度评估结果;所述评估结果用于指示所述待检测数据为纯器乐伴奏数据或存在背景噪声的器乐伴奏数据,所述神经网络模型是根据多个样本训练得到的,所述多个样本包括多个伴奏数据的音频特征以及各个伴奏数据对应的标签,所述神经网络模型的模型参数是由所述各个伴奏数据的音频特征以及各个伴奏数据对应的标签之间的关联关系确定的。7.根据权利要求6所述的方法,其特征在于,在提取所述伴奏数据的音频特征之前,所述方法还包括:对所述伴奏数据进行调整,以使所述伴奏数据的播放时长与预设播放时长相符;对所述伴奏数据进行归一化处理,以使所述伴奏数据的音强符合预设音强。8.根据权利要求6或7所述的方法,其特征在于,在将所述音频特征输入到神经网络模型中之前,所述方法还包括:根据Z-score算法对所述伴奏数据的音频特征进行处理,以使所述伴奏数据的音频特征标准化;其中所述伴奏数据标准化后的音频特征符合正太分布。9.根据权利要求6-8任一项所述的方法,其特征在于,在获得所述伴奏数据的纯净度评估结果之后,所述方法还包括:若所述伴奏数据的纯净度大于或等于预设阈值,确定所述纯净度评估结果为所述纯器乐伴奏数据;若所述待检测伴奏数据的的纯净度小于所述预设阈值,确定所述纯净度评估结果为所述存在背景噪声的器乐伴奏数据。10.一种伴奏纯净度评估装置,其特征在于,包括:通信模块,用于获取多个第一伴奏数据以及各个第一伴奏数据对应的标签;所述各个第一伴奏数据对应的标签用于指示对应的第一伴奏数据为纯器乐伴奏数据或存在背景噪声的器乐伴奏数据;特征提取模块,用于提取所述各个第一伴奏数据的音频特征;训练模块,用于根据所述各个第一伴奏数据的音频特征以及各个第一伴奏数据...

【专利技术属性】
技术研发人员:徐东
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1