歌曲质量评价方法、装置和存储介质制造方法及图纸

技术编号:33377345 阅读:10 留言:0更新日期:2022-05-11 22:45
一种歌曲质量评价方法、装置和存储介质,该方法包括:获取待评价的歌曲,并针对所述歌曲提取质量评价特征,所述质量评价特征包括主旋律特征、歌词特征和节奏特征;将所述质量评价特征输入到训练好的歌曲质量评价网络,由所述歌曲质量评价网络输出所述歌曲的质量评价结果。根据本申请实施例的歌曲质量评价方法和装置针对待评价的歌曲提取主旋律特征、歌词特征和节奏特征作为质量评价特征,通过训练好的歌曲质量评价网络来预测歌曲的质量评价结果,能够实现歌曲的主旋律、歌词和节奏在歌曲质量预测中的应用,从而更好地利用歌曲不同侧面的信息,提高质量预测的准确性。提高质量预测的准确性。提高质量预测的准确性。

【技术实现步骤摘要】
歌曲质量评价方法、装置和存储介质


[0001]本申请涉及人工智能
,更具体地涉及一种歌曲质量评价方法、装置和存储介质。

技术介绍

[0002]歌曲挑选旨在从海量歌曲中选择高质量的歌曲用于购买,它使音乐发行可以选择出符合大众审美的歌曲。当前,基于人工的歌曲挑选方法依然是歌曲挑选的主流方法。
[0003]基于人工的歌曲挑选方法会根据歌曲的旋律、和声、歌词之间搭配和质量来判断一首歌曲的总体质量,并最终由委员会投票决定是否进行歌曲的购买。尽管这种方法可以选择出高质量的歌曲,但是由于个体和委员会审美的差异性和局限性,以及个体在不同时间审美的差异性,导致挑选的歌曲质量随时间变化较大,与音乐榜单歌曲相比质量也有所下降。
[0004]在上述人工挑选歌曲的过程中,歌曲的质量也是人工来评价的,人工进行歌曲质量评价存在耗时耗力的缺陷。因此,目前缺乏能够自动进行歌曲质量评价的方法。

技术实现思路

[0005]为了解决上述问题而提出的了本申请。根据本申请一方面,提供了一种歌曲质量评价方法,所述方法包括:获取待评价的歌曲,并针对所述歌曲提取质量评价特征,所述质量评价特征包括主旋律特征、歌词特征和节奏特征;将所述质量评价特征输入到训练好的歌曲质量评价网络,由所述歌曲质量评价网络输出所述歌曲的质量评价结果。
[0006]在本申请的一个实施例中,所述歌曲质量评价网络包括主旋律打分模型、歌词打分模型和节奏打分模型,其中:所述主旋律打分模型基于所述主旋律特征输出主旋律质量分数;所述歌词打分模型基于所述歌词特征输出歌词质量分数;所述节奏打分模型基于所述节奏特征输出节奏质量分数;所述歌曲的质量评价结果是通过对所述主旋律质量分数、所述歌词质量分数和所述节奏质量分数这三者进行融合而得到的,或者,所述主旋律质量分数、所述歌词质量分数和所述节奏质量分数这三者也可以分别输出以作为所述歌曲的质量评价结果。
[0007]在本申请的一个实施例中,所述歌曲质量评价网络包括融合模型,所述融合模型包括主旋律打分模型、歌词打分模型和节奏打分模型,所述质量评价特征输入到所述融合模型,所述融合模型输出所述歌曲的歌曲质量分数,作为所述质量评价结果。
[0008]在本申请的一个实施例中,所述主旋律打分模型包括用于捕捉所述歌曲的时序特征的循环神经网络或自注意力神经网络,还包括用于捕捉局部特征的卷积神经网络。
[0009]在本申请的一个实施例中,所述歌词打分模型包括用于捕捉所述歌曲的上下文特征中的情感信息和句法结构信息的自然语言处理模型。
[0010]在本申请的一个实施例中,所述自然语言处理模型包括基于转换器的双向编码表征模型或生成预训练转换器模型。
[0011]在本申请的一个实施例中,所述节奏打分模型包括用于跟踪所述歌曲的整体拍速和局部拍速的卷积神经网络、循环神经网络或基于自注意力机制的网络。
[0012]在本申请的一个实施例中,所述主旋律打分模型、所述歌词打分模型和所述节奏打分模型这三者在训练过程中,通过将预测值和被标注的真实值之间的交叉熵或者均方误差最小化而更新模型参数。
[0013]在本申请的一个实施例中,所述主旋律打分模型、所述歌词打分模型和所述节奏打分模型这三者的训练数据集是通过歌曲爬取、数据清洗和人工标注数据标签而得到的。
[0014]在本申请的一个实施例中,所述歌曲爬取包括利用网络爬虫下载音乐平台上的已发行歌曲,或者从资料库中获取小样歌曲。
[0015]在本申请的一个实施例中,所述数据清洗包括对爬取的歌曲进行筛选,所述筛选包括筛除以下中的至少一项:标识符重复的歌曲、歌曲名重复的歌曲、非汉语歌曲、音频或歌词过短的歌曲、已发行歌曲的翻唱版本。
[0016]在本申请的一个实施例中,所述人工标注数据标签包括:特征标签的标注和质量标签的标注。
[0017]在本申请的一个实施例中,所述特征标签包括以下中的至少一项:副歌的位置、歌词、歌曲类型。
[0018]在本申请的一个实施例中,所述质量标签包括热度指数或定性评价标签。
[0019]在本申请的一个实施例中,所述主旋律特征包括所述歌曲的整首歌或者副歌的主基频特征、半音类特征和梅尔频谱。
[0020]在本申请的一个实施例中,所述歌词特征包括所述歌曲的整首歌或者副歌的歌词经令牌化后得到的词向量。
[0021]在本申请的一个实施例中,所述节奏特征包括所述歌曲的整首歌或者副歌的节拍结构和节拍点位序列。
[0022]根据本申请另一方面,提供了一种歌曲质量评价装置,所述装置包括:特征提取模块,用于获取待评价的歌曲,并针对所述歌曲提取质量评价特征,所述质量评价特征包括主旋律特征、歌词特征和节奏特征;歌曲质量评价模块,用于将所述质量评价特征输入到训练好的歌曲质量评价网络,由所述歌曲质量评价网络输出所述歌曲的质量评价结果。
[0023]根据本申请再一方面,提供了一种歌曲质量评价装置,所述装置包括存储器和处理器,所述存储器上存储有由所述处理器运行的计算机程序,所述计算机程序在被所述处理器运行时,使得所述处理器执行上述歌曲质量评价方法。
[0024]根据本申请又一方面,提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序在运行时,执行上述歌曲质量评价方法。
[0025]根据本申请实施例的歌曲质量评价方法和装置针对待评价的歌曲提取主旋律特征、歌词特征和节奏特征作为质量评价特征,通过训练好的歌曲质量评价网络来预测歌曲的质量评价结果,能够实现歌曲的主旋律、歌词和节奏在歌曲质量预测中的应用,从而更好地利用歌曲不同侧面的信息,提高质量预测的准确性。
附图说明
[0026]通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、
特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
[0027]图1示出根据本申请实施例的歌曲质量评价方法的示意性流程图。
[0028]图2示出根据本申请实施例的歌曲质量评价方法中采用的歌曲质量评价网络的一个示例的示意图。
[0029]图3示出根据本申请实施例的歌曲质量评价方法中采用的歌曲质量评价网络的另一个示例的示意图。
[0030]图4示出根据本申请实施例的歌曲质量评价方法中采用的主旋律打分模型的一个示例的示意图。
[0031]图5示出根据本申请一个实施例的歌曲质量评价装置的示意性结构框图。
[0032]图6示出根据本申请另一个实施例的歌曲质量评价装置的示意性结构框图。
具体实施方式
[0033]为了使得本申请的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。基于本申请中描述的本申本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种歌曲质量评价方法,其特征在于,所述方法包括:获取待评价的歌曲,并针对所述歌曲提取质量评价特征,所述质量评价特征包括主旋律特征、歌词特征和节奏特征;将所述质量评价特征输入到训练好的歌曲质量评价网络,由所述歌曲质量评价网络输出所述歌曲的质量评价结果。2.根据权利要求1所述的方法,其特征在于,所述歌曲质量评价网络包括主旋律打分模型、歌词打分模型和节奏打分模型,其中:所述主旋律打分模型基于所述主旋律特征输出主旋律质量分数;所述歌词打分模型基于所述歌词特征输出歌词质量分数;所述节奏打分模型基于所述节奏特征输出节奏质量分数;所述歌曲的质量评价结果是通过对所述主旋律质量分数、所述歌词质量分数和所述节奏质量分数这三者进行融合而得到的,或者,所述主旋律质量分数、所述歌词质量分数和所述节奏质量分数这三者也可以分别输出以作为所述歌曲的质量评价结果。3.根据权利要求1所述的方法,其特征在于,所述歌曲质量评价网络包括融合模型,所述融合模型包括主旋律打分模型、歌词打分模型和节奏打分模型,所述质量评价特征输入到所述融合模型,所述融合模型输出所述歌曲的歌曲质量分数,作为所述质量评价结果。4.根据权利要求2或3所述的方法,其特征在于,所述主旋律打分模型包括用于捕捉所述歌曲的时序特征的循环神经网络或自注意力神经网络,还包括用于捕捉局部特征的卷积神经网络。5.根据权利要求2或3所述的方法,其特征在于,所述歌词打分模型包括用于捕捉所述歌曲的上下文特征中的情感信息和句法结构信息的自然语言处理模型。6.根据权利要求5所述的方法,其特征在于,所述自然语言处理模型包括基于转换器的双向编码表征模型或生成预训练转换器模型。7.根据权利要求2或3所述的方法,其特征在于,所述节奏打分模型包括用于跟踪所述歌曲的整体拍速和局部拍速的卷积神经网络、循环神经网络或基于自注意力机制的网络。8.根据权利要求2所述的方法,其特征在于,所述主旋律打分模型、所述歌词打分模型和所述节奏打分模型这三者在训练过程中,通过将预测值和被标注的真实值之间的交叉熵或者均方误差最小化而更新模型参数。9.根据权利要求2所述的方法,其特征在于,所述主旋律打分模型、所述歌词打分模型和所述节奏打分模型这三者的训练数据集是通过歌曲爬取、数据...

【专利技术属性】
技术研发人员:周骁胡亚军江源
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1