System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及音频处理领域,特别涉及一种副歌检测方法、装置、设备及存储介质。
技术介绍
1、现代流行音乐通常由前奏、主歌、副歌、间奏等结构组成。副歌,也称为歌曲的高潮段落,通常一首歌曲中会包含有多个副歌片段。
2、优秀的副歌检测模型能从歌曲中准确的检测出歌曲中每个副歌片段的开始时间和结束时间。如何训练一个优秀的副歌检测模型是音乐信息检索领域的热门研究课题,而副歌检测模型的训练数据整理是其中重要的一环,训练数据的质量和数量能直接决定副歌检测模型的性能表现,只有利用大量且高质量的数据集才能训练出优秀的副歌检测模型。
3、然而,副歌检测训练数据集的标注过程通常由人工完成,非常耗时耗力。
技术实现思路
1、本申请实施例提供了一种副歌检测方法、装置、设备及存储介质,可以提高副歌标注效率。所述技术方案如下。
2、根据本申请的一方面,提供了一种副歌检测方法,所述方法包括:
3、调用旋律特征提取模型对待检测歌曲进行特征提取,得到歌曲特征;调用所述旋律特征提取模型对参考副歌片段进行特征提取,得到副歌特征;所述参考副歌片段是所述待检测歌曲中已标定的副歌片段;所述歌曲特征和所述副歌特征均为二维矩阵,所述二维矩阵的宽度表示频率范围,所述二维矩阵的长度表示音频帧数;
4、将所述歌曲特征与所述副歌特征相乘,计算所述歌曲特征与所述副歌特征的相关性矩阵;所述相关性矩阵为二维矩阵,所述相关性矩阵的行数与所述副歌片段的音频帧数相对应,所述相关性矩阵的列数与所述待
5、确定所述相关性矩阵中数值满足阈值条件的目标列数区间;
6、将所述目标列数区间所对应的所述待检测歌曲的目标音频帧区间,确定为所述待检测歌曲的预测副歌片段。
7、根据本申请的另一方面,提供了一种副歌检测装置,所述装置包括:
8、特征提取模块,用于调用旋律特征提取模型对待检测歌曲进行特征提取,得到歌曲特征;调用所述旋律特征提取模型对参考副歌片段进行特征提取,得到副歌特征;所述参考副歌片段是所述待检测歌曲中已标定的副歌片段;所述歌曲特征和所述副歌特征均为二维矩阵,所述二维矩阵的宽度表示频率范围,所述二维矩阵的长度表示音频帧数;
9、相关性模块,用于将所述歌曲特征与所述副歌特征相乘,计算所述歌曲特征与所述副歌特征的相关性矩阵;所述相关性矩阵为二维矩阵,所述相关性矩阵的行数与所述副歌片段的音频帧数相对应,所述相关性矩阵的列数与所述待检测歌曲的音频帧数相对应;
10、确定模块,用于确定所述相关性矩阵中数值满足阈值条件的目标列数区间;
11、所述确定模块,用于将所述目标列数区间所对应的所述待检测歌曲的目标音频帧区间,确定为所述待检测歌曲的预测副歌片段。
12、根据本申请的另一方面,提供了一种计算机设备,所述计算机设备包括:处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上方面所述的副歌检测方法。
13、根据本申请的另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上方面所述的副歌检测方法。
14、根据本公开实施例的另一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述可选实现方式中提供的副歌检测方法。
15、本申请实施例提供的技术方案带来的有益效果至少包括:
16、利用了已经标注出的歌曲中的一段参考副歌片段,来自动检测歌曲中的其他副歌片段。分别提取参考副歌片段和歌曲的特征,并计算两个特征的相关性,根据相关性的计算结果从中歌曲中匹配出与参考副歌片段关联度较高的片段,进而对歌曲中的副歌片段进行标注。提升了副歌的标注效率、节约成本。通过本申请实施例提出的方法获取副歌检测模型训练集,能大幅提升副歌检测模型的准确率。
本文档来自技高网...【技术保护点】
1.一种副歌检测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述确定所述相关性矩阵中数值满足阈值条件的目标列数区间,包括:
3.根据权利要求1所述的方法,其特征在于,所述确定所述相关性矩阵中数值满足阈值条件的目标列数区间,包括:
4.根据权利要求3所述的方法,其特征在于,所述目标峰值点是采用以下方法确定的:
5.根据权利要求1至4任一所述的方法,其特征在于,所述旋律特征提取模型包括预处理层和特征提取层;所述旋律特征提取模型是采用如下方法训练得到的:
6.根据权利要求5所述的方法,其特征在于,所述获取样本数据,包括:
7.根据权利要求1至4任一所述的方法,其特征在于,所述方法还包括:
8.一种副歌检测装置,其特征在于,所述装置包括:
9.一种计算机设备,其特征在于,所述计算机设备包括:处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行,以实现如权利要求1
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行,以实现如权利要求1至7任一项所述的副歌检测方法。
...【技术特征摘要】
1.一种副歌检测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述确定所述相关性矩阵中数值满足阈值条件的目标列数区间,包括:
3.根据权利要求1所述的方法,其特征在于,所述确定所述相关性矩阵中数值满足阈值条件的目标列数区间,包括:
4.根据权利要求3所述的方法,其特征在于,所述目标峰值点是采用以下方法确定的:
5.根据权利要求1至4任一所述的方法,其特征在于,所述旋律特征提取模型包括预处理层和特征提取层;所述旋律特征提取模型是采用如下方法训练得到的:
6.根据权利要求5所述的方法,其特征在于,所述获取样本数据,包括:
7.根据...
【专利技术属性】
技术研发人员:罗程方,张超钢,陈传艺,
申请(专利权)人:广州酷狗计算机科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。