节拍检测方法、装置、电子设备和存储介质制造方法及图纸

技术编号：28742735 阅读：16 留言：0更新日期：2021-06-06 16:39

本公开提供了一种节拍检测方法、装置、电子设备和存储介质，所述方法的训练节拍预测方法包括：从训练样本数据集获取具有大幅度节拍变化的多个训练样本数据；提取所述多个训练样本数据的频域特征，将提取的频域特征输入节拍预测模型并获得所述多个训练样本数据的节拍概率预测值；通过目标损失函数计算所述多个训练样本数据的节拍概率预测值与所述多个训练样本数据的节拍标注之间的偏差，并根据偏差调整节拍预测模型的参数。整节拍预测模型的参数。整节拍预测模型的参数。

全部详细技术资料下载

【技术实现步骤摘要】
节拍检测方法、装置、电子设备和存储介质

[0001]本公开涉及音视频
，尤其涉及一种检测音乐节拍的节拍检测方法、装置、电子设备和存储介质。

技术介绍

[0002]节拍是音乐中表示固定单位时值和强弱规律的组织形式，节拍检测是音乐信息检索领域的重要任务之一。节拍检测算法通过分析音频数据来自动识别节拍位置。准确的节拍检测算法可以被应用于很多方面，如视频制作、游戏、音乐风格转变等。近些年来，深度学习的发展使得各个领域有了更多的可能性去解决之前难以处理的问题。在算力和数据的支撑下，越来越多的基于神经网络的算法应用到具体的产业中。对于节拍检测算法，深度学习可以被应用于两个方面：第一个方面是利用深度神经网络对数据提取深层特征；第二个方面是利用深度学习挖掘数据序列之间的相关性。相比与相关技术的节拍检测算法，基于深度学习的节拍检测方法依赖于更少的先验知识和人工设定的参数，在不同类型的音乐种类上都取得了较大的效果提升。
[0003]但是，深度学习需要大量的数据支持，现有的节拍检测数据库相对有限，且节拍检测的标注因为人工主观的差异会有一些偏差，这就导致了相关技术的基于深度学习的节拍检测算法的几个问题：一是对数据库中大量存在的音乐类型拟合的较好，但是对于标注较少的音乐类型拟合的不好；一些算法为了让算法能适应于不同类型音乐，一般使用多个模型进行建模，导致算法复杂度增加。二是节拍检测的数据不像简单的分类问题，存在数据比例不匹配、重复数据太多和数据标注有偏差的问题，导致训练难以收敛到最优点。

技术实现思路

[0004...

【技术保护点】

【技术特征摘要】
1.一种用于训练节拍预测模型的方法，其特征在于，包括：从训练样本数据集获取具有大幅度节拍变化的多个训练样本数据；提取所述多个训练样本数据的频域特征，将提取的频域特征输入节拍预测模型并获得所述多个训练样本数据的节拍概率预测值；通过目标损失函数计算所述多个训练样本数据的节拍概率预测值与所述多个训练样本数据的节拍标注之间的偏差，并根据偏差调整节拍预测模型的参数。2.如权利要求1所述的方法，其特征在于，所述根据偏差调整节拍预测模型的参数包括：根据目标损失函数计算与多个训练样本数据中的每个训练样本数据对应的损失值；根据损失值对所述多个训练样本数据中的每个训练样本数据分配权重；使用分配了权重的所述多个训练样本数据中的每个训练样本数据对节拍预测模型的参数进行调整。3.如权利要求2所述的方法，其特征在于，所述对每个训练样本数据的分配权重包括：对与所述多个训练样本数据中的每个训练样本数据对应的损失值进行排序；剔除排序在前预定范围和排序在后预定范围内的损失值所对应的训练样本数据；对剔除后的剩余训练样本数据中的部分训练样本数据赋予高于其他训练样本数据的权重。4.如权利要求1所述的方法，其特征在于，还包括：针对训练样本数据集中具有预定BPM的训练样本数据赋予高于训练样本数据集中的其它训练样本数据的学习权重以用于下一轮的训练，其中，所述具有预定BPM的训练样本数据的数量与训练样本数据集的总数据数量之比小于阈值。5.如权利要求4所述的方法，其特征在于，所述针对训练样本数据集中具有预定BPM的训练样本数据赋予高于训练样本数据集中的其它训练样本数据的学习权重包括：使用节拍预测模型对训练样本数据集中的每个训练样本数据执行节拍预测以获得针对每个训练样本数据的节拍预测值；通过目标损失函数计算每个训练样本数据的节拍预测值和节拍标注数据的损失值；计算与训练样本数据集所具有的每个BPM值对应的训练样本数据的平均损失值和训练样本数据数量；根据与每个BPM值对应的训练样本数据的平均损失值和训练样本数据数量的比值...

【专利技术属性】
技术研发人员：崔凡，张晨，
申请(专利权)人：北京达佳互联信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人