音乐处理方法及装置制造方法及图纸

技术编号：40545060 阅读：8 留言：0更新日期：2024-03-05 19:02

本申请实施例提供一种音乐处理方法，所述方法包括：将目标音乐进行声源分离，以得到至少两个媒体资源，至少一个所述媒体资源对应一种音乐成分；提取每一所述媒体资源的第一特征；根据所述第一特征确定所述目标音乐的副歌片段。本申请实施例提供的音乐处理方法，可以在提高副歌识别的效率的同时提高副歌识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机，特别涉及一种音乐处理方法、装置、计算机设备及存储介质。

技术介绍

1、在流行歌曲中，副歌往往会多次重复出现，通常有丰富的乐器和复杂的节奏形式。副歌片段一般是音乐中最具感染力和吸引力的精彩片段，在短视频背景音乐制作中，为了在有限的时间内吸引用户，副歌片段通常被选用来做视频的背景音乐，以快速吸引用户的关注。

2、副歌检测是音乐信号处理中一个具有挑战性的问题，目前，选取副歌的方法一般分为以下两种：

3、(1)人工根据视觉和听觉的判断选取副歌部分，这种方法虽然识别的准确率较高，但是需要耗费大量的人力，效率较低；

4、(2)采用计算机设备来选取副歌，这些方法大多数是基于音乐中声音的响度、声音出现的频率、节奏密度等显性特征作预先假设来判断，虽然这些方法相比人工的方法而言效率较高，但是这种预先假设限制了方法的泛化能力，使得副歌识别的准确率不高。

技术实现思路

1、本申请的目的在于提供一种音乐处理方法、装置、计算机设备及存储介质，用于解决目前副歌识别的效率及准确率较低的技术问题。

2、本申请实施例的一个方面提供了一种音乐处理方法，包括：将目标音乐进行声源分离，以得到至少两个媒体资源，至少一个所述媒体资源对应一种音乐成分；提取每一所述媒体资源的第一特征；根据所述第一特征确定所述目标音乐的副歌片段。

3、可选地，所述将目标音乐进行声源分离，以得到至少两个媒体资源，包括：将目标音乐进行声源分离，以得到对应所述目标音乐整体的媒体

4、可选地，所述提取每一所述媒体资源的第一特征，根据所述第一特征确定所述目标音乐的副歌片段，包括：提取每一所述媒体资源的频域特征；根据所述频域特征确定每一所述媒体资源的自相似矩阵；将所述自相似矩阵输入至识别模型中，以通过所述识别模型确定所述目标音乐中每一帧为副歌的概率；根据所述概率确定所述目标音乐的副歌片段。

5、可选地，所述提取每一所述媒体资源的频域特征，包括：提取每一所述媒体资源在mel谱或cqt谱中的频域特征。

6、可选地，所述识别模型由卷积神经网络训练得到。

7、可选地，所述识别模型由卷积神经网络和self attention训练得到。

8、可选地，所述根据所述概率确定所述目标音乐的副歌片段，包括：确定所述目标音乐中每一帧的概率是否超过预设阈值；在所述目标音乐中当前帧的概率大于或等于所述预设阈值的情况下，确定所述当前帧属于副歌部分；根据所述目标音乐中部分帧或所有帧是否属于副歌部分的结果、确定所述目标音乐的副歌片段。

9、本申请实施例的一个方面又提供了一种音乐处理装置，包括：分离模块，用于将目标音乐进行声源分离，以得到至少两个媒体资源，至少一个所述媒体资源对应一种音乐成分；提取模块，用于提取每一所述媒体资源的第一特征；确定模块，用于根据所述第一特征确定所述目标音乐的副歌片段。

10、本申请实施例的一个方面又提供了一种计算机设备，所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时用于实现上述的音乐处理方法的步骤。

11、本申请实施例的一个方面又提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序可被至少一个处理器所执行，以使所述至少一个处理器执行上述的音乐处理方法的步骤。

12、本申请实施例提供的音乐处理方法、装置、计算机设备及存储介质，包括以下优点：

13、通过将目标音乐进行声源分离，以得到至少两个媒体资源，至少一个媒体资源对应一种音乐成分，提取每一媒体资源的第一特征，根据第一特征确定目标音乐的副歌片段，由于可以使用计算机设备自动识别目标音乐的副歌片段，因此相比人工的方式具有更高的效率；而由于是根据至少一种音乐成分的媒体资源的特征对目标音乐的副歌进行识别，因此可以根据不同的音乐进行不同的判断，相比预先假设来判断的方法具有更高的泛化能力，从而具有更高的准确率。

本文档来自技高网...

【技术保护点】

1.一种音乐处理方法，其特征在于，包括：

2.根据权利要求1所述的音乐处理方法，其特征在于，所述将目标音乐进行声源分离，以得到至少两个媒体资源，包括：

3.根据权利要求1所述的音乐处理方法，其特征在于，所述提取每一所述媒体资源的第一特征，根据所述第一特征确定所述目标音乐的副歌片段，包括：

4.根据权利要求3所述的音乐处理方法，其特征在于，所述提取每一所述媒体资源的频域特征，包括：

5.根据权利要求3所述的音乐处理方法，其特征在于，所述识别模型由卷积神经网络训练得到。

6.根据权利要求3所述的音乐处理方法，其特征在于，所述识别模型由卷积神经网络和Self Attention训练得到。

7.根据权利要求4-6任一项所述的音乐处理方法，其特征在于，所述根据所述概率确定所述目标音乐的副歌片段，包括：

8.一种音乐处理装置，其特征在于，包括：

9.一种计算机设备，所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时用于实现权

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序可被至少一个处理器所执行，以使所述至少一个处理器执行权利要求1至7中任一项所述的音乐处理方法的步骤。

...

【技术特征摘要】

1.一种音乐处理方法，其特征在于，包括：

2.根据权利要求1所述的音乐处理方法，其特征在于，所述将目标音乐进行声源分离，以得到至少两个媒体资源，包括：

3.根据权利要求1所述的音乐处理方法，其特征在于，所述提取每一所述媒体资源的第一特征，根据所述第一特征确定所述目标音乐的副歌片段，包括：

4.根据权利要求3所述的音乐处理方法，其特征在于，所述提取每一所述媒体资源的频域特征，包括：

5.根据权利要求3所述的音乐处理方法，其特征在于，所述识别模型由卷积神经网络训练得到。

6.根据权利要求3所述的音乐处理方法，其特征在于，所述识别模型由卷积神经网络和self att...

【专利技术属性】
技术研发人员：请求不公布姓名，舒景辰，
申请(专利权)人：上海哔哩哔哩科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人