基于相似矩阵的音乐自动剪辑实现方法、装置及存储介质制造方法及图纸

技术编号：29045229 阅读：13 留言：0更新日期：2021-06-26 05:59

本发明专利技术提供一种基于相似矩阵的音乐自动剪辑实现方法、装置及存储介质，包括S1.获取待剪辑的音频文件和预设剪辑时长范围；S2.将所述音频文件转换为对应的色谱图，并利用相似矩阵对副歌片段进行定位；S3.通过预设窗口对所述副歌片段的能量进行分析，获取所述副歌片段中的高潮片段；S4.通过微调窗口对所述高潮片段进行微调，获取所述高潮片段的起始时间点；S5.通过人声检测模型进行人声检测，获取所述高潮片段的结束时间点；S6.根据所述起始时间点和所述结束时间点剪辑得到对应的音频片段。通过上述方式，提高了音频剪辑的效率和准确性，降低了剪辑成本。降低了剪辑成本。降低了剪辑成本。

全部详细技术资料下载

【技术实现步骤摘要】
基于相似矩阵的音乐自动剪辑实现方法、装置及存储介质

[0001]本专利技术涉及互联网
，具体而言，涉及一种基于相似矩阵的音乐自动剪辑实现方法、装置及存储介质。

技术介绍

[0002]目前，除开普通用户对于音乐的需求以外，现兴起的短时频、直播行业同样对音乐有着很大的需求。因此，对于音乐售卖方，能够提供一个片段让用户进行试听选择的功能至关重要。但是，音乐行业还是一个偏传统的行业，音乐编辑仍然需要人工使用编辑软件对每一首歌试听后截取高潮片段；这不但增加了人工成本，而且效率也不高。所以需要提供一种方案以便于在提高音乐剪辑的效率和准确性的同时降低剪辑成本。

技术实现思路

[0003]本专利技术的目的在于提供一种基于相似矩阵的音乐自动剪辑实现方法、装置及存储介质，用以实现在提高音乐剪辑的效率和准确性的同时降低剪辑成本的技术效果。
[0004]第一方面，本专利技术提供了一种基于相似矩阵的音乐自动剪辑实现方法，包括：
[0005]S1.获取待剪辑的音频文件和预设剪辑时长范围；
[0006]S2.将所述音频文件转换为对应的色谱图，并利用相似矩阵对副歌片段进行定位；
[0007]S3.通过预设窗口对所述副歌片段的能量进行分析，获取所述副歌片段中的高潮片段；
[0008]S4.通过微调窗口对所述高潮片段进行微调，获取所述高潮片段的起始时间点；
[0009]S5.通过人声检测模型进行人声检测，获取所述高潮片段的结束时间点；
[0010]S6.根据所述起始时间点和所...

【技术保护点】

【技术特征摘要】
1.一种基于相似矩阵的音乐自动剪辑实现方法，其特征在于，包括：S1.获取待剪辑的音频文件和预设剪辑时长范围；S2.将所述音频文件转换为对应的色谱图，并利用相似矩阵对副歌片段进行定位；S3.通过预设窗口对所述副歌片段的能量进行分析，获取所述副歌片段中的高潮片段；S4.通过微调窗口对所述高潮片段进行微调，获取所述高潮片段的起始时间点；S5.通过人声检测模型进行人声检测，获取所述高潮片段的结束时间点；S6.根据所述起始时间点和所述结束时间点剪辑得到对应的音频片段。2.根据权利要求1所述的方法，其特征在于，所述S2包括：以一帧为单位构建所述音频文件的色谱图；根据所述色谱图分析各帧歌曲的相似度；将所述相似度按照时间维度构建相似矩阵；根据所述相似矩阵分析最优副歌片段。3.根据权利要求2所述的方法，其特征在于，将所述相似度按照时间维度构建相似矩阵的步骤包括：根据公式(1)计算两帧歌曲的相似度；根据公式(2)构建相似矩阵：M[x][y]＝similarity(x,y)
ꢀꢀꢀꢀ
(2)式中，x和y表示不同的两帧歌曲对应的音符向量；similarity表示相似度；M表示相似度矩阵。4.根据权利要求3所述的方法，其特征在于，根据所述相似矩阵分析最优副歌片段的步骤包括：根据所述相似度矩阵构建延时矩阵，将所述相似度矩阵中倾斜的对角线通过线性变换转换为平铺的直线；根据设置的阈值对所述延时矩阵进行降噪平滑处理；将降噪平滑处理后的延时矩阵中的线条按照时间点进行统计；定义每一条直线的权重，根据各个时间点重叠的线条数进行加权求和，计算该直线的总权重；将总权重最大的直线对应的歌曲片段作为最优副歌片段。5.根据权利要求4所述的方法，其特征在于，根据所述相似度矩阵构建延时矩阵，将所述相似度矩阵中倾斜的对角线通过线性变换转换为平铺的直线的步骤通过公式(3)进行线性变换：T[x][y]＝M[x][x
‑
y]＝similarity(x,x
‑
y)
ꢀꢀꢀ
(3)式中，T表示延时矩阵；M表示相似度矩阵；x和y表示不同的两帧歌曲对应的音符向量；similarity表示相似度。...

【专利技术属性】
技术研发人员：尹学渊，王东明，江天宇，
申请(专利权)人：成都潜在人工智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人