一种音乐结构伸缩方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：34136527 阅读：14 留言：0更新日期：2022-07-14 16:45

本发明专利技术公开了一种音乐结构伸缩方法、装置、计算机设备及存储介质。该方法包括获取原音乐中的频谱特征；强化所述频谱特征中的每一时间帧的音色特性；计算所述频谱特征中各个时间帧之间的音色相似度；筛选出大于预设相似阀值的音色相似度所对应的时间帧，并在筛选出的时间帧中选择相连的时间帧作为待伸缩片段；对比所述原音乐的原音频时长和目标音频时长，对所述待伸缩片段进行伸缩处理并使得所述原音频时长和目标音频时长一致。本发明专利技术能够有效侦测出音乐中最适合进行重组和的音乐片段，具有将音乐时长缩放到所设定的时长的优点。将音乐时长缩放到所设定的时长的优点。将音乐时长缩放到所设定的时长的优点。

全部详细技术资料下载

【技术实现步骤摘要】
一种音乐结构伸缩方法、装置、计算机设备及存储介质

[0001]本专利技术涉及音频处理
，尤其涉及一种音乐结构伸缩方法、装置、计算机设备及存储介质。

技术介绍

[0002]在剪辑视频中通常需要重新调整音乐的长度从而使音乐可以匹配目标视频的长度,一般常见的做法是编辑者根据音乐已有的结构去做片段的延伸又或者裁剪掉不重要的片段，让原本的音乐可以调整成需要的音乐长度，而其中伸缩音乐的结构对于一般的编辑者的专业门坎比较高，通常需要专业的背景知识，也需要耗费大量的时间来让结构伸缩后的音乐质量与原本的无差异，因此开发一个自动化的基于内容的音乐结构伸缩算法让音乐自动的去匹配编辑者想要的音乐长度，可以大量减少编辑者的时间且降低该功能的使用门坎。
[0003]目前市面上的自动化音乐结构伸缩算法可主要分为两种：基于模板算法和基于音乐内容算法两种路线，但这些算法经过伸缩后相邻的时间点会有明显的跳跃感，让整体音乐质量会有所下降，尤其当相邻的时间点中有歌声时跳跃感更明显，主要是因为这些算法中通常只考虑音乐的重拍/鼓点，而缺少考虑音乐内容中的音色特性来减少音乐的跳跃感。

技术实现思路

[0004]本专利技术的目的是提供一种音乐结构伸缩方法、装置、计算机设备及存储介质，旨在解决现有音乐结构伸缩算法对音乐进行伸缩处理后导致音乐质量下降的问题。
[0005]为解决上述技术问题，本专利技术的目的是通过以下技术方案实现的：提供一种音乐结构伸缩方法，包括：
[0006]获取原音乐中的频谱特征；
[0007]...

【技术保护点】

【技术特征摘要】
1.一种音乐结构伸缩方法，其特征在于，包括：获取原音乐中的频谱特征；强化所述频谱特征中的每一时间帧的音色特性；计算所述频谱特征中各个时间帧之间的音色相似度；筛选出大于预设相似阀值的音色相似度所对应的时间帧对，并将所述时间帧对之间的片段作为待伸缩片段；对比所述原音乐的原音频时长和目标音频时长，对所述待伸缩片段进行伸缩处理并使得所述原音频时长和目标音频时长一致。2.根据权利要求1所述的音乐结构伸缩方法，其特征在于，所述获取原音乐中的频谱特征，包括：利用短时间傅立叶变换将原音乐的时域特征转成频域特征；利用分贝转换法将所述频域特征转换为频谱特征。3.根据权利要求1所述的音乐结构伸缩方法，其特征在于，所述利用短时间傅立叶变换将原音乐的时域特征转成频域特征，包括：按如下公式计算并得到频域特征S：其中，k表示频域特征的频域位置，n0表示频域特征的长度位置，x[n]表示讯号在第n个长度的值，N
FT
表示设定的频率值，w[n]为0.54
‑
0.46*cos(n/N)，表示离散傅里叶变换。4.根据权利要求1所述的音乐结构伸缩方法，其特征在于，所述强化所述频谱特征中的每一时间帧的音色特性，包括：在每一所述时间帧中串接其前面预设个数的其他时间帧。5.根据权利要求1所述的音乐结构伸缩方法，其特征在于，所述计算所述频谱特征中各个时间帧之间的音色相似度，包括：采用余弦相似性计算所述频谱特征中各个时间帧之间的音色相似度，并根据每一音色相似度得到自相似度矩阵。6.根据权利要求1所述的音乐结构伸缩方法，其特征在于，所述对比所述原音乐的原音频时长和目标音频时长，对所述待伸缩片段进行伸缩处理并使得所述原音频时长和目标音频时长一致，...

【专利技术属性】
技术研发人员：周思瑜，
申请(专利权)人：深圳万兴软件有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人