一种音乐结构伸缩方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:34136527 阅读:14 留言:0更新日期:2022-07-14 16:45
本发明专利技术公开了一种音乐结构伸缩方法、装置、计算机设备及存储介质。该方法包括获取原音乐中的频谱特征;强化所述频谱特征中的每一时间帧的音色特性;计算所述频谱特征中各个时间帧之间的音色相似度;筛选出大于预设相似阀值的音色相似度所对应的时间帧,并在筛选出的时间帧中选择相连的时间帧作为待伸缩片段;对比所述原音乐的原音频时长和目标音频时长,对所述待伸缩片段进行伸缩处理并使得所述原音频时长和目标音频时长一致。本发明专利技术能够有效侦测出音乐中最适合进行重组和的音乐片段,具有将音乐时长缩放到所设定的时长的优点。将音乐时长缩放到所设定的时长的优点。将音乐时长缩放到所设定的时长的优点。

【技术实现步骤摘要】
一种音乐结构伸缩方法、装置、计算机设备及存储介质


[0001]本专利技术涉及音频处理
,尤其涉及一种音乐结构伸缩方法、装置、计算机设备及存储介质。

技术介绍

[0002]在剪辑视频中通常需要重新调整音乐的长度从而使音乐可以匹配目标视频的长度,一般常见的做法是编辑者根据音乐已有的结构去做片段的延伸又或者裁剪掉不重要的片段,让原本的音乐可以调整成需要的音乐长度,而其中伸缩音乐的结构对于一般的编辑者的专业门坎比较高,通常需要专业的背景知识,也需要耗费大量的时间来让结构伸缩后的音乐质量与原本的无差异,因此开发一个自动化的基于内容的音乐结构伸缩算法让音乐自动的去匹配编辑者想要的音乐长度,可以大量减少编辑者的时间且降低该功能的使用门坎。
[0003]目前市面上的自动化音乐结构伸缩算法可主要分为两种:基于模板算法和基于音乐内容算法两种路线,但这些算法经过伸缩后相邻的时间点会有明显的跳跃感,让整体音乐质量会有所下降,尤其当相邻的时间点中有歌声时跳跃感更明显,主要是因为这些算法中通常只考虑音乐的重拍/鼓点,而缺少考虑音乐内容中的音色特性来减少音乐的跳跃感。

技术实现思路

[0004]本专利技术的目的是提供一种音乐结构伸缩方法、装置、计算机设备及存储介质,旨在解决现有音乐结构伸缩算法对音乐进行伸缩处理后导致音乐质量下降的问题。
[0005]为解决上述技术问题,本专利技术的目的是通过以下技术方案实现的:提供一种音乐结构伸缩方法,包括:
[0006]获取原音乐中的频谱特征;
[0007]强化所述频谱特征中的每一时间帧的音色特性;
[0008]计算所述频谱特征中各个时间帧之间的音色相似度;
[0009]筛选出大于预设相似阀值的音色相似度所对应的时间帧对,并将所述时间帧对之间的片段作为待伸缩片段;
[0010]对比所述原音乐的原音频时长和目标音频时长,对所述待伸缩片段进行伸缩处理并使得所述原音频时长和目标音频时长一致。
[0011]另外,本专利技术要解决的技术问题是还在于提供一种音乐结构伸缩装置,其包括:
[0012]特征获取单元,用于获取原音乐中的频谱特征;
[0013]特征强化单元,用于强化所述频谱特征中的每一时间帧的音色特性;
[0014]相似度计算单元,用于计算所述频谱特征中各个时间帧之间的音色相似度;
[0015]片段筛选单元,用于筛选出大于预设相似阀值的音色相似度所对应的时间帧对,并将所述时间帧对之间的片段作为待伸缩片段;
[0016]伸缩处理单元,用于对比所述原音乐的原音频时长和目标音频时长,对所述待伸
缩片段进行伸缩处理并使得所述原音频时长和目标音频时长一致。
[0017]另外,本专利技术实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的音乐结构伸缩方法。
[0018]另外,本专利技术实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的音乐结构伸缩方法。
[0019]本专利技术实施例公开了一种音乐结构伸缩方法、装置、计算机设备及存储介质,该方法包括获取原音乐中的频谱特征;强化所述频谱特征中的每一时间帧的音色特性;计算所述频谱特征中各个时间帧之间的音色相似度;筛选出大于预设相似阀值的音色相似度所对应的时间帧,并在筛选出的时间帧中选择相连的时间帧作为待伸缩片段;对比所述原音乐的原音频时长和目标音频时长,对所述待伸缩片段进行伸缩处理并使得所述原音频时长和目标音频时长一致。本专利技术实施例能够有效侦测出音乐中最适合进行重组和的音乐片段,具有将音乐时长缩放到所设定的时长的优点。
附图说明
[0020]为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021]图1为本专利技术实施例提供的音乐结构伸缩方法的流程示意图;
[0022]图2为本专利技术实施例提供的音乐结构伸缩方法的子流程示意图;
[0023]图3为本专利技术实施例提供的音乐结构伸缩方法的子流程示意图;
[0024]图4为本专利技术实施例提供的音乐结构伸缩方法的子流程示意图;
[0025]图5为本专利技术实施例提供的音乐结构伸缩装置的示意性框图;
[0026]图6为本专利技术实施例提供的计算机设备的示意性框图。
具体实施方式
[0027]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0028]应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0029]还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0030]还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0031]请参阅图1,图1为本专利技术实施例提供的音乐结构伸缩方法的流程示意图;
[0032]如图1所示,该方法包括步骤S101~S105。
[0033]S101、获取原音乐中的频谱特征;
[0034]该步骤中,频谱特征用于代表原音乐中的音色,并容易看出音色特性。
[0035]S102、强化频谱特征中的每一时间帧的音色特性;
[0036]该步骤中,通过强化音色特性以便于区分,更容易进行识别。
[0037]S103、计算频谱特征中各个时间帧之间的音色相似度;
[0038]S104、筛选出大于预设相似阀值的音色相似度所对应的时间帧对,并将时间帧对之间的片段作为待伸缩片段;
[0039]步骤S103

S104中,每一时间帧对也就是具有非常高的音色相似度的两个时间帧,这两个时间帧之间的片段更适合进行音乐结构伸缩,优选的,预设相似阀值可以为0.95。
[0040]S105、对比原音乐的原音频时长和目标音频时长,对待伸缩片段进行伸缩处理并使得原音频时长和目标音频时长一致;
[0041]该步骤中,根据目标音频时长,通过重复叠加或删减待伸缩片本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音乐结构伸缩方法,其特征在于,包括:获取原音乐中的频谱特征;强化所述频谱特征中的每一时间帧的音色特性;计算所述频谱特征中各个时间帧之间的音色相似度;筛选出大于预设相似阀值的音色相似度所对应的时间帧对,并将所述时间帧对之间的片段作为待伸缩片段;对比所述原音乐的原音频时长和目标音频时长,对所述待伸缩片段进行伸缩处理并使得所述原音频时长和目标音频时长一致。2.根据权利要求1所述的音乐结构伸缩方法,其特征在于,所述获取原音乐中的频谱特征,包括:利用短时间傅立叶变换将原音乐的时域特征转成频域特征;利用分贝转换法将所述频域特征转换为频谱特征。3.根据权利要求1所述的音乐结构伸缩方法,其特征在于,所述利用短时间傅立叶变换将原音乐的时域特征转成频域特征,包括:按如下公式计算并得到频域特征S:其中,k表示频域特征的频域位置,n0表示频域特征的长度位置,x[n]表示讯号在第n个长度的值,N
FT
表示设定的频率值,w[n]为0.54

0.46*cos(n/N),表示离散傅里叶变换。4.根据权利要求1所述的音乐结构伸缩方法,其特征在于,所述强化所述频谱特征中的每一时间帧的音色特性,包括:在每一所述时间帧中串接其前面预设个数的其他时间帧。5.根据权利要求1所述的音乐结构伸缩方法,其特征在于,所述计算所述频谱特征中各个时间帧之间的音色相似度,包括:采用余弦相似性计算所述频谱特征中各个时间帧之间的音色相似度,并根据每一音色相似度得到自相似度矩阵。6.根据权利要求1所述的音乐结构伸缩方法,其特征在于,所述对比所述原音乐的原音频时长和目标音频时长,对所述待伸缩片段进行伸缩处理并使得所述原音频时长和目标音频时长一致,...

【专利技术属性】
技术研发人员:周思瑜
申请(专利权)人:深圳万兴软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1