卡点标签的标记方法、装置、设备及介质制造方法及图纸

技术编号:35330626 阅读:17 留言:0更新日期:2022-10-26 11:47
本申请公开了一种卡点标签的标记方法、装置、设备及介质,属于音频处理领域。所述方法包括:首先,确定音乐中的节拍点和节奏点,获取第一节拍点集合,然后,将音乐剪切为第一音乐片段和第二音乐片段,通过在节奏点上设置时间窗以及结合不同音乐片段在节奏点上的节奏变化幅度,确定出第二节拍点集合,最后,结合不同音乐片段上节拍点之间的时间间隔确定出第三节拍点集合,在第三节拍点集合上标记音乐的卡点标签。上述方法保证了确定出的卡点标签不仅符合人耳的听觉特性,还符合音乐的节奏特性,筛选出的卡点均处于音乐的重节奏点位。选出的卡点均处于音乐的重节奏点位。选出的卡点均处于音乐的重节奏点位。

【技术实现步骤摘要】
卡点标签的标记方法、装置、设备及介质


[0001]本申请涉及音频处理领域,特别涉及一种卡点标签的标记方法、装置、设备及介质。

技术介绍

[0002]视频拼接的基本原理为根据预选的音乐对多段视频进行拼接,即在音乐的特殊时间点位上完成多段视频的拼接。
[0003]相关技术中,基于音乐的节拍规律,提取得到所有节拍点位,并将所有节拍点位作为上述音乐的特殊时间点位。
[0004]由于相关技术并不对节拍点位进行筛选,所有的节拍点位均直接作为视频拼接的时间点位。但是节拍点位中往往存在无效点位,如节拍点位定位在音乐的静音点,此时的节拍点位不适合用于视频拼接。

技术实现思路

[0005]本申请提供了一种卡点标签的标记方法、装置、设备及介质,能够筛选出重节奏的节拍点。所述技术方案如下:
[0006]根据本申请的一个方面,提供了一种卡点标签的标记方法,所述方法包括:
[0007]确定音乐中的节拍点和节奏点,节拍点是音乐基于节拍规律定位的音频信号点,节奏点是音乐基于音量峰值定位的音频信号点;
[0008]基于节拍点和节奏点,确定音乐的目标节拍点,目标节拍点是节拍点的子集;
[0009]在目标节拍点上标记音乐的卡点标签,卡点标签用于标识音乐中用于多媒体拼接的音频信号点。
[0010]根据本申请的一个方面,提供了卡点标签的标记装置,所述装置包括:
[0011]确定模块,用于确定音乐中的节拍点和节奏点,节拍点是音乐基于节拍规律定位的音频信号点,节奏点是音乐基于音量峰值定位的音频信号点;
[0012]筛选模块,用于基于节拍点和节奏点,确定音乐的目标节拍点,目标节拍点是节拍点的子集;
[0013]标记模块,用于在目标节拍点上标记音乐的卡点标签,卡点标签用于标识音乐中用于多媒体拼接的音频信号点。
[0014]根据本申请的一个方面,提供了一种计算机设备,所述计算机设备包括:处理器和存储器,所述存储器存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如上所述的卡点标签的标记方法。
[0015]根据本申请的另一方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序由处理器加载并执行以实现如上所述的卡点标签的标记方法。
[0016]根据本申请的另一个方面,提供了一种计算机程序产品或计算机程序,该计算机
程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述卡点标签的标记方法。
[0017]本申请实施例提供的技术方案带来的有益效果至少包括:
[0018]通过提取音乐的音量峰值所在的音频信号点,并在该音频信号点上设置筛选条件,实现对音乐中节拍点的筛选,使得筛选出的节拍点均能用于视频拼接。上述方法保证了筛选出的节拍点不仅符合人耳的听觉特性,还符合音乐的节奏特性,筛选出的节拍点均处于音乐的重节奏点位。
附图说明
[0019]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1是本申请一示例性实施例提供的音乐的目标节拍点生成系统的示意图;
[0021]图2是本申请一个示例性实施例提供的卡点标签的标记方法的流程图;
[0022]图3是本申请一个示例性实施例提供的音频信号的示意图;
[0023]图4是本申请另一个示例性实施例提供的音频信号的示意图;
[0024]图5是本申请一个示例性实施例提供的在节奏点上设置第一时间窗的示意图;
[0025]图6是本申请另一个示例性实施例提供的卡点标签的标记方法的流程图;
[0026]图7是本申请另一个示例性实施例提供的卡点标签的标记方法的流程图;
[0027]图8是本申请一个示例性实施例提供的卡点标签的标记装置的结构框图;
[0028]图9示出了本申请一个示例性实施例提供的计算机设备的结构框图。
具体实施方式
[0029]为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
[0030]首先,对本申请实施例中涉及的名词进行简单介绍:
[0031]节拍点:节拍是乐曲中表示固定单位时值和强弱规律的组织形式。又称拍子。节拍是用于衡量节奏的单位,在音乐中,有一定强弱分别的一系列拍子在每隔一定时间重复出现。如2/4、4/4、3/4拍等。2/4拍的音乐,表示当前小节有一个强拍和一个弱拍组成;4/4拍的音乐,表示当前小节由强拍、弱拍、次强拍和弱拍组成;3/4拍的音乐,表示当前小节由一个强拍和两个弱拍组成。可见各种节奏的音乐中每个小节都有一个明显的重拍,而且重拍都是该小节的第一拍。因此,只要检测出重拍音符对应的音频信号点,即可将该音频信号点作为节拍点。
[0032]即,节拍点是音乐基于节拍规律定位的音频信号点。
[0033]节奏点:指音频信号的波峰点位,即音频信号波形的一个波峰。即音频信号波形的一个周期内的音量峰值。
[0034]卡点标签:指用于标识音乐中用于多媒体拼接的音频信号点,在一个实施例中,多
媒体拼接的音频信号点由通过信号分析处理得到的音乐的节奏和节拍确定。在一个实施例中,多媒体拼接的音频信号点由人工分析音乐的节拍确定。
[0035]STFT(Short

Time Fourier Transform,短时傅里叶变换):STFT是信号处理常用的变换方式。具体变换过程为首先将信号分帧,然后在分帧加窗,再对每一帧做傅里叶变换,最后把每一帧的结果堆叠起来。在一个实施例中,通过STFT可由声音信号得到声音信号的声谱图。
[0036]Mel(Mel Bank Features,梅尔频谱):通过STFT得到的声谱图的频率区间往往过大,为了得到合适大小的频率区间,往往通过梅尔标度滤波器组将声谱图变换为梅尔频谱。
[0037]实际上,人耳能听到的频率范围是20

20000Hz,但人耳对赫兹这种标度单位并不是线性感知关系。例如声音的频率为1000Hz,如果把声音频率提高到2000Hz,人耳朵察觉不到频率提高了一倍。因此,为实现人耳对频率为线性感知,将声音谱转换为梅尔频谱,此时梅尔频谱的标度与人耳的频率感知为线性关系。
[0038]时域特征过零率:指单位时间内一个信号的符号变化的次数,符号变化指信号从正数变成负数。
[0039]K

means(一种聚类算法):一种聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种卡点标签的标记方法,其特征在于,所述方法包括:确定音乐中的节拍点和节奏点,所述节拍点是所述音乐基于节拍规律定位的音频信号点,所述节奏点是所述音乐基于音量峰值定位的音频信号点;基于所述节拍点和所述节奏点,确定所述音乐的目标节拍点,所述目标节拍点是所述节拍点的子集;在所述目标节拍点上标记所述音乐的卡点标签,所述卡点标签用于标识所述音乐中用于多媒体拼接的音频信号点。2.根据权利要求1所述的方法,其特征在于,所述基于所述节拍点和所述节奏点,确定所述音乐的目标节拍点,包括:在第一节奏点上设置第一时间窗,所述第一节奏点是所述节奏点中的任意一个,所述第一时间窗是以所述第一节奏点为中心设置的时间窗;将第一节拍点确定为所述音乐的目标节拍点,所述第一节拍点是存在于所述第一时间窗内的节拍点。3.根据权利要求2所述的方法,其特征在于,所述将第一节拍点确定为所述音乐的目标节拍点,包括:确定所述音乐在所述第一节奏点的节奏变化幅度;在所述节奏变化幅度不小于第一幅度阈值的情况下,将所述第一节拍点确定为所述音乐的目标节拍点。4.根据权利要求3所述的方法,其特征在于,所述节奏变化幅度采用能量差值比例来表示;所述确定所述音乐在所述第一节奏点上的节奏变化幅度,包括:计算所述第一节奏点所处的波形波峰与所处的波形上一个波谷之间的能量差值比例。5.根据权利要求1至4任一所述的方法,其特征在于,所述确定所述音乐中的节奏点,包括:在所述音乐的梅尔频谱Mel上,设置能量窗;将基于所述能量窗查询到的能量增长速度突变的音频信号点确定为所述节奏点。6.根据权利要求3所述的方法,其特征在于,所述方法还包括:将所述音乐剪切为第一音乐片段和第二音乐片段,所述第一音乐片段的频率均值大于所述第二音乐片段的频率均值;所述在所述节奏变化幅度不小于第一幅度阈值的情况下,将所述第一节拍点确定为所述音乐的目标节拍点,包括:在所述第一节奏点处于所述第一音乐片段,且所述节奏变化幅度不小于第二幅度阈值的情况下,将所述第一节拍点确定为所述音乐的目标节拍点;在所述第一节奏点处于所述第二音乐片段,且所述节奏变化幅度不小于第三幅度阈值的情况下,将所述第一节拍点确定为所述音乐的目标节拍点。7.根据权利要求6所述的方法,其特征在于,所述将所述音乐剪切为第一音乐片段和第二音乐片段,包括:提取所述音乐基于短时傅里叶变换STFT得到的音频基础特征、基于Mel得到的音频基础特征以及时域特征过零率;
采用聚类算法对所述基于STFT得到的音频基础特征、所述基于Mel得到的音频基础特征以及所述时域特征过零率进行二分类聚类,得到所述音乐的标签序列,所述标签序列包含音乐的频率信息;计算得到所述标签序列的分界线;基于所述分界线,将所述音乐剪切为第一音乐片段和第二音乐片段。8.根据权利要求6所述的方法,其特征在于,所述方法应用于n种视频拼接方式,n为正整数;所述在所述第一节奏点处于所述第一音乐片段,且所述节奏变化幅度不...

【专利技术属性】
技术研发人员:冯鑫
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1