音乐处理方法、视频生成方法、装置、计算机设备和介质制造方法及图纸

技术编号:38917080 阅读:9 留言:0更新日期:2023-09-25 09:30
本申请涉及一种音乐处理方法、视频生成方法、装置、计算机设备和介质。上述方法包括:获取各音频帧的音频特征值;根据各音频帧的音频特征值获取目标音频片段。采用本方法提高截取的音乐的高潮片段的精度及通用性,且能够提高视频生成方法的适用性及通用性。视频生成方法的适用性及通用性。视频生成方法的适用性及通用性。

【技术实现步骤摘要】
音乐处理方法、视频生成方法、装置、计算机设备和介质


[0001]本申请涉及视频处理
,特别是涉及一种音乐处理方法、视频生成方法、装置、计算机设备和介质。

技术介绍

[0002]随着音乐处理技术的发展,可以通过计算机设备去获取音乐的高潮片段。
[0003]相关技术中,一般是通过用户手动调整音乐进度条的方式,对音乐的高潮片段进行截取。然而,此方式存在一定的操作难度,且需要花费一定的时间成本。
[0004]相关技术中,还可以通过神经网络模型结合音乐的歌词,对音乐的高潮片段进行自动截取。然而,当音乐无歌词时,会极大程度地降低截取的音乐的高潮片段的精度。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种能够提高截取的音乐的高潮片段的精度及通用性的音乐处理方法、视频生成方法、装置、计算机设备和介质。
[0006]第一方面,本申请提供了一种音乐处理方法。所述方法包括:
[0007]获取各音频帧的音频特征值;
[0008]根据各所述音频帧的音频特征值获取目标音频片段。
[0009]在其中一个实施例中,所述根据各所述音频帧的音频特征值获取目标音频片段,包括:
[0010]根据第一音频特征值,获取候选音频帧;
[0011]根据所述候选音频帧的第二音频特征值,确定多个音频区间;
[0012]根据多个所述音频区间的第三音频特征值,确定所述目标音频片段;其中,所述第三音频特征值为基于所述第一音频特征值获得的。
[0013]在其中一个实施例中,所述根据所述候选音频帧的第二音频特征值,确定多个音频区间,包括:
[0014]将时间间隔小于预设时间间隔阈值的相邻音频帧划入同一音频区间,以生成多个所述音频区间。
[0015]在其中一个实施例中,所述预设时间间隔阈值与所述目标音频片段的目标时长成正比例关系。
[0016]在其中一个实施例中,所述根据多个所述音频区间的第三音频特征值,确定所述目标音频片段,包括:
[0017]根据多个所述音频区间的第三音频特征值,从多个所述音频区间中确定目标音频区间;
[0018]获取所述目标音频区间的参考音频帧;
[0019]根据所述目标音频片段的目标时长,获取所述参考音频帧前后预设时长的音频帧作为第二目标音频帧,基于所述第二目标音频帧形成所述目标音频片段。
[0020]第二方面,本申请提供了一种视频生成方法。所述方法包括:
[0021]获取目标音频片段及多个待处理视频;其中,目标音频片段为如第一方面所述的目标音频片段;
[0022]根据所述目标音频片段、所述目标音频片段的音频参数以及所述待处理视频,生成目标视频。
[0023]在其中一个实施例中,所述方法还包括:获取音符起始点;所述根据所述目标音频片段、所述目标音频片段的音频参数以及所述待处理视频,生成目标视频,包括:
[0024]根据所述待处理视频的数量,确定所述目标音频片段中的视频剪辑点的目标数量;
[0025]根据所述目标音频片段的音频参数以及视频剪辑点的目标数量,从所述音频参数中确定所述目标音频片段中的视频剪辑点;其中,所述目标音频片段的音频参数包括强拍、预设节拍及所述音符起始点的数量;所述预设节拍为除了所述强拍之外的其他节拍;
[0026]根据所述目标音频片段、所述视频剪辑点以及所述待处理视频,生成所述目标视频。
[0027]在其中一个实施例中,所述根据所述目标音频片段的音频参数以及视频剪辑点的目标数量,从所述音频参数中确定所述目标音频片段中的视频剪辑点,包括:
[0028]若所述目标数量小于或者等于所述强拍的数量,则从所述强拍中选取所述目标数量个目标强拍作为所述视频剪辑点;
[0029]若所述目标数量大于所述强拍的数量,且所述目标数量小于或者等于预设数量总和,则从所述音符起始点中选取所述目标音符起始点,并将所述多个强拍及所述目标音符起始点作为所述视频剪辑点;所述预设数量总和为所述强拍的数量与所述音符起始点的数量之和;所述目标音符起始点的数量等于所述目标数量减去所述强拍的数量;
[0030]若所述目标数量大于所述预设数量总和,则从所述预设节拍中选取所述目标预设节拍,并将所述多个强拍、所述多个目标音符起始点及所述目标预设节拍作为所述视频剪辑点;所述目标预设节拍的数量等于所述目标数量减去所述预设数量总和。
[0031]在其中一个实施例中,所述方法还包括:
[0032]选取的所述目标音符起始点和所述强拍的时间间隔大于或者等于第一预设时间间隔;
[0033]或,选取的所述目标预设节拍和所述音符起始点的时间间隔大于或者等于第二预设时间间隔;且,选取的所述目标预设节拍和所述强拍的时间间隔大于或者等于第三预设时间间隔。
[0034]在其中一个实施例中,所述目标音频片段的音频参数包括强拍和预设节拍;所述方法还包括:
[0035]基于第一音频特征,将目标音频帧划分为第一强拍和待定节拍;
[0036]基于第二音频特征,将所述待定节拍划分为第二强拍和所述预设节拍;其中,第二音频特征是所述待定节拍和所述第一强拍的特征关系,所述第一强拍和所述第二强拍均为所述目标音频片段的强拍。
[0037]在其中一个实施例中,所述第一音频特征包括所述目标音频片段中各音频帧的音频振幅。
[0038]在其中一个实施例中,所述第二音频特征包括所述待定节拍与各所述第一强拍的时间间隔;
[0039]所述第二强拍与所述第一强拍的时间间隔小于或者等于预设时间间隔。
[0040]在其中一个实施例中,所述根据所述目标音频片段、所述视频剪辑点以及所述待处理视频,生成所述目标视频,包括:
[0041]根据所述视频剪辑点,将所述目标音频片段划分为多个音频数据片段;
[0042]针对所述多个音频数据片段,基于所述音频数据片段的时长,对所述音频数据片段对应的待处理视频进行数据处理,生成中间视频数据;
[0043]将各所述中间视频数据插入各所述中间视频数据对应的所述音频数据片段中,生成所述目标视频。
[0044]第三方面,本申请还提供了一种音乐处理装置。所述装置包括:
[0045]音频特征值获取模块,用于获取各音频帧的音频特征值;
[0046]目标音频片段获取模块,用于根据各所述音频帧的音频特征值获取目标音频片段。
[0047]第四方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面和第二方面中任一项实施例中的方法的步骤。
[0048]第五方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面和第二方面中任一项实施例中的方法的步骤。
[0049]第六方面,本申请还提供了一种计算机程序产品。所述计本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音乐处理方法,其特征在于,所述方法包括:获取各音频帧的音频特征值;根据各所述音频帧的音频特征值获取目标音频片段。2.如权利要求1所述的方法,其特征在于,所述根据各所述音频帧的音频特征值获取目标音频片段,包括:根据第一音频特征值,获取候选音频帧;根据所述候选音频帧的第二音频特征值,确定多个音频区间;根据多个所述音频区间的第三音频特征值,确定所述目标音频片段;其中,所述第三音频特征值为基于所述第一音频特征值获得的。3.如权利要求2所述的方法,其特征在于,所述根据所述候选音频帧的第二音频特征值,确定多个音频区间,包括:将时间间隔小于预设时间间隔阈值的相邻音频帧划入同一音频区间,以生成多个所述音频区间。4.如权利要求3所述的方法,其特征在于,所述预设时间间隔阈值与所述目标音频片段的目标时长成正比例关系。5.如权利要求2所述的方法,其特征在于,所述根据多个所述音频区间的第三音频特征值,确定所述目标音频片段,包括:根据多个所述音频区间的第三音频特征值,从多个所述音频区间中确定目标音频区间;获取所述目标音频区间的参考音频帧;根据所述目标音频片段的目标时长,获取所述参考音频帧前后预设时长的音频帧作为第二目标音频帧,基于所述第二目标音频帧形成所述目标音频片段。6.一种视频生成方法,其特征在于,所述方法包括:获取目标音频片段及多个待处理视频;其中,目标音频片段为如权利要求1

5任一项所述的目标音频片段;根据所述目标音频片段、所述目标音频片段的音频参数以及所述待处理视频,生成目标视频。7.如权利要求6所述的方法,其特征在于,所述方法还包括:获取音符起始点;所述根据所述目标音频片段、所述目标音频片段的音频参数以及所述待处理视频,生成目标视频,包括:根据所述待处理视频的数量,确定所述目标音频片段中的视频剪辑点的目标数量;根据所述目标音频片段的音频参数以及视频剪辑点的目标数量,从所述音频参数中确定所述目标音频片段中的视频剪辑点;其中,所述目标音频片段的音频参数包括强拍、预设节拍及所述音符起始点的数量;所述预设节拍为除了所述强拍之外的其他节拍;根据所述目标音频片段、所述视频剪辑点以及所述待处理视频,生成所述目标视频。8.如权利要求7所述的方法,其特征在于,所述根据所述目标音频片段的音频参数以及视频剪辑点的目标数量,从所述音频参数中确定所述目标音频片段中的视频剪辑点,包括:若所述目标数量小于或者等于所述强拍的数量,则从所述强拍中选取所述目标数量个目标强拍作为所述视频剪辑点;
若所述目标数量大于所述强拍的数量,且所述目标数量小于或者等于预设数量总和,则从所述音符起始点中...

【专利技术属性】
技术研发人员:符峥
申请(专利权)人:影石创新科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1