视频合成方法、装置、终端及存储介质制造方法及图纸

技术编号:20431459 阅读:40 留言:0更新日期:2019-02-23 11:03
本公开是关于一种视频合成方法、装置、终端及存储介质,属于视频处理领域。所述方法包括:获取至少一个视频片段;根据所述至少一个视频片段的视频内容和片段数量,获取与所述视频内容适配的目标音频,所述目标音频的音频变化点的数量大于或等于所述片段数量减一,所述音频变化点是指音频中音频特征变化符合预设条件的时间点;根据所述目标音频中所包括的音频变化点,将所述至少一个视频片段与所述目标音频合成得到视频文件。本公开提供的这种将至少一个视频片段合成配有目标音频的视频合成方式,能够提高视频合成效率。

Video synthesis methods, devices, terminals and storage media

The present disclosure relates to a video synthesis method, device, terminal and storage medium, and belongs to the field of video processing. The method includes: acquiring at least one video clip; acquiring the target audio adapted to the video content according to the video content and the number of clips of the at least one video clip, the number of audio change points of the target audio is greater than or equal to the number of the clips reduced by one, and the audio change point refers to the time point when the audio feature changes in the audio meet the preset conditions; According to the audio change points included in the target audio, at least one video clip and the target audio are synthesized to obtain a video file. The video synthesis method provided in the present disclosure, which synthesizes at least one video clip with target audio, can improve the video synthesis efficiency.

【技术实现步骤摘要】
视频合成方法、装置、终端及存储介质
本公开涉及视频处理领域,尤其涉及一种视频合成方法、装置、终端及存储介质。
技术介绍
随着互联网的发展,越来越多的用户喜欢在网络上发布视频,这些视频大多经过视频合成得到,如这些视频可以包含多个视频片段,且配有相应的背景音乐。相关技术将多个视频片段合成配有背景音乐的视频,一般需要经过如下过程:用户在终端上选择多个视频片段,通过观看该多个视频片段的内容,选择一段与该内容适配的音乐作为背景音乐,然后利用终端上的视频合成应用,将该多个视频片段与背景音乐合成一个视频。上述技术在视频合成过程中,用户往往需要尝试播放多首音乐,才能从中找出与多个视频片段的内容适配的背景音乐,因此,亟需一种视频合成方法,在将多个视频片段合成配有背景音乐的视频时,提高视频合成效率。
技术实现思路
本公开提供一种视频合成方法、装置、终端及存储介质,可以在将多个视频片段合成配有背景音乐的视频时,提高视频合成效率。根据本公开实施例的第一方面,提供一种视频合成方法,包括:获取至少一个视频片段;根据所述至少一个视频片段的视频内容和片段数量,获取与所述视频内容适配的目标音频,所述目标音频的音频变化点的数量大于或等于所述片段数量减一,所述音频变化点是指音频中音频特征变化符合预设条件的时间点;根据所述目标音频中所包括的音频变化点,将所述至少一个视频片段与所述目标音频合成得到视频文件。在一种可能实现方式中,所述根据所述至少一个视频片段的视频内容和片段数量,获取与所述视频内容适配的目标音频,包括:对所述至少一个视频片段中的各个视频片段进行识别,确定所述各个视频片段的视频内容;根据所述各个视频片段的视频内容,确定所述各个视频片段的视频内容分别对应的风格;当所述各个视频片段的视频内容对应于同一种风格时,获取风格为所述同一种风格,且音频变化点的数量大于或等于所述片段数量减一的音频作为所述目标音频。在一种可能实现方式中,所述获取风格为所述同一种风格,且音频变化点的数量大于或等于所述片段数量减一的音频作为所述目标音频,包括:获取风格为所述同一种风格,且音频变化点的数量大于或等于所述片段数量减一的一个音频作为所述目标音频;或,获取风格为所述同一种风格,且音频变化点的总数量大于或等于所述片段数量减一的多个音频作为所述目标音频。在一种可能实现方式中,所述根据所述各个视频片段的视频内容,确定所述各个视频片段的视频内容分别对应的风格之后,所述方法还包括:当所述各个视频片段的视频内容对应于多种风格时,获取风格与目标视频片段的视频内容对应,且音频变化点的数量大于或等于所述片段数量减一的音频作为所述目标音频,所述目标视频片段为所述至少一个视频片段中的一个视频片段。在一种可能实现方式中,所述获取风格与目标视频片段的视频内容对应,且音频变化点的数量大于或等于所述片段数量减一的音频作为所述目标音频,包括:获取风格与目标视频片段的视频内容对应,且音频变化点的数量大于或等于所述片段数量减一的一个音频作为所述目标音频;或,获取风格与目标视频片段的视频内容对应,且音频变化点的总数量大于或等于所述片段数量减一的多个音频作为所述目标音频。在一种可能实现方式中,所述目标视频片段的确定过程包括:将所述至少一个视频片段中时长最大的视频片段作为所述目标视频片段;或,将所述至少一个视频片段中权值最大的视频片段作为所述目标视频片段,所述权值用于表示视频片段的重要程度。在一种可能实现方式中,所述根据所述各个视频片段的视频内容,确定所述各个视频片段的视频内容分别对应的风格之后,所述方法还包括:当所述各个视频片段的视频内容对应于多种风格时,确定多个视频片段集合,每个视频片段集合中的视频片段的视频内容对应于所述多种风格中的一种风格;对于所述多个视频片段集合中的每个视频片段集合,获取风格为所述视频片段集合中视频片段的视频内容对应的风格,且音频变化点的数量大于或等于所述视频片段集合中视频片段的数量减一的音频;将获取到的多个音频作为所述目标音频。在一种可能实现方式中,所述对所述至少一个视频片段中的各个视频片段进行识别,确定所述各个视频片段的视频内容,包括:对于每个视频片段,对所述视频片段进行识别,将识别得到的所述视频片段中的目标物和环境信息中至少一项作为所述视频片段的视频内容。在一种可能实现方式中,所述对所述视频片段进行识别包括:使用视频识别模型,将所述视频片段输入所述视频识别模型,输出所述视频片段中的目标物和环境信息中至少一项,所述视频识别模型用于根据输入的视频片段输出目标物和环境信息中至少一项。在一种可能实现方式中,所述视频识别模型的获取过程包括:获取多个样本视频片段以及每个样本视频片段的标注信息,所述标注信息包括目标物和环境信息中至少一项;基于所述多个样本视频片段以及对应的标注信息,对神经网络模型进行训练,得到所述视频识别模型。在一种可能实现方式中,所述根据所述各个视频片段的视频内容,确定所述各个视频片段的视频内容分别对应的风格,包括:对于每个视频片段,根据所述视频片段的视频内容以及视频内容与风格之间的对应规则,确定所述视频片段的视频内容对应的风格。在一种可能实现方式中,当所述目标音频为一个音频时,所述目标音频的音频变化点为所述一个音频所包括的音频变化点;当所述目标音频为多个音频时,所述目标音频的音频变化点包括所述多个音频中每个音频所包括的音频变化点;对于任一个音频,所述目标音频的音频变化点的获取过程包括:根据所述目标音频的振幅信息,确定所述目标音频的音频变化点,所述音频变化点的振幅与目标时间点的振幅之间的差值大于振幅阈值,所述目标时间点为所述目标音频中与所述音频变化点之间的时间间隔小于时间阈值的时间点;或,使用音频识别模型,将所述目标音频输入所述音频识别模型,输出所述目标音频的音频变化点,所述音频识别模型用于根据输入的音频输出音频变化点。在一种可能实现方式中,所述音频识别模型的获取过程包括:获取多个样本音频以及每个样本音频中标记的音频变化点;基于所述多个样本音频以及对应的音频变化点,对神经网络模型进行训练,得到所述音频识别模型。在一种可能实现方式中,所述根据所述目标音频中所包括的音频变化点,将所述至少一个视频片段与所述目标音频合成得到视频文件,包括:根据所述目标音频的音频变化点和所述至少一个视频片段的播放顺序,确定各个视频片段分别对应的相邻音频变化点;对于每个视频片段,根据所述视频片段对应的相邻音频变化点,将所述视频片段与所述视频片段对应的音频片段标记相同的时间戳,执行合成视频文件的步骤,所述音频片段为所述目标音频中与所述视频片段对应的相邻音频变化点之间的音频片段,所述时间戳包括起始时间戳和结束时间戳。在一种可能实现方式中,所述根据所述目标音频的音频变化点和所述至少一个视频片段的播放顺序,确定各个视频片段分别对应的相邻音频变化点,包括:当所述目标音频为一个音频时,根据所述一个音频的音频变化点的位置顺序和所述至少一个视频片段的播放顺序,确定各个视频片段分别对应的相邻音频变化点;当所述目标音频为多个音频时,根据所述多个音频的播放顺序、所述多个音频中每个音频的音频变化点的位置顺序和所述至少一个视频片段的播放顺序,确定各个视频片段分别对应的相邻音频变化点。在一种可能实现方式中,所述本文档来自技高网...

【技术保护点】
1.一种视频合成方法,其特征在于,包括:获取至少一个视频片段;根据所述至少一个视频片段的视频内容和片段数量,获取与所述视频内容适配的目标音频,所述目标音频的音频变化点的数量大于或等于所述片段数量减一,所述音频变化点是指音频中音频特征变化符合预设条件的时间点;根据所述目标音频中所包括的音频变化点,将所述至少一个视频片段与所述目标音频合成得到视频文件。

【技术特征摘要】
1.一种视频合成方法,其特征在于,包括:获取至少一个视频片段;根据所述至少一个视频片段的视频内容和片段数量,获取与所述视频内容适配的目标音频,所述目标音频的音频变化点的数量大于或等于所述片段数量减一,所述音频变化点是指音频中音频特征变化符合预设条件的时间点;根据所述目标音频中所包括的音频变化点,将所述至少一个视频片段与所述目标音频合成得到视频文件。2.根据权利要求1所述的视频合成方法,其特征在于,所述根据所述至少一个视频片段的视频内容和片段数量,获取与所述视频内容适配的目标音频,包括:对所述至少一个视频片段中的各个视频片段进行识别,确定所述各个视频片段的视频内容;根据所述各个视频片段的视频内容,确定所述各个视频片段的视频内容分别对应的风格;当所述各个视频片段的视频内容对应于同一种风格时,获取风格为所述同一种风格,且音频变化点的数量大于或等于所述片段数量减一的音频作为所述目标音频。3.根据权利要求2所述的视频合成方法,其特征在于,所述获取风格为所述同一种风格,且音频变化点的数量大于或等于所述片段数量减一的音频作为所述目标音频,包括:获取风格为所述同一种风格,且音频变化点的数量大于或等于所述片段数量减一的一个音频作为所述目标音频;或,获取风格为所述同一种风格,且音频变化点的总数量大于或等于所述片段数量减一的多个音频作为所述目标音频。4.根据权利要求2所述的视频合成方法,其特征在于,所述根据所述各个视频片段的视频内容,确定所述各个视频片段的视频内容分别对应的风格之后,所述方法还包括:当所述各个视频片段的视频内容对应于多种风格时,获取风格与目标视频片段的视频内容对应,且音频变化点的数量大于或等于所述片段数量减一的音频作为所述目标音频,所述目标视频片段为所述至少一个视频片段中的一个视频片段。5.根据权利要求2所述的视频合成方法,其特征在于,所述根据所述各个视频片段的视频内容,确定所述各个视频片段的视频内容分别对应的风格之后,所述方法还包括:当所述各个视频片段的视频内容对应于多种风格时,确定多个视频片段集合,每个视频片段集合中的视频片段的视频内容对应于所述多种风格中的一种风格;对于所述多个视频片段集合中的每个视频片段集合,获取风格为所述视频片段集合中视频片段的视频内容对应的风格,且音频变化点的数量大于或等于所述视频片段集合中视频片段的数量减一的音频;将获取到的多个音频作为所述目标音频。6.根据权利要求1所述的视频合成方法,其特征在于,当所述目标音频为一个音频时,所述目标音频的音频变化点为所述一个音频所包括的音频变化点;当所述目标音频为多个音频时,所述目标音频的音频变化点包括所...

【专利技术属性】
技术研发人员:郭劭泽
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1