视频编辑方法和电子设备技术

技术编号:35111674 阅读:19 留言:0更新日期:2022-10-01 17:26
本申请涉及视频处理领域,提供了一种视频编辑方法和电子设备,该视频编辑方法应用于电子设备,包括:显示第一界面,第一界面中包括视频图标,视频图标指示的视频为电子设备中存储的视频;检测到对视频图标中N个视频图标的第一操作;响应于第一操作,获取N个视频的信息,N为大于1的整数;基于N个视频的信息,得到N个视频的视频主题;基于N个视频中的图像与视频主题的相似度,选取N个视频中的M个视频片段;基于视频主题,得到与视频主题相匹配的音乐;基于M个视频片段与音乐,得到第一视频;显示第一视频。基于本申请的方案,能够避免编辑后的视频中存在与N个视频的整体视频主题无关的图像内容的问题,提升编辑后视频的视频质量。提升编辑后视频的视频质量。提升编辑后视频的视频质量。

【技术实现步骤摘要】
视频编辑方法和电子设备


[0001]本申请涉及视频领域,具体地,涉及一种视频编辑方法和电子设备。

技术介绍

[0002]随着电子设备中短视频技术的发展,用户对视频编辑功能的需求越来越高。视频混剪是指将多个视频进行分割选取其中目标片段,然后对视频片段重组并添加背景音乐生成新视频的视频编辑技术。
[0003]目前,用户可以通过现有的应用程序对多个视频进行自动编辑,实现视频混剪;但是,现有的应用程序对多个视频进行编辑时的专业性较差,导致处理后的视频中会存在问题;例如,编辑后的视频中可能会存在与多个视频的整体视频主题无关的图像内容。
[0004]因此,如何提高电子设备中自动编辑视频的专业性,提升编辑后视频的视频质量成为一个亟需解决的问题。

技术实现思路

[0005]本申请提供了一种视频编辑方法和电子设备,能够避免编辑后的视频中存在与N个视频的整体视频主题无关的图像内容的问题,提升编辑后视频的视频质量。
[0006]第一方面,提供了一种视频编辑方法,应用于电子设备,包括:显示第一界面,第一界面中包括视频图标,视频图标指示的视频为电子设备中存储的视频;检测到对视频图标中N个视频图标的第一操作;响应于第一操作,获取N个视频的信息,N为大于1的整数;基于N个视频的信息,得到N个视频的视频主题;基于N个视频中的图像与视频主题的相似度,选取N个视频中的M个视频片段;基于视频主题,得到与视频主题相匹配的音乐;基于M个视频片段与音乐,得到第一视频;显示第一视频。
[0007]在本申请的实施例中,可以基于N个视频中的图像与视频主题的相似度,从N个视频中选取M个视频片段;基于M个视频片段与音乐得到处理后视频,即第一视频;在本申请的方案中,基于N个视频中包括的图像与视频主题之间的相似度,能够确定N个视频中与视频主题相关度较高的M视频片段;基于本申请的方案,能够有效删除N个视频中与整体视频主题信息无关的视频片段,确保筛选出的视频片段与视频主题相关,提升编辑后的第一视频的视频质量。
[0008]结合第一方面,在第一方面的某些实现方式中,基于N个视频中的图像与视频主题的相似度,选取N个视频中的M个视频片段,包括:将N个视频与视频主题输入至预先训练的相似度匹配模型,得到N个视频中的图像与视频主题的相似度置信值,其中,预先训练的相似度匹配模型中包括图像编码器、文本编
码器与第一相似度度量模块,图像编码器用于对N个视频进行提取图像特征处理,文本编码器用于视频主题进行提取文本特征处理,第一相似度度量模块用于度量N个视频中的图像特征与视频主题的文本特征之间的相似度,相似度置信值用于表示N个视频中的图像与视频主题相似的概率;基于N个视频中的图像与视频主题的相似度置信值,选取N个视频中的M个视频片段。
[0009]在本申请的实施例中,可以通过预先训练的相似度匹配模型识别视频中的图像特征与视频主题的文本特征之间的相似度;预先训练的相似度匹配模型可以为多模态的模型,同时支持图像和文本两种不同类型的输入数据;通过预先训练的相似度匹配模型可以将文本特征和图像特征映射到统一空间中,从而提升视觉和文本的理解能力;在本申请的方案中,基于预先训练的相似度匹配模型能够智能化的识别视频中的图像特征与视频主题的文本特征之间的相似度。
[0010]结合第一方面,在第一方面的某些实现方式中,基于M个视频片段与音乐,得到第一视频,包括:对M个视频片段进行排序,得到排序后的M个视频片段;将排序后的M个视频片段与音乐合成为第一视频。
[0011]在本申请的实施例中,能够使得M个视频片段中的图像内容与音乐中的音乐节奏更加吻合;例如,视频图像内容为风景,则可以对应于音乐的前奏或者舒缓的音乐部分;视频图像内容为用户的运动场景,则可以对应于背景音乐中的高潮部分;通过对M个视频片段进行排序,使得M个视频片段与音乐的节奏卡点更加匹配;从而解决第一视频的视频中存在的视频片段与背景音乐不匹配的问题,即能够解决第一视频的视频内容与音乐的节奏卡点不完全匹配的问题;提高第一视频的视频质量。
[0012]结合第一方面,在第一方面的某些实现方式中,对M个视频片段进行排序,得到排序后的M个视频片段,包括:基于音乐的节奏对M个视频片段排序,得到排序后的M个视频片段。
[0013]在本申请的方案中,可以基于N个视频的整体视频主题信息可以选取背景音乐;并且可以基于背景音乐的节奏对M个视频进行排序,实现按照背景音乐的节奏对M个视频片段进行视频排序,使得视频片段的画面内容与音乐节奏相符合;与视频直接按照输入顺序与音乐匹配相比,本申请的方案能够提高视频中图像内容与背景音乐节奏的一致性,提升编辑后视频的视频质量。
[0014]结合第一方面,在第一方面的某些实现方式中,对M个视频片段进行排序,得到排序后的M个视频片段,包括:基于M个视频片段中的视频内容对M个视频片段进行排序,得到排序后的M个视频片段。
[0015]在本申请的方案中,对于强故事线的N个视频,可以基于N个视频的文本描述信息对N个视频进行排序,得到排序后的N个视频;从排序后的N个视频中选取与视频主题信息相关度较高的M个视频片段,得到排序后的M个视频片段;基于排序后的M个视频片段与视频主题信息,确定与排序后的M个视频片段相匹配的音乐作为背景音乐;使得强故事线的N个视频的画面内容与音乐节奏相匹配的情况下,且视频的画面内容播放顺序符合因果联系,提
升编辑后视频的视频质量。
[0016]应理解,强故事线的视频可以是指N个视频之间具有因果联系,基于视频编辑方法后能够识别N个视频之间的前因后果并基于前因后果的顺序对N个视频排序;例如,强故事线的视频可以包括旅行主题的视频或者出行主题的视频。
[0017]结合第一方面,在第一方面的某些实现方式中,基于音乐的节奏对M个视频片段排序,得到排序后的M个视频片段,包括:将音乐与M个视频片段输入至预先训练的影音节奏匹配模型,得到排序后的M个视频片段,预先训练的影音节奏匹配模型中包括音频编码器、视频编码器与第一相似度度量模块,音频编码器用于对音乐进行特征提取得到音频特征,视频解码器用于对M个视频片段进行特征提取得到视频特征,第一相似度度量模块用于度量音频特征与M个视频片段的相似性。
[0018]在本申请的实施例中,可以通过预先训练的影音节奏匹配模型识别M个视频片段的视频特征与音乐的音频特征之间的相似度;预先训练的影音节奏匹配模型可以为多模态的模型,同时支持视频和音频两种不同类型的输入数据;通过预先训练的影音节奏匹配模型可以将视频特征和音频特征映射到统一空间中,从而提升视觉和音频的理解能力;在本申请的方案中,基于预先训练的影音节奏匹配模型能够智能化的识别M个视频片段的视频特征与音乐的音频特征之间的相似度。
[0019]结合第一方面,在第一方面的某些实现方式中,基于N个视频的信息,得到N个视频的视频主题,包括:将N个视频的视频内容转换为N个文本描述信息,N个文本描述信息与N个视频一一对应,N个文本描述信息中的一个文本描述信息用于描述N本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频编辑方法,其特征在于,应用于电子设备,包括:显示第一界面,所述第一界面中包括视频图标,所述视频图标指示的视频为所述电子设备中存储的视频;检测到对所述视频图标中N个视频图标的第一操作;响应于所述第一操作,获取N个视频的信息,N为大于1的整数;基于所述N个视频的信息,得到所述N个视频的视频主题;基于所述N个视频中的图像与所述视频主题的相似度,选取所述N个视频中的M个视频片段;基于所述视频主题,得到与所述视频主题相匹配的音乐;基于所述M个视频片段与所述音乐,得到第一视频;显示所述第一视频。2.如权利要求1所述的视频编辑方法,其特征在于,所述基于所述N个视频中的图像与所述视频主题的相似度,选取所述N个视频中的M个视频片段,包括:将所述N个视频与所述视频主题输入至预先训练的相似度匹配模型,得到所述N个视频中的图像与所述视频主题的相似度置信值,其中,所述预先训练的相似度匹配模型中包括图像编码器、文本编码器与第一相似度度量模块,所述图像编码器用于对所述N个视频进行提取图像特征处理,所述文本编码器用于所述视频主题进行提取文本特征处理,所述第一相似度度量模块用于度量所述N个视频中的图像特征与所述视频主题的文本特征之间的相似度,所述相似度置信值用于表示所述N个视频中的图像与所述视频主题相似的概率;基于所述N个视频中的图像与所述视频主题的相似度置信值,选取所述N个视频中的M个视频片段。3.如权利要求1或2所述视频编辑方法,其特征在于,所述基于所述M个视频片段与所述音乐,得到第一视频,包括:对所述M个视频片段进行排序,得到排序后的M个视频片段;将所述排序后的M个视频片段与所述音乐合成为所述第一视频。4.如权利要求3所述的视频编辑方法,其特征在于,所述对所述M个视频片段进行排序,得到排序后的M个视频片段,包括:基于所述音乐的节奏对所述M个视频片段排序,得到所述排序后的M个视频片段。5.如权利要求3所述的视频编辑方法,其特征在于,所述对所述M个视频片段进行排序,得到排序后的M个视频片段,包括:基于所述M个视频片段中的视频内容对所述M个视频片段进行排序,得到所述排序后的M个视频片段。6.如权利要求4所述的视频编辑方法,其特征在于,所述基于所述音乐的节奏对所述M个视频片段排序,得到所述排序后的M个视频片段,包括:将所述音乐与所述M个视频片段输入至预先训练的影音节奏匹配模型,得到所述排序后的M个视频片段,所述预先训练的影音节奏匹配模型中包括音频编码器、视频编码器与第一相似度度量模块,所述音频编码器用于对所述音乐进行特征提取得到音频特征,所述视频解码器用于对所述M个视频片段进行特征提取得到视频特征,所述第一相似度度量模块用于度量所述音频特征与所述M个视频片段的相似性。
7.如权利要求1、2、4至6中任一项所述的视频编辑方法,其特征在于,所述基于所述N个视频的信息,得到所述N个视频的视频主题,包括:将N个视频的视频内容转换为N个文本描述信息,所述N个文本描述信息与所述N个视频一一对应,所述N个文本描述信息中的一个文本描述信息用于描述所述N个视频中一个视频的图像内容信息;基于所述N个文本描述信息,得到所述N个视频的主题信息,所述文本描述信息用于将所述N个视频中的视频内容转换为文本信息。8.如权利要求7所述的视频编辑方法,其特...

【专利技术属性】
技术研发人员:王龙
申请(专利权)人:荣耀终端有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1