System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及图像处理,尤其涉及一种视频生成方法、装置、电子设备及存储介质。
技术介绍
1、相关技术中,视频生成技术主要依赖于大量的手动编辑和高昂的计算成本。特别是在获得特定对象和特定动作的视频时,往往需要进行重复拍摄、精细的调整或大量的计算,这在很大程度上限制了生成特定对象执行特定动作的视频的效率。
2、可见,如何提高生成特定对象执行特定动作的视频的效率,是一个值得关注的技术问题。
技术实现思路
1、鉴于此,为解决上述部分或全部技术问题,本申请实施例提供一种视频生成方法、装置、电子设备及存储介质。
2、第一方面,本申请实施例提供一种视频生成方法,所述方法包括:
3、获取内容描述信息和目标对象图像,其中,所述内容描述信息用于描述待生成的目标视频中对象执行的目标动作;
4、从预先确定的视频集合中,确定与所述内容描述信息相匹配的视频,将所确定的视频作为初始视频;
5、基于所述初始视频和所述目标对象图像,生成目标视频,其中,所述目标视频表示所述目标对象图像表示的对象执行所述目标动作。
6、在一个可能的实施方式中,所述视频集合中的每个视频关联有动作标签;以及
7、所述从预先确定的视频集合中,确定与所述内容描述信息相匹配的视频,包括:
8、从预先确定的视频集合中的各个视频分别关联的动作标签中,确定与所述内容描述信息相匹配的动作标签,将所确定的动作标签作为目标标签;
9、将所述视频集合中所述
10、在一个可能的实施方式中,所述从预先确定的视频集合中的各个视频分别关联的动作标签中,确定与所述内容描述信息相匹配的动作标签,包括:
11、针对预先确定的视频集合中的每个视频关联的动作标签,确定该视频关联的动作标签对应的相似度;其中,该视频关联的动作标签对应的相似度为:该视频关联的动作标签与所述内容描述信息之间的相似度;
12、将所确定的相似度中数值最大的相似度作为目标相似度,将所述目标相似度对应的动作标签,确定为与所述内容描述信息相匹配的动作标签。
13、在一个可能的实施方式中,所述视频集合中的每个视频关联的动作标签采用如下方式生成:
14、将该视频输入至预先训练的标签确定模型,得到该视频关联的动作标签;
15、其中,所述标签确定模型用于确定视频关联的动作标签,所述标签确定模型采用深度学习算法训练得到。
16、在一个可能的实施方式中,所述基于所述初始视频和所述目标对象图像,生成目标视频,包括:
17、对所述目标对象图像进行人脸检测,得到所述目标对象图像的第一人脸位置;
18、对所述初始视频中的视频帧进行人脸检测,得到所述初始视频中的视频帧的第二人脸位置;
19、基于所述第一人脸位置和所述第二人脸位置,采用所述目标对象图像中的人脸替换所述初始视频中的视频帧中的人脸,生成目标视频。
20、在一个可能的实施方式中,所述内容描述信息为自然语言;以及
21、所述从预先确定的视频集合中,确定与所述内容描述信息相匹配的视频,将所确定的视频作为初始视频,包括:
22、对所述内容描述信息进行分词,以及将分词结果作为词汇组;
23、从预先确定的视频集合中,确定与所述词汇组中的各个词汇分别相匹配的视频,将所确定的各个视频作为初始视频集合;以及
24、所述基于所述初始视频和所述目标对象图像,生成目标视频,包括:
25、基于所述初始视频集合和所述目标对象图像,生成目标视频。
26、在一个可能的实施方式中,所述基于所述初始视频和所述目标对象图像,生成目标视频,包括:
27、基于所述初始视频,确定所述目标动作的动作特征;
28、基于所述动作特征和所述目标对象图像,生成目标视频。
29、第二方面,本申请实施例提供一种视频生成装置,所述装置包括:
30、获取单元,用于获取内容描述信息和目标对象图像,其中,所述内容描述信息用于描述待生成的目标视频中对象执行的目标动作;
31、确定单元,用于从预先确定的视频集合中,确定与所述内容描述信息相匹配的视频,将所确定的视频作为初始视频;
32、生成单元,用于基于所述初始视频和所述目标对象图像,生成目标视频,其中,所述目标视频表示所述目标对象图像表示的对象执行所述目标动作。
33、在一个可能的实施方式中,所述视频集合中的每个视频关联有动作标签;以及
34、所述从预先确定的视频集合中,确定与所述内容描述信息相匹配的视频,包括:
35、从预先确定的视频集合中的各个视频分别关联的动作标签中,确定与所述内容描述信息相匹配的动作标签,将所确定的动作标签作为目标标签;
36、将所述视频集合中所述目标标签关联的视频,确定为与所述内容描述信息相匹配的视频。
37、在一个可能的实施方式中,所述从预先确定的视频集合中的各个视频分别关联的动作标签中,确定与所述内容描述信息相匹配的动作标签,包括:
38、针对预先确定的视频集合中的每个视频关联的动作标签,确定该视频关联的动作标签对应的相似度;其中,该视频关联的动作标签对应的相似度为:该视频关联的动作标签与所述内容描述信息之间的相似度;
39、将所确定的相似度中数值最大的相似度作为目标相似度,将所述目标相似度对应的动作标签,确定为与所述内容描述信息相匹配的动作标签。
40、在一个可能的实施方式中,所述视频集合中的每个视频关联的动作标签采用如下方式生成:
41、将该视频输入至预先训练的标签确定模型,得到该视频关联的动作标签;
42、其中,所述标签确定模型用于确定视频关联的动作标签,所述标签确定模型采用深度学习算法训练得到。
43、在一个可能的实施方式中,所述基于所述初始视频和所述目标对象图像,生成目标视频,包括:
44、对所述目标对象图像进行人脸检测,得到所述目标对象图像的第一人脸位置;
45、对所述初始视频中的视频帧进行人脸检测,得到所述初始视频中的视频帧的第二人脸位置;
46、基于所述第一人脸位置和所述第二人脸位置,采用所述目标对象图像中的人脸替换所述初始视频中的视频帧中的人脸,生成目标视频。
47、在一个可能的实施方式中,所述内容描述信息为自然语言;以及
48、所述从预先确定的视频集合中,确定与所述内容描述信息相匹配的视频,将所确定的视频作为初始视频,包括:
49、对所述内容描述信息进行分词,以及将分词结果作为词汇组;
50、从预先确定的视频集合中,确定与所述词汇组中的各个词汇分别相匹配的视频,将所确定的各个视频作为初始视频集合;以及
51、所述本文档来自技高网...
【技术保护点】
1.一种视频生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述视频集合中的每个视频关联有动作标签;以及
3.根据权利要求2所述的方法,其特征在于,所述从预先确定的视频集合中的各个视频分别关联的动作标签中,确定与所述内容描述信息相匹配的动作标签,包括:
4.根据权利要求2所述的方法,其特征在于,所述视频集合中的每个视频关联的动作标签采用如下方式生成:
5.根据权利要求1-4之一所述的方法,其特征在于,所述基于所述初始视频和所述目标对象图像,生成目标视频,包括:
6.根据权利要求1-4之一所述的方法,其特征在于,所述内容描述信息为自然语言;以及
7.根据权利要求1-4之一所述的方法,其特征在于,所述基于所述初始视频和所述目标对象图像,生成目标视频,包括:
8.一种视频生成装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现上述权
...【技术特征摘要】
1.一种视频生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述视频集合中的每个视频关联有动作标签;以及
3.根据权利要求2所述的方法,其特征在于,所述从预先确定的视频集合中的各个视频分别关联的动作标签中,确定与所述内容描述信息相匹配的动作标签,包括:
4.根据权利要求2所述的方法,其特征在于,所述视频集合中的每个视频关联的动作标签采用如下方式生成:
5.根据权利要求1-4之一所述的方法,其特征在于,所述基于所述初始视频和所述目标对...
【专利技术属性】
技术研发人员:宁本德,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。