System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 视频目标替换方法及相关装置、设备和存储介质制造方法及图纸_技高网

视频目标替换方法及相关装置、设备和存储介质制造方法及图纸

技术编号:40580519 阅读:6 留言:0更新日期:2024-03-06 17:23
本申请公开了一种视频目标替换方法及相关装置、设备和存储介质,其中,视频目标替换方法包括:基于原始视频中原始帧的原始特征和原始视频中待替换对象的第一特征进行加噪,得到原始帧在各个采样步数的带噪特征,基于原始帧的原始特征和关键帧的原始特征,得到原始帧相对关键帧的注意力位置;基于原始帧的注意力位置,以及关键帧其带噪特征遮蔽待替换对象后的遮蔽特征和目标对象的第二特征所得到的注意力特征,得到原始帧的第一噪声;基于原始帧的带噪特征遮蔽待替换对象后的遮蔽特征和第一噪声进行去噪并解码,得到原始帧中待替换对象被替换为目标对象之后的目标帧。上述方案,能够提升视频目标替换效率,并降低计算量,提升长时间的视频连续性。

【技术实现步骤摘要】

本申请涉及视频处理,特别是涉及一种视频目标替换方法及相关装置、设备和存储介质


技术介绍

1、视频目标替换是将原始视频中待替换对象替换为目标对象的数据处理任务。此外,视频目标替换通常需要满足一些基本要求,如尽量保证仅对待替换对象进行替换,而不对原始视频中其他无关物体、背景等要素产生过多影响。

2、现有技术中,视频目标替换根据其实现方式通常分为传统复制粘贴方案和深度生成方案。对于前者来说,容易受限于人工经验,而导致效率低下;而对于后者,由于需要对整段原始视频中各个原始帧分别执行帧间注意力,计算量通常极其庞大,难以保证长时间的视频连续性。有鉴于此,如何提升视频目标替换效率,并降低计算量,提升长时间的视频连续性,成为亟待解决的问题。


技术实现思路

1、本申请主要解决的技术问题是提供一种视频目标替换方法及相关装置、设备和存储介质,能够提升视频目标替换效率,并降低计算量,提升长时间的视频连续性。

2、为了解决上述技术问题,本申请第一方面提供了一种视频目标替换方法,包括:基于原始视频中原始帧的原始特征和原始视频中待替换对象的第一特征进行加噪,得到原始帧在各个采样步数的带噪特征,并划分原始视频为若干子片段,及在子片段中选择原始帧作为关键帧;基于原始帧的原始特征和关键帧的原始特征,得到原始帧相对关键帧的注意力位置;基于原始帧相对关键帧的注意力位置,以及关键帧由其带噪特征遮蔽待替换对象后的遮蔽特征和目标对象的第二特征所得到的注意力特征,得到原始帧在各个采样步数的第一噪声;基于原始帧的带噪特征遮蔽待替换对象后的遮蔽特征和在各个采样步数的第一噪声进行去噪并解码,得到原始帧中待替换对象被替换为目标对象之后的目标帧。

3、为了解决上述技术问题,本申请第二方面提供了一种视频目标替换装置,包括:特征加噪模块、视频处理模块、位置确定模块、噪声拟合模块和去噪解码模块,特征加噪模块,用于基于原始视频中原始帧的原始特征和原始视频中待替换对象的第一特征进行加噪,得到原始帧在各个采样步数的带噪特征;视频处理模块,用于划分原始视频为若干子片段,及在子片段中选择原始帧作为关键帧;位置确定模块,用于基于原始帧的原始特征和关键帧的原始特征,得到原始帧相对关键帧的注意力位置;噪声拟合模块,用于基于原始帧相对关键帧的注意力位置,以及关键帧由其带噪特征遮蔽待替换对象后的遮蔽特征和目标对象的第二特征所得到的注意力特征,得到原始帧在各个采样步数的第一噪声;去噪解码模块,用于基于原始帧的带噪特征遮蔽待替换对象后的遮蔽特征和在各个采样步数的第一噪声进行去噪并解码,得到原始帧中待替换对象被替换为目标对象之后的目标帧。

4、为了解决上述技术问题,本申请第三方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的视频目标替换方法。

5、为了解决上述技术问题,本申请第四方面提供了一种计算机可读存储介质,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面的视频目标替换方法。

6、上述方案,基于原始视频中原始帧的原始特征和原始视频中待替换对象的第一特征进行加噪,得到原始帧在各个采样步数的带噪特征,并划分原始视频为若干子片段,及在子片段中选择原始帧作为关键帧,再基于原始帧的原始特征和关键帧的原始特征,得到原始帧相对关键帧的注意力特征,从而基于原始帧相对关键帧的注意力位置,以及关键帧由其带噪特征遮蔽待替换对象后的遮蔽特征和目标对象的第二特征所得到的注意力特征,得到原始帧在各个采样步数的第一噪声,进而基于原始帧的带噪特征遮蔽待替换对象后的遮蔽特征和在各个采样步数的第一噪声进行去噪并解码,得到原始帧中待替换对象被替换为目标对象之后的目标帧,一方面无需依赖于人工经验,通过加噪、噪声拟合、去噪、解码等一系列操作实现视频目标替换,有助于提升视频目标替换效率,另一方面由于在视频目标替换过程中,通过划分原始视频为若干子片段,并在各个子片段选择出关键帧,从而仅计算关键帧的注意力特征以及各个原始帧相对关键帧的注意力位置,进而结合两者拟合各个原始帧的第一噪声,而无需对各个原始帧分别执行帧间注意力,有助于大大降低视频目标替换的计算量,提升长时间的视频连续性。故此,能够提升视频目标替换效率,并降低计算量,提升长时间的视频连续性。

本文档来自技高网...

【技术保护点】

1.一种视频目标替换方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述原始帧的原始特征和所述关键帧的原始特征,得到所述原始帧相对所述关键帧的注意力位置,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于原始视频中原始帧的原始特征和所述原始视频中待替换对象的第一特征进行加噪,得到所述原始帧在各个采样步数的带噪特征,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于所述原始帧相对所述关键帧的注意力位置,以及所述关键帧由其带噪特征遮蔽所述待替换对象后的遮蔽特征和目标对象的第二特征所得到的注意力特征,得到所述原始帧在各个所述采样步数的第一噪声,包括:

5.根据权利要求4所述的方法,其特征在于,所述基于所述关键帧在目标步数的带噪特征遮蔽所述待替换对象后的遮蔽特征和目标对象的第二特征,得到所述关键帧在各个所述采样步数的注意力特征,包括:

6.根据权利要求5所述的方法,其特征在于,在所述基于所述关键帧在所述第二步数的带噪特征遮蔽所述待替换对象后的遮蔽特征、所述目标对象的第二特征和所述第二步数的去噪方差,对所述关键帧在所述第二步数的遮蔽特征进行去噪,得到所述第三步数的带噪特征之前,所述方法还包括:

7.根据权利要求5所述的方法,其特征在于,所述基于注意力机制处理所述关键帧和所述关键帧的参考帧在所述第三步数的带噪特征,得到所述关键帧在所述第三步数的注意力特征,包括:

8.根据权利要求4所述的方法,其特征在于,所述原始帧相对所述关键帧的注意力位置包括:所述原始帧相对第一关键帧的第一注意力位置和所述原始帧相对第二关键帧的第二注意力位置,所述第一关键帧为所述原始帧所在所述子片段的前一所述子片段中所述关键帧,所述第二关键帧为所述原始帧所在所述子片段的后一所述子片段中所述关键帧;

9.根据权利要求8所述的方法,其特征在于,所述基于所述第一关键帧在所述原始视频中的第一索引、所述第二关键帧在所述原始视频中的第二索引和所述原始帧在所述原始视频中的第三索引,得到所述第一关键帧的第一权重和所述第二关键帧的第二权重,包括:

10.根据权利要求1所述的方法,其特征在于,所述方法还包括:

11.根据权利要求1所述的方法,其特征在于,所述遮蔽特征的获取步骤包括:

12.根据权利要求1所述的方法,其特征在于,其特征在于,所述视频目标替换过程中的各种噪声均由噪声预测网络拟合得到,且所述噪声预测网络基于包含所述目标对象的第一样本图像和所述目标对象所属目标类别的第二样本图像训练得到。

13.根据权利要求12所述的方法,其特征在于,所述噪声预测网络的训练步骤包括:

14.根据权利要求13所述的方法,其特征在于,所述基于所述第一样本图像的第一图像特征和所述目标对象的第一样本特征,得到所述第一样本图像在各个所述采样步数的第一预测噪声之前,所述方法还包括:

15.根据权利要求13所述的方法,其特征在于,所述基于所述第一样本图像的第一样本噪声与所述第一预测噪声之间的差异,以及所述第二样本图像的第二样本噪声与第二预测噪声之间的差异,调整所述噪声预测网络的网络参数之后,以及在利用所述噪声预测网络在视频目标替换过程中拟合各种噪声之前,所述方法还包括:

16.根据权利要求1所述的方法,其特征在于,所述基于所述原始帧的带噪特征遮蔽所述待替换对象后的遮蔽特征和在各个所述采样步数的第一噪声进行去噪并解码,得到所述原始帧中所述待替换对象被替换为所述目标对象之后的目标帧,包括:

17.根据权利要求1至16任一项所述的方法,其特征在于,所述视频目标替换过程中的各种噪声均由噪声预测网络拟合得到,且所述噪声预测网络设有与注意力机制对应的注意力网络层;

18.一种视频目标替换装置,其特征在于,包括:

19.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,所述存储器中存储有程序指令,所述处理器用于执行所述程序指令以实现权利要求1至17任一项所述的视频目标替换方法。

20.一种计算机可读存储介质,其特征在于,存储有能够被处理器运行的程序指令,所述程序指令用于实现权利要求1至17任一项所述的视频目标替换方法。

...

【技术特征摘要】

1.一种视频目标替换方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述原始帧的原始特征和所述关键帧的原始特征,得到所述原始帧相对所述关键帧的注意力位置,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于原始视频中原始帧的原始特征和所述原始视频中待替换对象的第一特征进行加噪,得到所述原始帧在各个采样步数的带噪特征,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于所述原始帧相对所述关键帧的注意力位置,以及所述关键帧由其带噪特征遮蔽所述待替换对象后的遮蔽特征和目标对象的第二特征所得到的注意力特征,得到所述原始帧在各个所述采样步数的第一噪声,包括:

5.根据权利要求4所述的方法,其特征在于,所述基于所述关键帧在目标步数的带噪特征遮蔽所述待替换对象后的遮蔽特征和目标对象的第二特征,得到所述关键帧在各个所述采样步数的注意力特征,包括:

6.根据权利要求5所述的方法,其特征在于,在所述基于所述关键帧在所述第二步数的带噪特征遮蔽所述待替换对象后的遮蔽特征、所述目标对象的第二特征和所述第二步数的去噪方差,对所述关键帧在所述第二步数的遮蔽特征进行去噪,得到所述第三步数的带噪特征之前,所述方法还包括:

7.根据权利要求5所述的方法,其特征在于,所述基于注意力机制处理所述关键帧和所述关键帧的参考帧在所述第三步数的带噪特征,得到所述关键帧在所述第三步数的注意力特征,包括:

8.根据权利要求4所述的方法,其特征在于,所述原始帧相对所述关键帧的注意力位置包括:所述原始帧相对第一关键帧的第一注意力位置和所述原始帧相对第二关键帧的第二注意力位置,所述第一关键帧为所述原始帧所在所述子片段的前一所述子片段中所述关键帧,所述第二关键帧为所述原始帧所在所述子片段的后一所述子片段中所述关键帧;

9.根据权利要求8所述的方法,其特征在于,所述基于所述第一关键帧在所述原始视频中的第一索引、所述第二关键帧在所述原始视频中的第二索引和所述原始帧在所述原始视频中的第三索引,得到所述第一关键帧的第一权重和所述第二...

【专利技术属性】
技术研发人员:陈刚王建社方四安陶晓天
申请(专利权)人:合肥讯飞数码科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1