视频处理方法、装置以及电子设备制造方法及图纸

技术编号:37365428 阅读:11 留言:0更新日期:2023-04-27 07:12
本公开提供了一种视频处理方法、装置以及电子设备,涉及人工智能技术领域,尤其涉及计算机视觉、视频处理、深度学习等技术领域。具体实现方案为:获取待处理的原始视频片段,且从原始视频片段中提取出至少一帧原始视频帧;对原始视频帧进行信息检测,得到信息检测结果,其中,信息检测结果用于表征需要从原始视频片段中去除掉的目标对象的特征信息;基于信息检测结果,从原始视频片段中确定至少一帧待处理的原始视频帧,其中,待处理的原始视频帧为原始视频片段中包含了信息检测结果的视频帧;基于信息检测结果,分别对提取出的原始视频帧和待处理的原始视频帧进行信息去除,得到多帧目标视频帧;将多帧目标视频帧进行合并,生成目标视频片段。标视频片段。标视频片段。

【技术实现步骤摘要】
视频处理方法、装置以及电子设备


[0001]本公开涉及人工智能
,尤其涉及计算机视觉、视频处理、深度学习等


技术介绍

[0002]在相关技术中,主要通过图像处理软件(AdobePhotoshop,简称为PS)对视频中的对象进行处理,比如,对视频中的图标(Logo)和字幕进行处理,但是,该方法对操作人员的专业技术要求过高,且视频中的每一帧都需要操作人员手动处理,需要投入巨大的人力物力。

技术实现思路

[0003]本公开提供了一种视频处理方法、装置以及电子设备。
[0004]根据本公开的一方面,提供了一种视频处理方法,包括:获取待处理的原始视频片段,且从原始视频片段中提取出至少一帧原始视频帧;对原始视频帧进行信息检测,得到信息检测结果,其中,信息检测结果用于表征需要从原始视频片段中去除掉的目标对象的特征信息;基于信息检测结果,从原始视频片段中确定至少一帧待处理的原始视频帧,其中,待处理的原始视频帧为原始视频片段中包含了信息检测结果的视频帧;基于信息检测结果,分别对提取出的原始视频帧和待处理的原始视频帧进行信息去除,得到多帧目标视频帧,其中,目标视频帧为去除了目标对象的视频帧;将多帧目标视频帧进行合并,生成目标视频片段。
[0005]根据本公开的另一方面,提供了另一种视频处理方法,包括:在操作界面上显示待处理的原始视频片段,其中,原始视频片段包括需要提取出的至少一帧原始视频帧;响应作用于操作界面上的信息去除操作,在操作界面上显示目标视频片段,其中,目标视频片段为由多帧目标视频帧合并而生成,多帧目标视频帧为基于信息检测结果分别对提取出的至少一帧原始视频帧和至少一帧待处理的原始视频帧进行信息去除而得到,信息检测结果用于表征需要从原始视频片段中去除掉的目标对象的特征信息,至少一帧待处理的原始视频帧为基于信息检测结果从原始视频片段中确定,且待处理的原始视频帧为原始视频片段中包含了信息检测结果的视频帧;响应作用于操作界面上的视频编辑操作,在操作界面上显示对目标视频片段进行编辑的视频编辑结果。
[0006]根据本公开的一方面,提供了一种视频处理装置,包括:获取单元,用于获取待处理的原始视频片段,且从原始视频片段中提取出至少一帧原始视频帧;检测单元,用于对原始视频帧进行信息检测,得到信息检测结果,其中,信息检测结果用于表征需要从原始视频片段中去除掉的目标对象的特征信息;确定单元,用于基于信息检测结果,从原始视频片段中确定至少一帧待处理的原始视频帧,其中,待处理的原始视频帧为原始视频片段中包含了信息检测结果的视频帧;第一去除单元,用于基于信息检测结果,分别对提取出的原始视频帧和待处理的原始视频帧进行信息去除,得到多帧目标视频帧,其中,目标视频帧为去除
了目标对象的视频帧;合并单元,用于将多帧目标视频帧进行合并,生成目标视频片段。
[0007]根据本公开的一方面,提供了另一种视频处理装置,包括:第一显示单元,用于在操作界面上显示待处理的原始视频片段,其中,原始视频片段包括需要提取出的至少一帧原始视频帧;第二去除单元,用于响应作用于操作界面上的信息去除操作,在操作界面上显示目标视频片段,其中,目标视频片段为由多帧目标视频帧合并而生成,多帧目标视频帧为基于信息检测结果分别对提取出的至少一帧原始视频帧和至少一帧待处理的原始视频帧进行信息去除而得到,信息检测结果用于表征需要从原始视频片段中去除掉的目标对象的特征信息,至少一帧待处理的原始视频帧为基于信息检测结果从原始视频片段中确定,且待处理的原始视频帧为原始视频片段中包含了信息检测结果的视频帧;编辑单元,用于响应作用于操作界面上的视频编辑操作,在操作界面上显示对目标视频片段进行编辑的视频编辑结果。
[0008]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开实施例的视频处理方法。
[0009]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开实施例的视频处理方法。
[0010]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现本公开实施例的视频处理方法。
[0011]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0012]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0013]图1是根据本公开实施例的一种视频处理方法的流程图;
[0014]图2(a)是根据本公开实施例的另一种视频处理方法的流程图;
[0015]图2(b)是根据本公开实施例的一种用于执行视频处理方法的产品的操作界面的示意图;
[0016]图3是根据本公开实施例的一种智能去除视频中图标及字幕的方法的流程图;
[0017]图4是根据本公开实施例的一种视频处理装置的示意图;
[0018]图5是根据本公开实施例的另一种视频处理装置的示意图;
[0019]图6是用来实现本公开实施例的视频处理方法的电子设备的示意图。
具体实施方式
[0020]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0021]下面对本公开实施例的一种视频处理方法进行介绍。
[0022]图1是根据本公开实施例的一种视频处理方法的流程图,如图1所示,该方法可以
包括以下步骤:
[0023]步骤S102,获取待处理的原始视频片段,且从原始视频片段中提取出至少一帧原始视频帧。
[0024]本公开上述步骤S102提供的技术方案中,待处理的原始视频片段可以为需要去除图标和裁剪字幕的视频片段,例如,从视频网站或者短视频平台上下载的带有图标和字幕的视频,可以从上述待处理的原始视频片段中提取出至少一帧原始视频帧,通过提取出的原始视频帧的信息检测结果确定其他原始视频帧的信息检测结果,以达到节省检测资源,提高检测效率的目的。
[0025]可选地,从原始视频片段中所提取出的原始视频帧的帧数可以是经验数值,例如,3帧/秒,也即,从待处理的原始视频片段中每秒抽取3帧原始视频帧进行处理,需要说明的是,上述经验值选取3帧/秒是因为3帧原始视频帧的信息检测结果可以最大程度覆盖整个1秒视频片段的信息检测结果,在不同应用场景下,从原始视频片段中所提取出的原始视频帧的帧数也有区别,上述3帧/秒仅为举例说明,此处不做具体限定。
[0026]可选地,从原始视频片段中所提取出的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频处理方法,包括:获取待处理的原始视频片段,且从所述原始视频片段中提取出至少一帧原始视频帧;对所述原始视频帧进行信息检测,得到信息检测结果,其中,所述信息检测结果用于表征需要从所述原始视频片段中去除掉的目标对象的特征信息;基于所述信息检测结果,从所述原始视频片段中确定至少一帧待处理的原始视频帧,其中,所述待处理的原始视频帧为所述原始视频片段中包含了所述信息检测结果的视频帧;基于所述信息检测结果,分别对提取出的原始视频帧和所述待处理的原始视频帧进行信息去除,得到多帧目标视频帧,其中,所述目标视频帧为去除了所述目标对象的视频帧;将所述多帧目标视频帧进行合并,生成目标视频片段。2.根据权利要求1所述的方法,其中,基于所述信息检测结果,从所述原始视频片段中确定至少一帧待处理的原始视频帧包括:在所述原始视频片段中,将与提取出的原始视频帧具有关联关系的原始视频帧,确定为包括所述信息检测结果的所述待处理的原始视频帧。3.根据权利要求2所述的方法,其中,在所述原始视频片段中,将与提取出的原始视频帧具有关联关系的原始视频帧,确定为包括所述信息检测结果的所述待处理的原始视频帧包括:在所述原始视频片段的多帧原始视频帧中,将与提取出的原始视频帧之间的帧数小于帧数阈值的原始视频帧,确定为包括所述信息检测结果的所述待处理的原始视频帧。4.根据权利要求1所述的方法,其中,基于所述信息检测结果,分别对提取出的原始视频帧和所述待处理的原始视频帧进行信息去除,得到多个目标视频帧包括:响应于所述信息检测结果为目标图标的图标特征,分别对提取出的原始视频帧和所述待处理的原始视频帧进行图标抹除,得到所述目标视频帧,其中,所述目标视频帧为去除了所述目标图标的视频帧。5.根据权利要求1所述的方法,其中,基于所述信息检测结果,分别对提取出的原始视频帧和所述待处理的原始视频帧进行信息去除,得到多个目标视频帧包括:响应于所述信息检测结果为目标字幕的字幕特征,分别对提取出的原始视频帧和所述待处理的原始视频帧的字幕区域进行裁剪,得到所述目标视频帧,其中,所述目标视频帧为去除了所述目标字幕的视频帧。6.根据权利要求1所述的方法,其中,基于所述信息检测结果,分别对提取出的原始视频帧和所述待处理的原始视频帧进行信息去除,得到多个目标视频帧包括:响应于所述信息检测结果为目标图标的图标特征和目标字幕的字幕特征,分别对提取出的原始视频帧和所述待处理的原始视频帧进行图标抹除,得到多帧中间目标视频帧,其中,所述中间目标视频帧为去除了所述目标图标的视频帧;对所述中间目标视频帧中所述目标字幕的字幕区域进行裁剪,得到所述目标视频帧,其中,所述目标视频帧为去除了所述目标图标和所述目标字幕的视频帧。7.根据权利要求1所述的方法,其中,所述信息检测结果包括所述目标对象在所述原始视频片段的视频画面上的显示区域,基于所述信息检测结果,分别对提取出的原始视频帧和所述待处理的原始视频帧进行信息去除,得到多帧目标视频帧,包括:
检测到所述显示区域未显示目标内容,基于所述信息检测结果,分别对提取出的原始视频帧和所述待处理的原始视频帧进行信息去除,得到多帧目标视频帧。8.根据权利要求1所述的方法,其中,所述原始视频片段的视频时长包括多个时间周期,从所述原始视频片段中提取出至少一帧原始视频帧包括:从所述原始视频片段中每个所述时间周期内的多个原始视频帧中,提取出所述至少一帧原始视频帧。9.根据权利要求1所述的方法,其中,对所述原始视频帧进行信息检测,得到信息检测结果包括:在提取出的原始视频帧的视频画面中确定至少一目标区域;对所述目标区域进行信息检测,得到所述信息检测结果。10.根据权利要求9所述的方法,其中,所述目标对象包括目标图标和/或目标字幕,在提取出的原始视频帧的视频画面中确定至少一目标区域包括:在提取出的原始视频帧的视频画面中,确定与所述目标图标关联的角落区域或与所述目标字幕关联的边缘区域。11.根据权利要求1至10中任意一项所述的方法,其中,对所述原始视频帧进行信息检测,得到信息检测结果包括:将提取出的原始视频帧输入至信息检测模型中进行信息检测,得到所述信息检测结果,其中,所述信息检测模型为基于视频帧样本和所述视频帧样本中标注的目标对象的特征信息样本,对初始检测模型进行训练得到。12.根据权利要求1至10中任意一项所述的方法,其中,提取出的多帧原始视频帧中每相邻两个所述原始视频帧之间间隔目标帧数。13.一种视频处理方法,包括:在操作界面上显示待处理...

【专利技术属性】
技术研发人员:刘芳龙
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1