基于深度学习模型的视频处理方法、装置、设备以及存储介质制造方法及图纸

技术编号:31826944 阅读:10 留言:0更新日期:2022-01-12 12:56
本发明专利技术公开了一种基于深度学习模型的视频处理方法,包括:获取目标视频;基于动态目标检测模型对目标视频进行动态目标检测,得到目标视频中的动态目标区域、非动态目标区域和动态目标区域对应的深度信息;根据动态目标区域和非动态目标区域确定出目标视频的图像插入区域;根据动态目标区域对应的深度信息确定出目标视频的图像插入区域对应的目标深度信息;将广告图像插入至目标视频的图像插入区域中目标深度信息对应的位置,以完成对目标视频的处理。可见,本发明专利技术能够实现基于目标视频中的动态目标和动态目标在目标视频中的深度信息,将广告图像插入至目标视频中合适的位置,从而能够提高视频处理方法的处理效果。本发明专利技术可以应用在数字医疗系统。应用在数字医疗系统。应用在数字医疗系统。

【技术实现步骤摘要】
基于深度学习模型的视频处理方法、装置、设备以及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种基于深度学习模型的视频处理方法、装置、计算机设备以及存储介质。

技术介绍

[0002]目前,大众对各视频网站的会员机制的接受度在不断地提升,导致传统的在视频前插入的贴片广告的推广效应也在不断地降低,为此,一种在视频的视频内容中植入广告的新型广告形式(如,视频中两个人坐在一起聊天,则可以在两个人前面放置的桌子上植入XX品牌饮料的广告)正在逐渐兴起。这种新型广告形式在对将要插入的广告进行处理时的一个实现关键点在于,如何在视频中确定出合适的能够植入广告的位置。目前主流的位置推荐算法主要考虑视频中的物体在二维空间上的位置,但是,视频中的物体实际上往往是处于一个三维空间上的,这容易导致最终确定出的广告在视频中插入的位置并不理想,影响视频处理的效果。如,在视频中,两个物体在二维空间上距离很近,但是在三维空间上处于不同的深度时,若只从二维空间上进行考虑,则通常不会在这两个物体之间插入广告,但是,若从三维空间上进行考虑时,由于这两个物体虽然在二维空间上距离较近,但是在三维空间上处于不同的深度,一个物体的存在通常并不会影响用户对另一个物体的注意,所以仍然有可能在这两个物体之间寻找到合适的位置插入广告。可见,目前的视频处理方法的处理效果仍有进一步提升的空间。

技术实现思路

[0003]本专利技术所要解决的技术问题在于,目前的视频处理方法的处理效果较差。
[0004]为了解决上述技术问题,本专利技术第一方面公开了一种基于深度学习模型的视频处理方法,所述方法包括:
[0005]获取待处理的目标视频;
[0006]基于预设的动态目标检测模型对所述目标视频进行动态目标检测,得到所述目标视频中的动态目标区域、非动态目标区域和所述动态目标区域对应的深度信息;
[0007]根据所述动态目标区域和所述非动态目标区域确定出所述目标视频的图像插入区域;
[0008]根据所述动态目标区域对应的深度信息确定出所述目标视频的图像插入区域对应的目标深度信息;
[0009]将预先确定出的广告图像插入至所述目标视频的图像插入区域中所述目标深度信息对应的位置,以完成对所述目标视频的处理。
[0010]本专利技术第二方面公开了一种基于深度学习模型的视频处理装置,所述装置包括:
[0011]获取模块,用于获取待处理的目标视频;
[0012]检测模块,用于基于预设的动态目标检测模型对所述目标视频进行动态目标检测,得到所述目标视频中的动态目标区域、非动态目标区域和所述动态目标区域对应的深
度信息;
[0013]确定模块,用于根据所述动态目标区域和所述非动态目标区域确定出所述目标视频的图像插入区域;
[0014]所述确定模块,还用于根据所述动态目标区域对应的深度信息确定出所述目标视频的图像插入区域对应的目标深度信息;
[0015]插入模块,用于将预先确定出的广告图像插入至所述目标视频的图像插入区域中所述目标深度信息对应的位置,以完成对所述目标视频的处理。
[0016]本专利技术第三方面公开了一种计算机设备,所述计算机设备包括:
[0017]存储有可执行程序代码的存储器;
[0018]与所述存储器连接的处理器;
[0019]所述处理器调用所述存储器中存储的所述可执行程序代码,执行本专利技术第一方面公开的基于深度学习模型的视频处理方法中的部分或全部步骤。
[0020]本专利技术第四方面公开了一种计算机存储介质,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行本专利技术第一方面公开的基于深度学习模型的视频处理方法中的部分或全部步骤。
[0021]本专利技术实施例中,先对目标视频进行动态目标检测,得到目标视频中的动态目标区域、非动态目标区域和动态目标区域对应的深度信息,然后根据动态目标区域和非动态目标区域确定出图像插入区域,根据动态目标区域对应的深度信息确定出图像插入区域对应的目标深度信息,最后将广告图像插入至目标视频的图像插入区域中目标深度信息对应的位置,以完成对目标视频的处理,从而能够实现基于目标视频中的动态目标和动态目标在目标视频中的深度信息,将广告图像插入至目标视频中合适的位置,从而能够提高视频处理方法的处理效果。
附图说明
[0022]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0023]图1是本专利技术实施例公开的一种基于深度学习模型的视频处理方法的流程示意图;
[0024]图2是本专利技术实施例公开的一种基于深度学习模型的视频处理装置的结构示意图;
[0025]图3是本专利技术实施例公开的一种计算机设备的结构示意图;
[0026]图4是本专利技术实施例公开的一种计算机存储介质的结构示意图。
具体实施方式
[0027]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员
在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0028]本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或端没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或端固有的其他步骤或单元。
[0029]在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本专利技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0030]本专利技术公开了一种基于深度学习模型的视频处理方法、装置、计算机设备以及存储介质,先对目标视频进行动态目标检测,得到目标视频中的动态目标区域、非动态目标区域和动态目标区域对应的深度信息,然后根据动态目标区域和非动态目标区域确定出图像插入区域,根据动态目标区域对应的深度信息确定出图像插入区域对应的目标深度信息,最后将广告图像插入至目标视频的图像插入区域中目标深度信息对应的位置,以完成对目标视频的处理,从而能够实现基于目标视频中的动态目标和动态目标在目标视频中的深度信息,将广告图像插入至目标视频中合适的位置,从而能够提高视频处理方法的处理效果。以下分别进行详细说明。
[0031]实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习模型的视频处理方法,其特征在于,所述方法包括:获取待处理的目标视频;基于预设的动态目标检测模型对所述目标视频进行动态目标检测,得到所述目标视频中的动态目标区域、非动态目标区域和所述动态目标区域对应的深度信息;根据所述动态目标区域和所述非动态目标区域确定出所述目标视频的图像插入区域;根据所述动态目标区域对应的深度信息确定出所述目标视频的图像插入区域对应的目标深度信息;将预先确定出的广告图像插入至所述目标视频的图像插入区域中所述目标深度信息对应的位置,以完成对所述目标视频的处理。2.根据权利要求1所述的基于深度学习模型的视频处理方法,其特征在于,所述获取待处理的目标视频之后,所述基于预设的动态目标检测模型对所述目标视频进行动态目标检测,得到所述目标视频中的动态目标区域、非动态目标区域和所述动态目标区域对应的深度信息之前,所述方法还包括:基于预设的实体检测模型对所述目标视频进行目标实体检测,得到所述目标视频的每一个视频帧中的目标实体区域;根据所述目标视频的每一个视频帧中的目标实体区域的数量对所述目标视频执行预设的视频帧筛选操作,以实现对所述目标视频中的视频帧的筛选,并触发执行所述的基于预设的动态目标检测模型对所述目标视频进行动态目标检测,得到所述目标视频中的动态目标区域、非动态目标区域和所述动态目标区域对应的深度信息的操作。3.根据权利要求2所述的基于深度学习模型的视频处理方法,其特征在于,所述根据所述目标视频的每一个视频帧中的目标实体区域的数量对所述目标视频执行预设的视频帧筛选操作,包括:判断所述目标视频的每一个视频帧中的目标实体区域的数量与前一个视频帧中的目标实体区域的数量的差值是否大于预设的差值阈值;当判断出该视频帧中的目标实体区域的数量与前一个视频帧中的目标实体区域的数量的差值大于所述差值阈值时,将该视频帧分类为紧凑视频帧,其中,所述紧凑视频帧是指无广告图像插入的视频帧;当判断出该视频帧中的目标实体区域的数量与前一个视频帧中的目标实体区域的数量的差值未大于所述差值阈值时,将该视频帧分类为空闲视频帧,其中,所述空闲视频帧是指将要被插入所述广告图像的视频帧。4.根据权利要求3所述的基于深度学习模型的视频处理方法,其特征在于,所述基于预设的动态目标检测模型对所述目标视频进行动态目标检测,得到所述目标视频中的动态目标区域、非动态目标区域和所述动态目标区域对应的深度信息,包括:基于预设的动态目标检测模型对所述目标视频中的每个空闲视频帧进行动态目标检测,得到该空闲视频帧中的动态目标区域、非动态目标区域和所述动态目标区域对应的深度信息;以及,所述根据所述动态目标区域和所述非动态目标区域确定出所述目标视频的图像插入区域,包括:根据每个空闲视频帧的动态目标区域和非动态目标区域确定出该空闲视频帧的图像
插入区域;以及,所述根据所述动态目标区域对应的深度信息确定出所述目标视频的图像插入区域对应的目标深度信息,包括:根据每个空闲视频帧的动态目标区域对应的深度信息确定出该空闲视频帧的图像插入区域对应的目标深度信息;以及,所述将预先确定出的广告图像插入至所述目标视频的图像插入区域中所述目标深度信息对应的位置,以完成对所述目标视频的处理,包括:将预先确定出的广告图...

【专利技术属性】
技术研发人员:张旭龙王健宗
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1