基于深度学习模型的视频处理方法、装置、设备以及存储介质制造方法及图纸

技术编号：31826944 阅读：10 留言：0更新日期：2022-01-12 12:56

本发明专利技术公开了一种基于深度学习模型的视频处理方法，包括：获取目标视频；基于动态目标检测模型对目标视频进行动态目标检测，得到目标视频中的动态目标区域、非动态目标区域和动态目标区域对应的深度信息；根据动态目标区域和非动态目标区域确定出目标视频的图像插入区域；根据动态目标区域对应的深度信息确定出目标视频的图像插入区域对应的目标深度信息；将广告图像插入至目标视频的图像插入区域中目标深度信息对应的位置，以完成对目标视频的处理。可见，本发明专利技术能够实现基于目标视频中的动态目标和动态目标在目标视频中的深度信息，将广告图像插入至目标视频中合适的位置，从而能够提高视频处理方法的处理效果。本发明专利技术可以应用在数字医疗系统。应用在数字医疗系统。应用在数字医疗系统。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习模型的视频处理方法、装置、设备以及存储介质

[0001]本专利技术涉及人工智能
，尤其涉及一种基于深度学习模型的视频处理方法、装置、计算机设备以及存储介质。

技术介绍

[0002]目前，大众对各视频网站的会员机制的接受度在不断地提升，导致传统的在视频前插入的贴片广告的推广效应也在不断地降低，为此，一种在视频的视频内容中植入广告的新型广告形式(如，视频中两个人坐在一起聊天，则可以在两个人前面放置的桌子上植入XX品牌饮料的广告)正在逐渐兴起。这种新型广告形式在对将要插入的广告进行处理时的一个实现关键点在于，如何在视频中确定出合适的能够植入广告的位置。目前主流的位置推荐算法主要考虑视频中的物体在二维空间上的位置，但是，视频中的物体实际上往往是处于一个三维空间上的，这容易导致最终确定出的广告在视频中插入的位置并不理想，影响视频处理的效果。如，在视频中，两个物体在二维空间上距离很近，但是在三维空间上处于不同的深度时，若只从二维空间上进行考虑，则通常不会在这两个物体之间插入广告，但是，若从三维空间上进行考虑时，由于这两个物体虽然在二维空间上距离较近，但是在三维空间上处于不同的深度，一个物体的存在通常并不会影响用户对另一个物体的注意，所以仍然有可能在这两个物体之间寻找到合适的位置插入广告。可见，目前的视频处理方法的处理效果仍有进一步提升的空间。

技术实现思路

[0003]本专利技术所要解决的技术问题在于，目前的视频处理方法的处理效果较差。
[0004]为了解决上述技术问题，本专利技术第一方...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习模型的视频处理方法，其特征在于，所述方法包括：获取待处理的目标视频；基于预设的动态目标检测模型对所述目标视频进行动态目标检测，得到所述目标视频中的动态目标区域、非动态目标区域和所述动态目标区域对应的深度信息；根据所述动态目标区域和所述非动态目标区域确定出所述目标视频的图像插入区域；根据所述动态目标区域对应的深度信息确定出所述目标视频的图像插入区域对应的目标深度信息；将预先确定出的广告图像插入至所述目标视频的图像插入区域中所述目标深度信息对应的位置，以完成对所述目标视频的处理。2.根据权利要求1所述的基于深度学习模型的视频处理方法，其特征在于，所述获取待处理的目标视频之后，所述基于预设的动态目标检测模型对所述目标视频进行动态目标检测，得到所述目标视频中的动态目标区域、非动态目标区域和所述动态目标区域对应的深度信息之前，所述方法还包括：基于预设的实体检测模型对所述目标视频进行目标实体检测，得到所述目标视频的每一个视频帧中的目标实体区域；根据所述目标视频的每一个视频帧中的目标实体区域的数量对所述目标视频执行预设的视频帧筛选操作，以实现对所述目标视频中的视频帧的筛选，并触发执行所述的基于预设的动态目标检测模型对所述目标视频进行动态目标检测，得到所述目标视频中的动态目标区域、非动态目标区域和所述动态目标区域对应的深度信息的操作。3.根据权利要求2所述的基于深度学习模型的视频处理方法，其特征在于，所述根据所述目标视频的每一个视频帧中的目标实体区域的数量对所述目标视频执行预设的视频帧筛选操作，包括：判断所述目标视频的每一个视频帧中的目标实体区域的数量与前一个视频帧中的目标实体区域的数量的差值是否大于预设的差值阈值；当判断出该视频帧中的目标实体区域的数量与前一个视频帧中的目标实体区域的数量的差值大于所述差值阈值时，将该视频帧分类为紧凑视频帧，其中，所述紧凑视频帧是指无广告图像插入的视频帧；当判断出该视频帧中的目标实体区域的数量与前一个视频帧中的目标实体区域的数量的差值未大于所述差值阈值时，将该视频帧分类为空闲视频帧，其中，所述空闲视频帧是指将要被插入所述广告图像的视频帧。4.根据权利要求3所述的基于深度学习模型的视频处理方法，其特征在于，所述基于预设的动态目标检测模型对所述目标视频进行动态目标检测，得到所述目标视频中的动态目标区域、非动态目标区域和所述动态目标区域对应的深度信息，包括：基于预设的动态目标检测模型对所述目标视频中的每个空闲视频帧进行动态目标检测，得到该空闲视频帧中的动态目标区域、非动态目标区域和所述动态目标区域对应的深度信息；以及，所述根据所述动态目标区域和所述非动态目标区域确定出所述目标视频的图像插入区域，包括：根据每个空闲视频帧的动态目标区域和非动态目标区域确定出该空闲视频帧的图像
插入区域；以及，所述根据所述动态目标区域对应的深度信息确定出所述目标视频的图像插入区域对应的目标深度信息，包括：根据每个空闲视频帧的动态目标区域对应的深度信息确定出该空闲视频帧的图像插入区域对应的目标深度信息；以及，所述将预先确定出的广告图像插入至所述目标视频的图像插入区域中所述目标深度信息对应的位置，以完成对所述目标视频的处理，包括：将预先确定出的广告图...

【专利技术属性】
技术研发人员：张旭龙，王健宗，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人