一种基于深度学习的视频显著目标检测方法及系统技术方案

技术编号：38853251 阅读：22 留言：0更新日期：2023-09-17 10:00

本发明专利技术提供一种基于深度学习的视频显著目标检测方法及系统，包括：特征提取网络、注意力机制模型、边缘先验模型、空间空洞金字塔池化模型和解码器；通过预训练好的特征提取网络初始化外观分支网络和运动分支网络；通过注意力机制将从光流图中提取的运动信息强调外观特征的重要位置或元素进行时空融合指导显著目标检测任务；通过低级特征融合产生的边缘特征对任务进行指导，弥补边缘缺失；所述解码器将低级特征与高级特征进行融合，再通过注意力机制模型进行指导，恢复特征图的大小，预测具有物体准确边界的高分辨率显著图。本发明专利技术解决了现有视频处理中难以快速准确定位显著目标的问题。的问题。的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的视频显著目标检测方法及系统

[0001]本专利技术涉及视频处理
，尤其涉及一种基于深度学习的视频显著目标检测方法及系统。

技术介绍

[0002]近年来，随着人工智能技术的快速发展以及相关应用的广泛普及，作为人工智能重要应用领域之一的计算机视觉技术迈进了新的发展阶段，其各个方向均不断取得新的突破。简单来说，计算机视觉就是利用摄像机和电脑等相关设备来模拟人类的视觉系统，建立与视觉机制相关的计算方法，试图从图像、视频或者更高维的数据中获取重要的信息，其最终目标就是使机器能够自动处理和理解视觉形式的信号，并具备部分自主适应能力，在复杂场景中能够代替人类去完成指定的视觉场景任务。如今，图像与视频数据日益增加，并且数量庞大、内容复杂，如何高效地从海量视频数据中挖掘出人类可以理解并且需要的信息，已成为计算机视觉领域的一大难题。各在类视觉任务中，基于人类视觉注意力机制的显著性检测可以有效地精炼这些图像与视频数据，因此这一领域越来越受到研究者的关注，并且成为一个研究热点。
[0003]如今显著目标检测技术已日渐成熟，广泛应用于图像/视频压缩、视频分割、显著目标检测等各个方面。在显著目标检测中，一般是输入一张图像或者视频，输出相应的显著图或序列，并且显著目标检测可以被认为是一个二分类问题，我们需要识别出图像或视频中的显著目标，根据分类形成边界，从而刻画出完整的目标，目标的轮廓更加完整以及细化说明该检测技术更好。与此同时，显著目标检测又可分为图像显著目标检测和视频显著目标检测，前者作为后者的基础研究，已经取...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的视频显著目标检测方法，其特征在于，包括：特征提取网络、注意力机制模型、边缘先验模型、空间空洞金字塔池化模型和解码器；通过预训练好的特征提取网络初始化外观分支网络和运动分支网络；通过注意力机制将从光流图中提取的运动信息强调外观特征的重要位置或元素进行时空融合指导显著目标检测任务；通过低级特征融合产生的边缘特征对任务进行指导，弥补边缘缺失；所述解码器将低级特征与高级特征进行融合，再通过注意力机制模型进行指导，恢复特征图的大小，预测具有物体准确边界的高分辨率显著图。2.根据权利要求1所述的基于深度学习的视频显著目标检测方法，其特征在于，所述注意力机制模型包括：空间注意力机制、通道注意力机制和混合注意力机制；通过光流图产生的运动信息对外观特征进行指导，利用所述混合注意力机制进行引导。3.根据权利要求2所述的基于深度学习的视频显著目标检测方法，其特征在于，所述注意力机制模型需要对空间注意力和通道注意力进行合理分配，根据分配情况分为空间
‑
通道注意力模块和通道
‑
空间注意力模块；将运动特征对外观特征进行空间注意力，从运动特征预测出运动显著图，将运动显著图与外观特征逐位相乘；空间注意力后的外观特征再经过全局平均池化得到一个一维向量，再经过预测出的权重通过Softmax函数进行标准化，在最大程度上进行通道注意力的分配；引入残差项以减少错误信息，生成新的外观特征。4.根据权利要求1所述的基于深度学习的视频显著目标检测方法，其特征在于，所述边缘先验模型是通过第一层级和第二层级的低级信息进行融合形成的；通过所述边缘先验模型相互加权抑制噪声，将两个...

【专利技术属性】
技术研发人员：周祖煜，刘雅萱，张澎彬，林波，陈煜人，杨肖，
申请(专利权)人：杭州领见数字农业科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人