【技术实现步骤摘要】
一种基于双边注意力机制的复杂背景下目标检测方法
[0001]本专利技术涉及一种基于双边注意力机制的复杂背景下的目标检测方法,适用于计算机视觉中复杂背景下的目标检测
技术介绍
[0002]图像和视频是人类获取信息的重要来源,因此利用计算机针对海量图像和视频进行分析处理的应用也得到了大力发展。目标检测作为计算机视觉领域的基本任务之一,是帮助计算机理解图像数据的重要手段,在行人检测、车辆检测、自动驾驶、安防系统和医疗等领域都有着广泛的应用前景。
[0003]得益于深度学习技术的发展,目标检测在最近几年吸引了广泛的注意力,并取得了巨大的成功,一大批高效的检测算法被提出。现有的基于卷积神经网络(Convolution Neural Networks,CNN)的目标检测算法主要分为两大类:单阶段检测算法和两阶段检测算法。单阶段检测算法的代表性算法有YOLO和SSD,两阶段算法的代表性算法有Faster R
‑
CNN和Cascade R
‑
CNN。当前的通用目标检测已经取得了长足的发展 ...
【技术保护点】
【技术特征摘要】
1.一种基于双边注意力机制的复杂背景下的目标检测方法,其特征在于,该方法包括如下步骤:步骤S1:根据公开的复杂背景下的目标检测数据集,构建训练集、验证集和测试集;步骤S2:构建基于双边注意力机制的Bi
‑
SINet网络模型,利用所构建的训练集对Bi
‑
SINet网络模型进行监督训练,直到模型收敛到最优性能;步骤S3:将收敛的Bi
‑
SINet网络模型在所构建的测试集上进行测试,根据检测结果评估模型性能。2.根据权利要求1所述一种基于双边注意力机制的复杂背景下的目标检测方法,其特征在于,所述步骤S1中目标检测数据集包含数据集COD10K、数据集CAMO和数据集CHAMELEON。3.根据权利要求1所述一种基于双边注意力机制的复杂背景下的目标检测方法,其特征在于,所述步骤S2具体包括:步骤S201:对训练数据进行预处理,首先利用双线性插值法将原始图像大小调整为384
×
384,并调整对应的真实标签,随后进行图像数据增强处理,最后将图像进行归一化处理后输入Bi
‑
SINet网络模型进行训练;步骤S202:Bi
‑
SINet网络模型对输入图像进行特征提取,随后将提取到的多层特征输入渐进式的检测框架中进行检测;渐进式的检测框架会基于每层特征进行前景目标分割,共输出N个不同尺度的检测结果,用来表示,k=0,1,...,N
‑
1;步骤S203:在训练阶段,采用交叉熵损失函数和交并比损失函数对模型输出的N个检测结果进行监督训练,总体损失函数可以用L
overall
来表示,其计算公式为:其中,表示第k层检测结果与真实标签之间的结构加权后的交叉熵损失,则表示第k层检测结果与真实标签之间的结构加权后的交并比损失,它们的计算表达式分别为:示第k层检测结果与真实标签之间的结构加权后的交并比损失,它们的计算表达式分别为:其中,H表示图像高度,W表示图像宽度,和mask
GT
(x,y)分别表示第k层预测结果和真实标签中位置坐标为(x,y)的值,γ是和结构权重相关的参数,w(x,y)表示坐标为(x,y)的位置对应的结构权重,其表达式如下:
其中,A
xy
表示坐标为(x,y)的像素周围像素的集合;步骤S204:在训...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。