【技术实现步骤摘要】
一种结合特征点和锚框共同预测和回归的目标检测算法
[0001]本专利技术属于计算机视觉
,具体为一种结合特征点和锚框共同预测和回归的目标检测算法。
技术介绍
[0002]目标检测旨在对一张给定的输入图像,定位图像上包含的目标并对其进行分类。由于其在城市安防、遥感图像、医学诊断等领域有着广泛的应用,目前已经成为计算机视觉领域中的一个热门研究课题,随着最近几年深度学习在计算机视觉领域的快速发展,基于深度学习的目标检测算法得到了广泛的研究和应用。
[0003]目前常见的基于深度学习的目标检测算法框架可以分为:特征提取模块,特征融合模块和特征检测模块。特征提取模块利用卷积神经网络提取图像的不同层级的特征;特征融合模块对不同层级的特征进行融合,因为通常深层特征包含较为丰富的语义信息,浅层特征包含较为丰富的空间信息;特征检测模块对融合后的特征进行检测任务,以得到图像包含的目标信息。
[0004]现有的目标检测算法根据特征检测模块的不同分为两类,一类是基于特征点检测的算法,一类是基于锚框检测的算法。但是基于锚框检测的 ...
【技术保护点】
【技术特征摘要】
1.一种结合特征点和锚框共同预测和回归的目标检测算法,其特征在于,具体步骤如下:步骤1.获取并处理数据集,具体过程为:(1.1)使用目标检测数据集MSCOCO,构建对应的图像信息标签,组成图像
‑
目标标签样本对;(1.2)利用图像增强对输入图片进行预处理,以扩充数据集和增加样本的随机性;步骤2.根据算法搭建目标检测神经网络,分为特征提取模块、特征融合模块、关键点预测分支和锚框预测分支四个部分;其中:特征提取模块用于提取图像上的目标特征,由多个残差模块构成,根据网络的大小需求更改残差模块的数量;特征融合模块分两次进行融合,第一次对深层特征进行递归上采样与浅层特征融合,第二次对第一次融合后的浅层特征进行递归下采样与深层特征融合;关键点检测分支利用第一次特征融合后的特征进行关键点检测,预测输出锚框并对其进行前景背景分类;锚框检测分支利用关键点检测分支输出的锚框进行检测,以得到最终的检测结果;步骤3. 训练检测神经网络,利用步骤1得到的训练集和步骤2搭建好的网络来训练模型,通过梯度反向传播算法更新参数,直至网络收敛;步骤4.测试阶段,把待检测图像输入训练好的网络,即可输出图像包含的目标信息。2.根据权利要求1所述的目标检测算法,其特征在于,步骤(2)中:所述关键点检测分支由4个卷积层构成,前三个卷积层每个都有256个卷积核,最后一个卷积层有5个卷积核,即关键点检测分支输出通道数为5,第一个通道代表该目标为前景的概率,第2到5个通道代表目标的中心点坐标(x,y)和长宽(w,h);所述锚框检测分支由4个卷积层构成,前三个卷积层每个都有256个卷积核,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。