一种基于深度学习的目标检测方法技术

技术编号：34609547 阅读：113 留言：0更新日期：2022-08-20 09:14

本发明专利技术涉及计算机技术领域，具体是一种基于深度学习的目标检测方法，使用目标嵌入的方法，将检测出的原始图像候选框的目标称为原始图像，和重构图像组合到一起，成为组合目标集；将训练集中检测iou低于0.2的失败图像作为扩展图像，使用组合目标集的图像替换系统中扩展图像中的部分组合为一个新的图像，获得一个更大的数据集，当原始数据集较小时会变的非常有效；由于神经网络对于这些已经检测成功的图像更敏感，将目标外的区域进行多次替换，使得模型进行目标检测时能够对目标候选框的区域定位更精准，对候选框的边界区分更分明，加强了定位能力；本发明专利技术只采用iou值大于0.5的锚框，并进行非最大值抑制，使得空间定位能力更强。使得空间定位能力更强。使得空间定位能力更强。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的目标检测方法

[0001]本专利技术涉及计算机
，具体是一种基于深度学习的目标检测方法。

技术介绍

[0002]随着计算机技术的飞速发展，计算机视觉中目标检测被应用在越来越多的地方。目标检测算法是指通过输入一个或数个图像，经过卷积层及池化层等操作，能够获得检测出目标的矩形框，预测图中物体的算法。随着深度学习的广泛应用，目标检测算法也越来越多，大致分为两种，单阶段目标检测及两阶段目标检测两种。单阶段目标检测算法准确性较低，但速度较快，如Yolo、SSD类的算法，通过减少其中卷积神经网络的层数和候选区域来增加神经网络算法的运行速度。两阶段目标检测算法多是基于R
‑
CNN进行优化，首先通过某种算法确定图片中的候选框，再通过空间金字塔、锚框、支持向量机等对其中的候选框进行分类与回归，来进行预测，通过给算法增加规模构建深层神经网络进行深度学习来增加算法预测的准确性。
[0003]无论是单阶段还是两阶段算法，总有或多或少的缺陷，单阶段算法速度虽然较快，但准确率较低，而两阶段算法耗时过长又...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的目标检测方法，其特征在于：包括以下步骤：S1、创建训练集，初始化训练：包括模型初始化、初次训练和锚框优化；S2、目标嵌入，重构训练集：包括图像增强和目标嵌入重组；S3、训练模型，计算损失函数，更新模型的参数：包括对模型重新训练，计算损失函数，进行深度学习；S4、重复S3。2.根据权利要求1所述的一种基于深度学习的目标检测方法，其特征在于：S1中，创建训练集，初始化训练包括以下步骤：S11、模型初始化：使用moco
‑
v2模型先随机初始化，输入最初始图像，数据集可以为PascalVOC、COCO等，学习率定为0.05，迭代10000次，锚框初步定为25个位置、纵横比、规模的矩形框；初次训练的损失函数为：其中q为一个查询表示，k+为key样本的正样本，τ是一个温度超参数，N为样本数；S12、优化锚，保存检测成功图片：根据数据集中输入图片的groud
‑
truth值，将其中Iou值大于0.5的锚框保留，舍弃其余的锚框；Iou指的是两个区域重叠的部分除以两个区域的集合部分得出的结果Overlap代表重叠区域，Union代表两个区域的并集区域；S13、提取目标：将这些检测成功的图像的groud
‑...

【专利技术属性】
技术研发人员：王其，张权，倪世松，
申请(专利权)人：南京信息工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人