【技术实现步骤摘要】
一种基于深度学习的小目标物体检测方法
本专利技术涉及目标检测
,尤其涉及一种基于深度学习的小目标物体检测方法。
技术介绍
目标检测是结合了目标定位和识别两个任务的一项基础计算机视觉任务,它的目的是在图像的复杂背景中找到若干目标,对每一个目标给出一个精确的目标边框并判断该边框中目标所属的类别。目标检测技术在人民的日常生活中有着广泛的应用,如目标跟踪与识别、人脸识别、文字检测、行人检测、医疗诊断、智能监控系统等,作为一项基础任务,目标检测近几年的飞速发展推动了其他视觉任务的进步。虽然基于深度学习的方法在通用的目标检测数据集上取得了很好的效果,但是它们仍然不能很好地解决小目标检测这一问题。主要原因是小目标检测存在两个问题:(1)信息量匮乏,即目标在图像中占比非常小,对应区域的像素所能反映出的信息量非常有限。(2)数据量稀缺,即数据集中含有小目标的图像少,导致了整个训练集的类别不均衡。比如在COCO数据集中,虽然小物体对象、中等物体对象和大型物体对象的大致占比分别为42%,34%和24%,但是大概只有52%的图 ...
【技术保护点】
1.一种基于深度学习的小目标物体检测方法,其特征在于,包括如下步骤:/n步骤S1:基于COCO数据集提取出不包含小目标物体的图像,对图像尺寸进行调整后进行拼接,将拼接图像和COCO数据集中含有小目标对象的图像组成新的数据集,并按4:1的比例将数据集分成训练集和测试集;/n步骤S2:修改Faster-RCNN的基础特征提取网络进行特征融合;/n步骤S3:将进行融合之后的每层级融合特征通过RPN网络进行候选区域选择;/n步骤S4:将训练图像输入到改进的网络中进行训练,根据目标分类和回归构建损失函数;/n步骤S5:重复选取训练图片,直到损失函数收敛并保存训练模型;/n步骤S6:将 ...
【技术特征摘要】
1.一种基于深度学习的小目标物体检测方法,其特征在于,包括如下步骤:
步骤S1:基于COCO数据集提取出不包含小目标物体的图像,对图像尺寸进行调整后进行拼接,将拼接图像和COCO数据集中含有小目标对象的图像组成新的数据集,并按4:1的比例将数据集分成训练集和测试集;
步骤S2:修改Faster-RCNN的基础特征提取网络进行特征融合;
步骤S3:将进行融合之后的每层级融合特征通过RPN网络进行候选区域选择;
步骤S4:将训练图像输入到改进的网络中进行训练,根据目标分类和回归构建损失函数;
步骤S5:重复选取训练图片,直到损失函数收敛并保存训练模型;
步骤S6:将测试集输入到训练好的模型中进行测试。
2.根据权利要求1所述的基于深度学习的小目标物体检测方法,其特征在于,所述步骤S1中,将COCO数据集中不包含小目标物体的图像进行尺寸调整,并将调整后的图像进行拼接;目的是为了减轻训练过程中目标物体大小的不平衡性问题,拼接图像大小与常规图像大小相同,通过这种方式,把大型物体和中等物体缩小成中等物体和小物体,均衡了不同尺度的物体在训练过程中的分布。
3.根据权利要求2所述的基于深度学习的小目标物体检测方法,其特征在于,在图像拼接过程中,将k个统一分辨率的常规图像(尺寸为W*H)通过最近邻插值法进行缩放,然后合并构造成拼接图像;为了保留原始图像的属性,缩放后的图像保持的宽高比,一般情况下,当k=1时,拼接图像引入的是常规图像。
4.根据权利要求3所述的基于深度学习的小目标物体检测方法,其特征在于,最邻近插值法的过程是:首先假设原图像素大小为W*H,缩放后的图片像素大小为w*h,原图中每个像素点的坐标都是整数;假设缩放后有一个像素点为(x,y),则其所对应在原图中的像素点为(X,Y)=(W/w*x,H/h*y),但是因为缩放比例的原因,会导致(W/w*x,H/h*y)中的值不一定是整数,此时用四舍五入法将其化为整数,表示为g,所以g(X,Y)=g(W/w*x,H/h*y)。
5.根据权利要求1所述的基于深度学习的小目标物体检测方法,其特征在于,在步骤S2中,Faster-RCNN的基础特征提取网络模块为残差网络ResNet-50,包括input、conv1、maxpooling、conv2_x,conv3_x,conv4_x,conv5_x,其中,conv1层包含1个卷积操作,卷积核为7×7,步长为2,conv2_x、conv3_x、conv4_x、conv5_x层分别包含3、4、6、3个残差块,每个残差块均包含3层卷积,卷积核大小依次为1×1,3×3和1×1,其中conv3_x、conv4_x、conv5_x层的第一个残差块的3×3的卷积层的步长为2,目的是做下采样,使分辨率降低,同时深度增加,其余的所有卷积层的步长都是1。
6.根据权利要求1所述的基于深度学习的小目标物体检测方法,其特征在于,在步骤S2中,改进后的Faster-RCNN特征提取网络是在其基础特征提取网络的基础上,采用一个具有...
【专利技术属性】
技术研发人员:杨海东,巴姗姗,黄坤山,
申请(专利权)人:佛山市南海区广工大数控装备协同创新研究院,佛山市广工大数控装备技术发展有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。