【技术实现步骤摘要】
一种基于YOLO v3的多尺度目标检测方法
[0001]本专利技术创造属于计算机视觉检测领域,尤其是涉及一种基于YOLO v3的多尺度目标检测方法。
技术介绍
[0002]目标检测的任务是找出图像或视频中的感兴趣物体,同时检测出它们的位置和大小,是机器视觉领域的核心问题之一,目前已经被广泛应用于X光图像检测、汽车辅助驾驶、交通标志识别、医学图像分析等多个领域。通过计算机视觉技术可以大大减少实际生产生活中的人力物力成本,因而在复杂环境下实现对各尺寸目标的精准识别在实际应用中有着重要的研究意义。
[0003]随着深度学习时代的来临,目标检测方法已经从基于手工特征提取的传统检测算法发展为基于深度学习的目标检测算法,通过深层次的神经网络学习更为复杂的特征信息,以进一步增强模型对图像的表达能力。目前基于深度学习的目标检测算法主要分为两个方向:二阶段检测算法和一阶段检测算法。二阶段检测算法以R
‑
CNN系列为代表,使用最广泛的有Fast RCNN、 Faster RCNN等,这类基于区域的检测算法首先要从图片中 ...
【技术保护点】
【技术特征摘要】
1.一种基于YOLO v3的多尺度目标检测方法,其特征在于,包括以下步骤:S1、对数据集图像进行预处理;将图像数据调整到网络设定的尺寸;S2、在骨干网络中加入改进后的DenseNet结构,使用改进后的骨干网络对输入图像进行下采样操作;S3、在输出的几个不同尺寸的特征层之后加入空间金字塔结构;S4、将经过空间金字塔模块后的特征图分别与上一层尺寸较大的特征图进行融合,构成四个尺寸的多尺寸预测机制;S5、将输出的不同尺寸的特征图传递到进行检测预测的分类器中;S6、对输入图像进行精确的类别预测、以及位置坐标的回归;S7、计算分类网络与回归网络的多任务损失函数,并对网络进行训练优化,使分类与回归的损失函数达到收敛并保存网络的权重参数;S8、部署优化后的参数,对目标进行检测。2.根据权利要求1所述的一种基于YOLO v3的多尺度目标检测方法,其特征在于,所述步骤S1的具体步骤如下:S101、对图像进行颜色增强、平移变化、水平以及垂直翻转;S102、使用线性插值法将所有图像数据大小放缩到416*416。3.根据权利要求1所述的一种基于YOLO v3的多尺度目标检测方法,其特征在于,所述步骤S2中加入DenseNet的具体方法为:S201、对DenseNet
‑
121的结构进行调整,利用改变卷积核步长的方法代替原结构中的池化操作;S202、利用改进的DenseNet
‑
121结构替换原骨干网络中的残差结构,在缓解梯度消失问题的同时加强特征的复用和传递。4.根据权利要求1所述的一种基于YOLO v3的多尺度目标检测方法,其特征在于,所述步骤S3中输出的四个不同尺寸的特征层后加入的空间金字塔池化模块的具体操作为:将空间金字塔池化模块中的最大的池化核设置为与需要池化的特征图大小相同的尺寸,如最后一层中最小尺度的特征图大小为13*13,此时将SPP模块最大池化核设置为13以实现局部特征和全局特征的特征图级别的融合。5.根据权利要求1所述的一种基于YOLO v3的多尺度目标检测方法,其特征在于,所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。