【技术实现步骤摘要】
基于改进YOLOv3网络的行人检测方法、系统、介质、设备
[0001]本专利技术属于行人检测
,具体涉及一种基于改进YOLOv3网络的行人检测方法、系统、介质、设备。
技术介绍
[0002]随着科技快速的发展,行人检测在智能视频监控、车辆辅助驾驶、智能机器人等领域有着广泛的应用。行人检测作为智能设备的一种核心的技术,可以使机器设备获取图像信息,且对这些信息进行分析处理,帮助人们完成各种识别检测任务。
[0003]YOLOv3算法利用了特征金字塔网络(FPN)实现了三种尺度的预测,分别为13*13、26*26、52*52,其检测精度相比于YOLO、YOLOv2均有所提升。尽管目标检测算法在深度学习YOLOv3方法上已取得不错的成绩,但仍然存在以下问题:卷积神经网络中深层感受野大,经过多次下采样后,更难提取到行人特征,导致小尺寸行人目标存在漏检、误检等情况。
技术实现思路
[0004]专利技术目的:针对现有技术中存在的问题,本专利技术提供一种基于改进YOLOv3网络的行人检测方法,该方法结合线性缩放 ...
【技术保护点】
【技术特征摘要】
1.一种基于改进YOLOv3网络的行人检测方法,其特征在于,包括以下步骤:步骤1:构建特征提取网络Darknet的残差网络,将残差网络基本单元中BN层的参数合并到其卷积层;根据构建的残差网络构建特征提取网络,记为特征提取网络Darknet
‑
53;步骤2:构建特征金字塔网络,将特征提取网络Darknet
‑
53经过5次下采样获取图像的4个卷积特征与YOLO输出13*13、26*26、52*52、104*104尺度信息进行融合;使YOLOv3算法中的YOLO输出层输出4种尺度的特征图,其中,4种尺度包括:13*13、26*26、52*52、104*104;步骤3:YOLOv3算法得到4种尺度特征图上的预测候选框;步骤4:利用k
‑
means算法对4种尺度特征图上的预测候选框进行聚类,得到每种尺度特征图上的目标候选框;步骤5:按照尺度从小到大的顺序将4种尺度特征图的目标候选框定位点排列为坐标点队列;对所述坐标点队列进行尺度缩放,缩放计算式为:其中N为坐标点队列中坐标点的总数;m、n分别为缩小系数和放大系数,0<m<1,n>1;(x
i
,y
i
)和(x
′
i
,y
′
i
)分别为坐标点队列中第i个坐标点缩放前和缩放后的坐标值,i=1,2,
…
,N;根据缩放后的坐标点得到对应的缩放后的目标候选框;步骤6:在缩放后的目标候选框中运用NMS方法,选出特征图上目标候选框中具有最大IOU的目标候选框,根据选出的目标候选框进行行人目标预测。2.根据权利要求1所述的行人检测方法,其特征在于,所述步骤1中将残差网络基本单元中BN层的参数合并到其卷积层,具体为:步骤11:卷积层和BN层融合前,Darknet
‑
53提取网络中卷积层输出y
conv
为:y
conv
=w*x+b其中x、w、b分别为Darknet
‑
53提取网络中卷积层的输入、权重和偏置;步骤12:将y
conv
输入到BN层,BN层输出y
bn
为:其中μ为BN层输入的均值,σ2为方差,γ为缩放因子,β为偏移量;ε为一个较小数;步骤13:卷积层和BN层合并后,权重参数和偏置为:步骤14:卷积层和BN层合并后,合并输出y
′
融合
为:
其中为合并后卷积权重,为合并后卷积偏置。3.根据权利要求1所述的行人检测方法,其特征在于,步骤5中的目标候选框定位点为目标候选框的左上角、右上角和几何中心处的坐标点。4.根据权利要求1所述的行人检测方法,其特征在于,缩小系数和放大系数的取值为:m=0.3,n=1.2。5.根据权利要求1所述的行人检测方法,其特征在于,所述步骤2中,特征提取网络Darknet
‑
53经过5次下采样获取图像的4个卷积特征的具体步骤为:步骤A21:使用尺寸为416*416的图像作为Darknet
‑
53的网络输入,进行第一次下采样;步骤A22:进行第二次下采样,对第二次下采样结果使用2个步骤1中构建的残差网络进行特征提取,输出第一卷积特征为104*104*128;步骤A23:进行第三次下采样,对第三次下采样结果使用8个步骤1中构建的残差网络进行特征提取,输出第二卷积特征为52*52*256;步骤A24:进行第四次下采样,对第四次下采样结果使用通道为512的卷积进行特征提取,输出第三卷积特征为26*26*512;步骤A25:进行第五次下采样,对第五次下采样结果使用4个步骤1中构建的残差网络进行特征...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。