【技术实现步骤摘要】
一种基于YOLOV3算法的门机歪拉斜吊检测方法
[0001]本专利技术属于图像目标检测领域,更具体地,涉及一种基于YOLOV3算法的门机歪拉斜吊检测方法。
技术介绍
[0002]门机(又称龙门吊)是桥架通过两侧支腿支撑在地面轨道上的桥架型起重机。在结构上由门架、大车运行机构、起重小车和电气部分等组成。有的门机只在一侧有支腿,另一侧支撑在厂房或栈桥上运行,称作半门式起重机。门机的门架上部桥架(含主梁和端梁)、支腿、下横梁等部分构成。为了扩大起重机作业范围,主梁可以向一侧或两侧伸出支腿以外,形成悬臂。也可采用带臂架的起重小车,通过臂架的俯仰和旋转扩大起重机作业范围。其主要用于室外的货场、料场货、散货的装卸作业。门机具有场地利用率高、作业范围大、适应面广、通用性强等特点,在港口货场得到广泛使用。
[0003]在门机作业时,工作人员安全操作的重要性不言而喻,尤其是在吊钩起重阶段,避免出现歪拉斜吊现象是重中之重。因为歪拉斜吊会不断磨损吊钩与吊绳之间的粘连度,久而久之很容易发生安全事故,所以如何做到智能快速检测并通知操作人员是当 ...
【技术保护点】
【技术特征摘要】
1.一种基于YOLOV3算法的门机歪拉斜吊检测方法,其特征在于,包括如下步骤:S1:设置摄像头,将摄像头的监控范围对准需要检测的吊钩和吊物位置,实时拍摄其视频图像;S2:采集样本图像,并对样本图像进行扩增,标注每一个样本图像中吊钩和吊物的真实检测框和吊物的类别;将带标注的样本图像作为训练集;S3:建立YOLOV3模型,利用步骤S2获得的训练集对模型进行训练,分别得到训练好的吊钩检测模型以及吊物检测模型;YOLOV3模型包括网络输入层、Darknet
‑
53网络和多尺度预测层;将样本图像作为网络输入层的输入,得到统一尺寸的样本图像;利用统一尺寸的样本图像对Darknet
‑
53网络进行训练,输出该样本图像的特征图;最后通过多尺度预测层对特征图采用三种尺度标注预测框,与真实预测框进行对比,输出预测框及置信度;S4:通过摄像头实时采集门机工作时的吊钩吊物视频,从对应当前时刻的视频中等间隔提取n帧作为当前时刻的待检测图像,将待检测图像作为步骤S3得到的训练好的吊钩检测模型和吊物检测模型的输入,得到各自检测结果,所述的检测结果包括目标置信度和检测框坐标,在此基础上根据几何原理分别计算吊钩的斜度和吊物的歪度;S5:将当前时刻的n帧图像对应的吊钩斜度和吊物歪度取均值,并与阈值角度相比较得到最终输出检测结果;S6:重复步骤S4至步骤S5,执行下一时刻的门机歪拉斜吊的检测,实现实时检测。2.根据权利要求1所述的基于YOLOV3算法的门机歪拉斜吊检测方法,其特征在于,步骤S2中对样本图像进行扩增的方法包括随机剪裁、镜像翻转和随机调节图像参数中的一种或多种,其中:所述随机剪裁为:随机裁掉原始图像中的四角、中心或者上下部分,将裁剪后的图像作为新增样本图像;所述镜像翻转为:对原始图像进行镜像翻转,将翻转后的图像作为新增样本图像;所述随机调节图像参数为:随机调节原始图像的亮度、对比度,将调节后的图像作为新增样本图像。3.根据权利要求1所述的基于YOLOV3算法的门机歪拉斜吊检测方法,其特征在于,步骤S2所述的真实检测框利用目标左上和右下两个点的坐标信息表示。4.根据权利要求1所述的基于YOLOV3算法的门机歪拉斜吊检测方法,其特征在于,所述的YOLOV3模型中的网络输入层将输入图像的尺寸大小调整为32的整倍数。5.根据权利要求4所述的基于YOLOV3算法的门机歪拉斜吊检测方法,其特征在于,所述的输入图像尺寸为256x256,所述的YOLOV3模型中的Darknet
‑
53网络对输入图像的处理过程为:a)针对尺寸为256x256输入图像,首先经过一个3x3x32的卷积层输出256x256x32;b)接着经过一个3x3x64、stride=2的卷积层输出为128x128x64;c)经过一个残差块,输出为128x128x64;d)过一个3x3x128、stride=2的卷积层输出为64x64x128;e)2个残差块后输出为64x64x128;f)经过一个3x3x256、stride=2的卷积层输出为32x32x256;
g)经过8个残差块,输出为32x32x256;h)过一个3x3x512、stride=2的卷积层输出为16x16x512;i)经过8个残差块后输出为16x16x512;j)过一个3x3x1024、stride=2的卷积层输出为8x8x1024;k)经过4个残差块后输出为8x8x1024;l)经过池化全连接层以及sigmoid激活函数层输出最终的特征图及预测概率。6.根据权利要求5所述的基于YOLOV3算法的门机歪拉斜吊检测方法,其特征在于,步骤S3中的对模型进行训练的过程为:a)随机初始化网络结构的权重参数W;b)随机选取一批样本图像作为迭代的样本图像输入;c)通过Darknet
‑
53网络进行图像特征提取,前向传输得到概率输出,选取输出的结点中概率值最大的结点作为预测结果;d)利用预测结果计算本次迭代的sigmoid交叉熵损失函数,sigmoid交叉熵损失函数计算式为:H(p,q)=
‑
∑(p(x)logq(x)+(1
‑
p...
【专利技术属性】
技术研发人员:何钢迪,厉小润,王皓,蒋剑锋,王晶,刘德昆,马溢坚,王建军,鄢祖建,
申请(专利权)人:杭州越达图谱科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。