一种基于轻量化深度神经网络的建造物料视觉盘存方法技术

技术编号：39729559 阅读：8 留言：0更新日期：2023-12-17 23:33

本发明专利技术涉及计算机视觉技术领域，具体涉及一种基于轻量化深度神经网络的建造物料视觉盘存方法，包括：采集建筑物物料数据集，通过人工结合半自动标注对钢筋数据集进行标注，并将钢筋数据集划分为训练集与测试集；基于

全部详细技术资料下载

【技术实现步骤摘要】
一种基于轻量化深度神经网络的建造物料视觉盘存方法

[0001]本专利技术涉及计算机视觉
，具体涉及一种基于轻量化深度神经网络的建造物料视觉盘存方法
。

技术介绍

[0002]目前，建造物料的盘存主要是基于传统人工与视觉盘存，其中视觉盘存分为基于传统图像处理和基于深度学习的视觉盘存
。
传统的建造物料的盘存主要采用称重或人工方式，存在效率低
、
出错率高和成本高等诸多问题
。
因此，急需开发一种能够自动
、
快速和准确的对密集建筑物料进行检测计数的新方法，以将工人从这种繁琐且不熟练的任务中解放出来，并提高建造物料的接收效率
。
[0003]在传统图像处理方法中，本领域技术人员提供了以下现有技术：对粘连的钢筋端面图像进行研究，根据最大内切圆算法获得正常钢筋的半径，然后利用修正后的梯度
Hough
变换和一系列相应的算子来定位钢筋；通过模板匹配和变阈值分割对钢筋截面中心定位，完成对钢筋的跟踪计数；提出基于模板覆盖的捆绑式钢筋计数算法，以获得钢筋捆绑数量的统计信息；提出基于准圆形假设的模式识别方法，计数过程中只使用加
、
减和逻辑运算，可实现钢筋的实时计数；提出基于模板的算法，可支持矩形和圆形钢管计数，并且取得了良好的精度；提出将钢筋区域与背景分离实现钢筋计数，通过钢筋区域提取器输出二进制的钢筋和背景图像，并利用钢筋检测器检测图像中的钢筋
。
可见，传统图像处理的建筑物料视觉盘存算法主...

【技术保护点】

【技术特征摘要】
1.
一种基于轻量化深度神经网络的建造物料视觉盘存方法，其特征在于，包括如下步骤：
S1、
采集建筑条形物料截面的照片或视频，解析照片或视频形成图像数据，多个图像数据作为物料数据集，将物料数据集划分为训练集与测试集；
S2、
设计物料采集的基础神经网络模型；所述基础神经网络模型为
Yolov5s
结构，包括输入层
、Backbone
层
、Neck
层与
Head
层，其中，
Backbone
为骨干层，
Neck
为特征传递层，
Head
为检测层；输入层包括分辨率调整与光照调整预处理网络，输入为图像数据看，输入图像数据的分辨率为
512*512
；
Backbone
包括各个卷积模块，基于卷积网络提取输入图像数据的图像特征，针对
Backbone
优化其参数量；
Neck
层采用经典
PANET
对
Backbone
提取的图像特征进行降维与融合操作，将操作后的图像特征送入
Head
中进行预测；
Head
层得到操作后的图像特征，基于
YOLO
检测头预测钢筋目标的位置以及钢筋目标的数量；
S3、
对基础网络神经模型进行训练，利用训练集对基础神经网络模型进行训练，得到初步优化神经网络模型；用测试集对初步优化神经网络模型的性能进行初步测试，测试的参数包括：
FLOPs、Params
以及
Map@0.5
，
Map
的的计算公式分别如下：
AP
＝
∫
01
p(r)dr
其中，
p
为准确率，
r
为召回率，
C
为类别数，
mAP
有
mAP@0.5
和
mAP@0.5:0.95
两种形式，
mAP@0.5
表示
IOU
阈值＝
0.5
时，计算目标的平均精度，
mAP@0.5:0.95
表示
IOU
阈值分别为
0.5,...,0.95
情况下求取
mAP
，然后再取所有
mAP
的平均值；
FLOPs
指浮点运算数即计算量，用于衡量神经网络模型的复杂度，在不考虑激活函数的运算时，其计算公式如下所示：
(2
×
C
i
×
K2)
×
H
×
W
×
C
out
其中，
H
和
W
为输出特征图的尺寸大小，
C
i
和
C
out
分别为输入通道数和输出通道数，
K
为卷积核的大小；
Params
用于计算神经网络模型的参数量，其计算公式如下所示：
Params
＝
C
out
×
(C
i
×
K
w
×
K
h
+1)
其中，
K
w
与
K
h
分别是卷积核的宽和高；测试其性能是否满足以下条件，其性能参数范围值：
Flops<
＝
8GFLOPs
，
Params<
＝
3.7M
，
mAP@0.5>
＝
0.975
；
S4、
对初步优化神经网络模型的
BN
层进行通道剪枝，采用测试集对正在通道剪枝的初步优化神经网络模型进行性能的动态测试，当初步优化神经网络模型的输出性能满足以下条件时，停止
BN
层的通道剪枝，得到轻量化神经网络模型；其中，
BN
层为批量归一化层，性能满足以下条件，性能参数范围值如下：
Flops<
＝
6GFLOPs
，
Params<
＝
3.1M
，
mAP@0.5>
＝
0.975
；
S5、
将
S4
中得到的轻量化神经网络模型编译成软件产品植入到智能设备中；
S6、
通过智能设备的图像或视频采集部件对需要计数的物料进行数据采集；
S7、
通过
S5
中已经形成软件产品的轻量化神经网络模型对物料图像进行分析，从而得到钢筋数量
。2.
如权利要求1所述的一种基于轻量化深度神经网络的建造物料视觉盘存方法，其特征在于，
S1
中，解析照片或视频的方法为：如果是视频，截取视频最清晰的关键帧形成图片，
将拍摄的照片或解析的图片形对初始图像数据，然后对初始图像数据进行优化...

【专利技术属性】
技术研发人员：邓曦，刘寿松，王楷，钱琪，杨应铭，曹馨雨，刘健，
申请(专利权)人：中国建筑技术集团有限公司重庆大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人