一种实现电梯维保图片识别的方法技术

技术编号:39654447 阅读:9 留言:0更新日期:2023-12-09 11:23
本发明专利技术公开了一种实现电梯维保图片识别的方法,通过扩展

【技术实现步骤摘要】
一种实现电梯维保图片识别的方法


[0001]本专利技术涉及人工智能图片识别
,尤其涉及一种实现电梯维保图片识别的方法


技术介绍

[0002]在电梯行业中,电梯作为一种特殊的设备,其安全性和可靠性对人们的生命财产安全有着至关重要的影响

因此,电梯的维保工作也显得尤为重要

而上传维保图片则是维保工作中的一个重要环节,它不仅可以帮助维保员工更好地了解电梯的实际情况,为电梯的安全管理者提供有力的支持,同时也可以为电梯的维修记录提供有效的证据

但是由于平时维保员工上传的维保图片会有存在不规范的情况,如图片模糊,图片未拍完整,垃圾图片等等

[0003]有资料显示,传统人工审核维保图片的方法已经无法满足现代企业的需求,需要采用更加高效

准确

实时的审核方法来提高审核效率和准确率,降低审核成本

现如今,卷积神经网络发展迅猛,并在不断演进和拓展应用

由于电梯行业每日需要对大量的维保图片进行审核,因此需要对模型的运行速度有较高的要求


ShufflenetV2
是一种轻量级网络,大大降低计算和存储成本

虽然该网络在计算效率和模型大小方面具有很高的优势,然而,它也存在一些缺点,下面将对其进行分析

[0004]1,低精度问题:
ShufflenetV2
采用了一些轻量级的设计,如通道重排和深度卷积,虽然会减少计算量,但也会出现信息丢失的情况,对网络的精度产生一定的影响

尤其在处理维保图片这种背景复杂的图像时,会导致网络性能下降

[0005]2,局限性:
ShufflenetV2
的设计是为了在移动设备上进行实时图像识别,因此它的应用场景受到了一定的局限性

在一些需要更高精度和更大模型的任务中,
ShufflenetV2
可能无法胜任

[0006]中国专利文献
CN104495553A
公开了一种“智能电梯监测管理平台”。
包括数据采集仪

可编程通讯加密适配器

后台服务器和
SSL/IPsec VPN
网关;所述数据采集仪和可编程通讯加密适配器均安装在电梯内,数据采集仪用于对电梯的数据经行采集,可编程通讯加密适配器和数据采集仪之间用
RS485/232
方式连接,用于收集数据采集仪采集到的数据,并将收集的数据传送至后台服务器,后台服务器对接收的数据进行处理,并结合模拟的图片显示给用户;所述
SSL/IPsec VPN
网关用于外部用户安全接入访问

上述技术方案主要用于采集,难以有效对采集图片做出分析


技术实现思路

[0007]本专利技术主要解决原有的技术方案难以有效对采集图片做出分析的技术问题,提供一种实现电梯维保图片识别的方法,通过扩展
Block
模块中
DW
卷积核大小,以及在
DW
卷积层后增添
Dropout
模块,可以扩大感受野,更好的提取图片特征,并且提高模型泛化能力,防止出现过拟合现象,提高模型的精度,通过在网络结构
Conv5
层后,添加
CBAM
模块,可以更好的
强调重要特征,压缩不重要特征,这样不仅能够节约参数和计算力,而且特征覆盖到了待识别物体的更多部位,最终判别物体的几率也更高,并且在
Conv1
层以及
Conv5
层卷积后引入
H

Swish
非线性激活函数,可以使网络层具有更丰富的表现能力,因此可以提升模型的准确率,而且维保图片的审核过程和结果可即时的反馈给维保工人及管理者,及时发现和纠正审核中的问题,有利于提升公司服务质量

[0008]本专利技术的上述技术问题主要是通过下述技术方案得以解决的:本专利技术包括以下步骤:
[0009]S1
采集维保图片中的工作层数据集,并划分为训练集

验证集

测试集;
[0010]S2
对数据集进行预处理;
[0011]S3
将处理好的图片数据输入到网络的
Conv1
层进行
3*3
卷积并池化;
[0012]S4
将池化后的特征图进一步进行特征提取;
[0013]S5
将输出的图片输入到网络的
Conv5
层进行
1*1
卷积;
[0014]S6
将卷积后的图片筛选以获得经过了重标定的特征;
[0015]S7
将特征图输入到全局平均池化层和全连接层得到训练好的模型最优参数;
S8
输入待识别的维保工作层图片进行推理并输出图片识别结果

[0016]改进的
ShuffleNetV2_CBAM
网络结构从前至后依次为
Conv1

(
卷积核为
3*3)、
最大池化层
、ShuffleNetV2_stage1、ShuffleNetV2_stage2、ShuffleNet V2_stage3,Conv5

(
卷积核为
1*1)、CBAM
模块

全局平均池化层和全连接层,其中
ShuffleNetV2_stage1、stage2

stage3
均由普通
Block(stribe

1)
和降采样
Block(stribe

2)
组合而成

[0017]作为优选,所述的步骤
S2
具体包括,首先需要对数据集进行去重

删除无效样本操作,其次在训练过程中对输入的图片进行随机概率翻转以及归一化处理;以概率
P

0.5
对图片进行随机翻转,对图像数据进行归一化,数据被输入到统一的区间内,输出范围被缩小至0到1之间

对数据集进行预处理,裁剪为分辨率为
224*224
的图像,并进行随机概率翻转以及归一化等处理,以此增强数据多样性,使模型更易收敛

[0018]作为优选,所述的步骤
S3
具体包括,将处理好的图片数据输入到网络的
Conv1
层,进行
3*3
卷积,后通过
BN
层,并进行
h

swish<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种实现电梯维保图片识别的方法,其特征在于,包括以下步骤:
S1
采集维保图片中的工作层数据集,并划分为训练集

验证集

测试集;
S2
对数据集进行预处理;
S3
将处理好的图片数据输入到网络的
Conv1
层进行
3*3
卷积并池化;
S4
将池化后的特征图进一步进行特征提取;
S5
将输出的图片输入到网络的
Conv5
层进行
1*1
卷积;
S6
将卷积后的图片筛选以获得经过了重标定的特征;
S7
将特征图输入到全局平均池化层和全连接层得到训练好的模型最优参数;
S8
输入待识别的维保工作层图片进行推理并输出图片识别结果
。2.
根据权利要求1所述的一种实现电梯维保图片识别的方法,其特征在于,所述步骤
S2
具体包括,首先需要对数据集进行去重

删除无效样本操作,其次在训练过程中对输入的图片进行随机概率翻转以及归一化处理;以概率
P

0.5
对图片进行随机翻转,对图像数据进行归一化,数据被输入到统一的区间内,输出范围被缩小至0到1之间
。3.
根据权利要求1所述的一种实现电梯维保图片识别的方法,其特征在于,所述步骤
S3
具体包括,将处理好的图片数据输入到网络的
Conv1
层,进行
3*3
卷积,后通过
BN
层,并进行
h

swish
非线性激活函数激活,将卷积处理后的特征图输入到最大池化层
。4.
根据权利要求1所述的一种实现电梯维保图片识别的方法,其特征在于,所述步骤
S4
具体包括,将池化后的特征图依次输入到
Shuf...

【专利技术属性】
技术研发人员:蒋鑫宇于佳袁刚孙尧王振彪
申请(专利权)人:杭州西奥电梯有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1