System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于深度学习轻量化输电铁塔角钢压印字符识别方法技术_技高网

基于深度学习轻量化输电铁塔角钢压印字符识别方法技术

技术编号:41283779 阅读:6 留言:0更新日期:2024-05-11 09:33
基于深度学习轻量化输电铁塔角钢压印字符识别方法,属于压印字符识别技术领域。本发明专利技术在YOLOV5的基准模型的基础上,提出一种融合式ShuffleNetV2‑SE网络架构,设计融合奇异值分解SVD池化层与随机失活机制的策略,优化了ShuffleNetV2‑SE网络架构以增强其在细节识别和噪声抑制中的性能,有效地提升了模型在捕捉、处理和重构高维特征时的灵活性和精确度;其次,通过设计的自适应多维特征耦合检测头,实现了对输入特征图的深层次提炼与空间特征的高度重构,弥补了轻量级模型的非线性缺陷和解耦检测头的定位感知能力不足。

【技术实现步骤摘要】

本专利技术属于压印字符识别,具体涉及基于深度学习轻量化输电铁塔角钢压印字符识别方法


技术介绍

1、在电力角钢铁塔制造过程中,钢印起着至关重要的作用,它是电力铁塔零件身份号码,由一系列希腊字母和阿拉伯数字按照一定的编码规则组合而成。电力角钢铁塔零件从下料到组装成塔,经过裁剪、制印、制孔、切边、预组装、镀锌、分拣、打包、发运等工艺环节,钢印伴随着整个生产流程。工人通过钢印辨识工件,完成各种操作,这种传统方法经久耐用,但是很大程度上依赖于工人的肉眼识别和体力操作,特别是在场外预组装、分拣等环节,大量零件堆叠在一起,给工人通过钢印识别来找件带来了很大困难。同时,也严重制约了erp、智能仓储等先进信息化自动化系统在电力铁塔制造行业的应用水平。

2、随着智能制造技术的推进,深度学习模型不断的更新换代,基于深度学习的智能识别也出现在人们的视野中。但是,现存的大多数深度学习模型仅仅通过增加模型的参数数量来提升准确率,以至于造成两个棘手的问题。首先,部署困难成为一个制约因素。由于模型庞大,导致在设备上的部署变得非常耗时且复杂。也限制了许多有潜力的应用在移动设备上的实际应用。其次,即便能够成功部署,模型在移动设备上的运行性能通常较差。这种性能瓶颈导致应用启动缓慢、响应迟钝,进而降低了用户体验。此外,目前大多数学者对于角钢压印字符的识别方法仅仅针对识别精度而展开研究,如侯睿和邓能辉提出一种基于多级网络融合的钢板字符检测方法及装置的专利,此专利通过利用gan网络和构建多级网络融合的识别网络,从而实现字符识别的精度要求。谭建平、刘文和邓积微等人提出一种基于bp神经网络的钢印字符识别方法的专利,该方法通过机器学习聚类算法实现了精准分割和自动字符分割,同时通过神经网络训练提高了钢印识别模型的准确率。但其都忽略了深层网络和构建聚类算法和神经网络所造成的处理速度的问题。王晓晨、刘瑾妍和闫书宗提出一种轻量化特征提取网络的钢卷端面字符识别方法和系统的专利,该专利通过对钢卷图像进行分割,得到亚像素级的边缘信息。计算各钢卷的圆心和圆环边界,确定钢卷圆环区域。展平该区域成矩形,获取像素值,形成钢卷矩形图像。最后,利用轻量化特征提取网络对钢卷端面字符进行识别。但是,该轻量化算法仅仅是牺牲准确率的前提下完成的。因此轻量且识别精度高的模型成为主要研究内容。

3、现有关于目标检测主流的模型主要包括r-cnn系列、yolo系列和ssd等模型,具有易部署、适应性、检测速度和准确率更加突出等优点,同时,由于内部过多的残差网络,导致大量网络间的连接造成冗余,极大浪费资源,特别难以部署在智能手机、pad等智能移动终端。


技术实现思路

1、针对现有技术中存在的上述问题,本专利技术的目的在于提供一种基于深度学习轻量化输电铁塔角钢压印字符识别方法,该方法不仅具有高准确率、强鲁棒性以及低计算复杂度、轻量化等优点,并且可部署在智能手机、pad等智能终端,在户外实现电力铁塔零件钢印字符识别,满足电力铁塔制造行业自动erp报工、自动工件分拣等应用需求。

2、本专利技术提供如下技术方案:基于深度学习轻量化输电铁塔角钢压印字符识别方法,构建基于深度学习轻量化的压印字符识别模型并配合自适应多维特征耦合检测头进行压印字符识别;具体过程如下:

3、s1、获取待识别的压印字符图像;

4、s2、基于yolov5基准模型构建优化的字符识别模型,所述字符识别模型包括input模块、backbone模块、neck模块及head模块;具体的优化过程如下:

5、s2.1、在backbone模块中,将基准模型骨干网络的标准卷积层替换成融合式shufflenetv2-se网络框架,以增强模型对图像特征的建模能力;

6、s2.2、在neck模块的特征池化过程中采用暂退奇异值分解池化层的策略来减少模型的复杂性和计算量;

7、s3、将基准模型的单一检测头替换成自适应多维特征耦合检测头,将字符的分类和定位任务分开处理;

8、s4、通过构建的字符识别模型及设计的自适应多维特征耦合检测头对获取的待识别压印字符图像进行识别。

9、进一步的,所述s2.1中,基于shufflenetv2的轻量级设计及senet的自适应注意力机制,将senet模块嵌入shufflenetv2结构中构建融合式shufflenetv2-se网络框架,具体构建过程如下:

10、s2.2.1、构建一个senet模块,该模块包含全局平均池化、两个全连接层和sigmoid激活函数,形成了squeeze-and-excitation结构;

11、s2.1.2、在shufflenetv2插入senet模块,使得模型能够在每个通道上动态学习特征的权重,更加聚焦于图像中权重较高的信息。

12、进一步的,所述s2.2中,采用融合奇异值分解svd池化层与随机失活机制的策略,优化s2.1中的网络框架以增强其在细节识别和噪声抑制中的性能,增强模型对于压印字符特征的提取和分类;具体内容如下:

13、通过引入随机失活机制,在svd池化层的上游引入随机失活层,将随机失活与奇异值分解层相融合替代yolov5中的最大池化层,为整个网络构造自适应的特征过滤环境,以预设的概率随机地使部分神经元的输出失活,即在前向传播过程中临时从网络中移除。

14、进一步的,所述s3中的自适应多维特征耦合检测头是将自注意机制、特征级融合及解耦头相融合,形成的一个整体检测头部;其通过自注意力机制学习到目标之间的关系,同时考虑目标的大小和位置信息,经过特征级融合,增强特征的提取,最后经过解耦头进行分类与预测。

15、通过采用上述技术,与现有技术相比,本专利技术的有益效果如下:

16、本专利技术在yolov5的基准模型的基础上,提出一种融合式shufflenetv2-se网络架构,设计融合奇异值分解svd池化层与随机失活机制的策略,优化了shufflenetv2-se网络架构以增强其在细节识别和噪声抑制中的性能,有效地提升了模型在捕捉、处理和重构高维特征时的灵活性和精确度;其次,通过设计的自适应多维特征耦合检测头,实现了对输入特征图的深层次提炼与空间特征的高度重构,弥补了轻量级模型的非线性缺陷和解耦检测头的定位感知能力不足。

本文档来自技高网...

【技术保护点】

1.基于深度学习轻量化输电铁塔角钢压印字符识别方法,其特征在于,构建基于深度学习轻量化的压印字符识别模型并配合自适应多维特征耦合检测头进行压印字符识别;具体过程如下:

2.根据权利要求1所述的基于深度学习轻量化输电铁塔角钢压印字符识别方法,其特征在于,所述S2.1中,基于ShuffleNetV2的轻量级设计及SENet的自适应注意力机制,将SENet模块嵌入ShuffleNetV2结构中构建融合式ShuffleNetV2-SE网络框架,具体构建过程如下:

3.根据权利要求2所述的基于深度学习轻量化输电铁塔角钢压印字符识别方法,其特征在于,所述S2.2中,采用融合奇异值分解SVD池化层与随机失活机制的策略,优化S2.1中的网络框架以增强其在细节识别和噪声抑制中的性能,增强模型对于压印字符特征的提取和分类;具体内容如下:

4.根据权利要求1所述的基于深度学习轻量化输电铁塔角钢压印字符识别方法,其特征在于,所述S3中的自适应多维特征耦合检测头是将自注意机制、特征级融合及解耦头相融合,形成的一个整体检测头部;其通过自注意力机制学习到目标之间的关系,同时考虑目标的大小和位置信息,经过特征级融合,增强特征的提取,最后经过解耦头进行分类与预测。

...

【技术特征摘要】

1.基于深度学习轻量化输电铁塔角钢压印字符识别方法,其特征在于,构建基于深度学习轻量化的压印字符识别模型并配合自适应多维特征耦合检测头进行压印字符识别;具体过程如下:

2.根据权利要求1所述的基于深度学习轻量化输电铁塔角钢压印字符识别方法,其特征在于,所述s2.1中,基于shufflenetv2的轻量级设计及senet的自适应注意力机制,将senet模块嵌入shufflenetv2结构中构建融合式shufflenetv2-se网络框架,具体构建过程如下:

3.根据权利要求2所述的基于深度学习轻量化输电铁塔角钢压印...

【专利技术属性】
技术研发人员:应申舜房建海
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1