基于交替图像注意力机制的油罐商标颜色纯正检测方法技术

技术编号:37330146 阅读:10 留言:0更新日期:2023-04-21 23:08
本发明专利技术公开了一种基于交替图像注意力机制的油罐商标颜色纯正检测方法,涉及图像检测领域,旨在解决现有技术中准确率低的问题,采用的技术方案是,包括先采集正常颜色图像,再得到异常颜色商标图像;建立ViT网络模型;处理图像并构建数据集;通过ViT网络模型对油罐商标图像进行训练,并进行实际测试后投入使用、及时更新;本技术方案的网络模型可以随时更新不会打断流水线的生产,也无需大量的人工标记训练数据,降低了网络的搭建成本;提出的融合了局部

【技术实现步骤摘要】
基于交替图像注意力机制的油罐商标颜色纯正检测方法


[0001]本专利技术涉及图像检测领域,具体为一种基于交替图像注意力机制的油罐商标颜色纯正检测方法。

技术介绍

[0002]油罐的实际生产场景中,往往会有各种各样的不适宜工人长时间监控作业的工序,有关的商标检测就属于这一类工序。为了不打断整条流水线的作业,对于油罐的商标颜色检测往往需要不间断的,快速的,作业影响最小的检测方式。因此,需要对这一问题进行研究,找到一种方法能够不间断的影响最小的快速地进行油罐商标的颜色纯正检测,进而帮助工厂进行更安全,更高效,不影响生产流程的生产活动。
[0003]目前的油罐颜色纯正检测方法大部分基于卷积神经网络搭建,这类方法的颜色纯正检测受到背景颜色的干扰较大,检测准确率较低。最近,由Transformer结构组成的ViT(Vision Transformer)网络在计算机视觉领域的优势越来越明显,其不同于卷积网络的全局注意力,使其在不同场景下都有较好的性能,鲁棒性强,但ViT网络架构存在计算量大、复杂度高以及不便于获得大的有效感受野的问题。
[0004]关于油罐商标颜色纯正检测的现有技术所存在的不足之处:(1)判别准确率不能达到工业生产需求,需要进行长时间的现场人工辅助判别,并且需要打断流水线的生产。
[0005](2)为了得到更好的深度卷积神经网络模型,需要大量的人工标记训练数据,造成网络的搭建成本高。背景颜色的干扰性强,对于网络的识别准确度造成严重的效率下降。因此本专利技术中提出了一种准确率高,抗干扰性强的方法,能够在工业生产环境中取得较好的结果。

技术实现思路

[0006]鉴于现有技术中所存在的问题,本专利技术公开了一种基于交替图像注意力机制的油罐商标颜色纯正检测方法,采用的技术方案是,包括以下步骤:步骤1,先使用摄像头对颜色正常的油罐进行商标图像采集,得到正常颜色商标图像,再对正常颜色商标图像进行正常阈值外的颜色变化处理,得到异常颜色商标图像;步骤2,建立基于图像注意力机制的ViT网络模型;步骤3,对获取到的商标图像进行分类整理,处理后并以此构建数据集;步骤4,通过基于图像注意力机制的ViT网络模型对油罐商标图像进行训练;步骤5,对训练好的模型进行实际测试后投入使用;步骤6,数据集更新后,重加载模型再次训练进行模型更新。
[0007]作为本专利技术的一种优选技术方案,所述步骤1中对颜色正常的油罐使用的摄像头为高像素摄像头,异常颜色商标图像先将RGB格式转换成LAB格式,再转换成cmyk格式,再进行正常颜色阈值外的颜色变化处理后转回RGB格式,得到异常颜色商标图像。
[0008]作为本专利技术的一种优选技术方案,步骤2中建立的模型对全局注意力策略进行了优化改进。模型采用新的融合了局部

全局注意力的机制。
[0009]所述步骤2中,基于图像注意力机制的ViT网络模型包括图片块嵌入模块,注意力模块,位置编码生成模块,自适应平均池化层,维度转换层,全连接层组成;其中输入数据由图片块嵌入模块,注意力模块,编码生成模块组成的图像注意力模块组重复四次运算,输出数据再由一层自适应平均池化层池化后转换到低维度,最后由全连接层完成分类运算。
[0010]作为本专利技术的一种优选技术方案,所述步骤3中对获取到的商标图像按正常颜色图片与异常颜色图片两类进行文件整理,对文件中的图像进行名称编号标记并调用transforms方法处理以此构建训练数据集,验证数据集以及测试数据集。
[0011]作为本专利技术的一种优选技术方案,所述步骤4中将做好的训练数据集与验证数据集传入模型中,训练使用Adam函数作为优化器,根据交叉熵损失函数进行反向传播优化模型的权重参数。
[0012]作为本专利技术的一种优选技术方案,所述步骤5中对模型进行训练,使用得到的模型文件加载制作好的测试数据集测试得到模型效果,满足设定期待值后投入使用。
[0013]作为本专利技术的一种优选技术方案,所述步骤6中后期实际生产中新的种类油罐样本数据集更新后,重新加载训练好的模型权重到网络模型中将新的数据加入旧的数据集中形成新的数据集再次训练进行模型更新。
[0014]本专利技术的有益效果:本专利技术网络模型可以随时更新不会打断流水线的生产,也无需大量的人工标记训练数据,降低了网络的搭建成本。
[0015]进一步的,本专利技术中提出的融合了局部

全局注意力相互交替模块提高了准确率,降低了计算量以及复杂度,加强了对于背景颜色的抗干扰性,能够在工业生产环境中取得较好的结果。
附图说明
[0016]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
[0017]图1为本专利技术流程图;图2为本专利技术模块处理流程图;图3为本专利技术注意力模块编码流程图。
实施方式实施例
[0018]如图1至图3所示,本专利技术公开了一种基于交替图像注意力机制的油罐商标颜色纯正检测方法,采用的技术方案是,包括以下步骤:步骤1,使用高像素摄像头对颜色正常的油罐进行商标图像采集,以确保采集到的图像有足够的处理空间,得到正常颜色商标图像,再对正常颜色商标图像进行正常阈值外的颜色变化处理,异常颜色商标图像先将RGB格式转换成LAB格式,再转换成cmyk格式,因为
LAB色域比rgb和cymk的要大,是目前人眼已知感知色彩最多的颜色模式,它包括rgb这些颜色,不会出现颜色丢失的情况,再进行正常颜色阈值外的颜色变化处理,颜色变化处理方式采用伽马分布对应cmyk颜色格式的四个维度并拟合现实颜色异常的分布规律,转回RGB格式后得到异常颜色商标图像。
[0019]步骤2,本专利技术网络模型是在基于图像注意力机制的ViT模型的基础上进行改进。该模型由图片块嵌入(PatchEmbedding)模块、注意力(Transformer)模块、位置编码生成(PEG)模块、自适应平均池化(AdaptiveAvgPool2d)层、维度转换(Rearrange)层、全连接(Linear)层组成。其中输入数据由PatchEmbedding模块、Transformer模块、PEG模块组成的图像注意力模块组重复四次运算,输出数据再由一层AdaptiveAvgPool2d层池化后转换到低维度,最后由全连接层完成分类运算。模型对注意力(Transformer)模块进行了优化改进。模型采用的新的融合了局部(Locally

grouped self

attention)

全局(Global sub

sampled attention)注意力(LSA

GSA)相互交替的机制是对特征的空间维度进行分组,并计算各组内的自注意力,再从全局对分组注意力结果进行融合。其中分组计算的局部注意力可以高效地传导本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于交替图像注意力机制的油罐商标颜色纯正检测方法,其特征在于:包括以下步骤:步骤1,先使用摄像头对颜色正常的油罐进行商标图像采集,得到正常颜色商标图像,再对正常颜色商标图像进行正常阈值外的颜色变化处理,得到异常颜色商标图像;步骤2,建立基于图像注意力机制的ViT网络模型;步骤3,对获取到的商标图像进行分类整理,处理后并以此构建数据集;步骤4,通过基于图像注意力机制的ViT网络模型对油罐商标图像进行训练;步骤5,对训练好的模型进行实际测试后投入使用;步骤6,数据集更新后,重加载模型再次训练进行模型更新。2.根据权利要求1所述的基于交替图像注意力机制的油罐商标颜色纯正检测方法,其特征在于:所述步骤1中对颜色正常的油罐使用的摄像头为高像素摄像头,异常颜色商标图像先将RGB格式转换成LAB格式,再转换成cmyk格式,再进行正常颜色阈值外的颜色变化处理后转回RGB格式,得到异常颜色商标图像。3.根据权利要求1所述的基于交替图像注意力机制的油罐商标颜色纯正检测方法,其特征在于:所述步骤2中,基于图像注意力机制的ViT网络模型包括图片块嵌入模块,注意力模块,位置编码生成模块,自适应平均池化层,维度转换层,全连接层组成;其中输入数据由图片块嵌入模块,注意力模块,编码...

【专利技术属性】
技术研发人员:荆晓远张润地王广宁韩光信陈俊均姚永芳朱冠华
申请(专利权)人:茂名华检实验科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1