基于改进YOLOV5X的玻璃容器瑕疵检测方法及系统技术方案

技术编号:32022049 阅读:18 留言:0更新日期:2022-01-22 18:43
本发明专利技术采用基于改进YOLOV5X的玻璃容器瑕疵识别方法及系统来识别玻璃容器瑕疵,涉及基于深度学习目标检测的玻璃容器瑕疵识别方法及系统。主要包括以下内容:利用玻璃容器瑕疵数据集进行分析标注,生成图片标签XML数据集,对XML文件标注数据集转换生成TXT文件标签集,搭建CSPDarknet53—MHSA主干特征提取网络模块,搭建Bi

【技术实现步骤摘要】
基于改进YOLOV5X的玻璃容器瑕疵检测方法及系统


[0001]本专利技术涉及到的领域主要为工业计算机视觉领域、人工智能领域,涵盖了深度学习技术、目标检测技术,主要是基于改进的YOLOV5X目标检测网络对玻璃容器瑕疵进行检测识别。

技术介绍

[0002]长期以来,质量检测与产品溯源一直作为工业检测中不可或缺的一部分,一方面,质量检测可以发现产品的缺陷防止其流入市场,另一方面,对于产生缺陷产品的生产线需要通过缺陷品编号进行检修。在过去,这些工作需要人工操作,经过培训的工人可以通过肉眼检测的方式判别缺陷以及生产批次解决生产问题。然而,人工检测有诸多弊端:速度慢、错误率高、成本高。从上世纪70年代起,自动化控制技术开始发展,第一台工业机器视觉系统诞生,工业检测领域开始从人工走向智能,2011年,在工业4.0的加持下,工业机器视觉向更加智能、更加自动化的方向发展。现阶段的工业检测领域的智能化大多数停留在以机器学习和图片像素对比度分析为基础的机器视觉技术,这种技术的通病是人为的提取标定特征并对其进行训练,在大规模且快速的生产线上,这种方法不够灵活,人力成本高,而且多依赖于人工调参,误差较大。工业检测领域当前还很少有深度学习的检测方法介入。
[0003]工业检测领域有诸多分支,高度发达的传统产业由于发展时间早,规模大,需求迫切,往往会采用更加智能化的检测线,其中比较有代表性的分支是玻璃容器检测。
[0004]工业检测领域中的分支玻璃制品的检测中大量运用以机器学习统计分类为主导的分类方法,例如KNN以及朴素贝叶斯算法,前者是通过计算二者的相似度,找出k个训练样本,然后进行打分,按得分值排序,后者是计算概率,构建概率模型,选出条件下最大概率物体进行分类。这两种方法的缺点在于对噪声数据过于敏感,尤其是当图片泛白或者不清晰时,识别效果会非常差。
[0005]深度学习在目标检测方向的发展为工业检测带来了曙光。基于深度学习的目标检测方法在工业检测十分适用。
[0006]YOLOV5X是一种深度学习目标检测模型,常用于对图片中的物体进行分类并且标出物体的所在位置,在工业计算机视觉领域用于相关物体的识别以及定位。

技术实现思路

[0007]本专利技术提出了一种新的关于玻璃容器瑕疵检测的方法及系统,专利技术包括了CSPDarknet53特征提取网络,Bi

FPN加强特征提取网络,检测头。
[0008]基于改进YOLOV5X的玻璃容器瑕疵检测方法及系统主要有以下步骤:步骤1:利用玻璃容器瑕疵数据集进行分析标注,生成图片标签数据集:对生产线工业相机采集到的图像进行分析以及标注,将玻璃容器瑕疵用矩形框标出,生成XML标签数据集以及真实图像数据集,转换XML标签集生成TXT标签集,根据标签数据集生成带有矩形框位置的训练数据集,用于后期模型的训练。
[0009]步骤2:搭建CSPDarknet53主干特征提取网络模型:CSPDarknet53作为本专利技术的主干特征提取网络,主要是用来对玻璃容器瑕疵的图片进行特征的提取,为了让图像特征更为清晰,采用transformer模型中的Multi

Head

Self

Attention注意力机制模块嵌入其中,在加载图片时做mixup以及光度失真数据增强处理。
[0010]步骤3:将原有的YOLOV5X的PANNet结构改为Bi

FPN加强特征提取网络:Bi

FPN结构应作用于主干特征提取网络之后,对主干提取网络的特征进行进一步的提取以及融合,主要包含两条路径,分别是自上而下的特征传输路径以及在下而上的特征传输路径,中间在同一级的特征层上进行跳跃连接传输特征,取消只有一条输入路径的卷积操作,并输出三种尺度的特征图。Bi

FPN的输入为步骤2中的CSP

Darknet53模型的输出,Bi

FPN的输出将传送到下一层进行预测。
[0011]步骤4:搭建YOLOV5X检测头:YOLOV5X的检测头沿用YOLOV3的检测头,分别从Bi

FPN中取出特征图进行检测,有三种不同类型的特征图,分别用来检测三种不同尺寸的特征图,分别为大中小的物体。YOLOV5X检测头输出的位置和类别结果为最终预测结果。
[0012]步骤5:通过反向传播计算损失以及更新模型、对构建好的模型进行测试,并保留测试过程结果以及训练好的模型。
[0013]进一步的,根据基于改进YOLOV5X的玻璃容器瑕疵检测方法及系统,其特征在于,所述的步骤1中,还包含以下步骤:将玻璃容器瑕疵数据集划分为训练集、测试集、验证集,比例为6:2:2,模型标签中包含物体的中心点位置以及宽高。
[0014]进一步的,根据基于改进YOLOV5X的玻璃容器瑕疵检测方法及系统,其特征在于,所述的步骤2中,还包含以下步骤:1. 将玻璃容器瑕疵目标识别模型YOLOV5X的主干特征提取网络CSPDarknet53高层特征加入MHSA模块,特征提取网络的输入维度为640*640*3,输出维度为32*32*1024。
[0015]2. 为了获取更好的训练效果,采用一些数据增强处理数据,采用基本的光度失真以及特殊的数据增强方法如Mixup,光度失真是调节图片的对比度,将泛白的图片灰度增强,Mixup是将两张样本图片对应相加求和,对于样本的标签值也相对应加权求和。
[0016]进一步的,根据基于改进YOLOV5X的玻璃容器瑕疵检测方法及系统,其特征在于,所述的步骤3中,还包含以下步骤:将原有的YOLOV5X的PANNet结构改为Bi

FPN结构,Bi

FPN的输入维度为32*32*1024,一共有三个不同的输出维度,分别对应于大中小三种物体的检测。
[0017]进一步的,根据基于改进YOLOV5X的玻璃容器瑕疵检测方法及系统,其特征在于,所述的步骤4中,还包含以下步骤:1. 从Bi

FPN结构中的不同层取出不同尺寸的特征图,尺寸分别为:[13*13][26*26][52*52]。
[0018]2. 三种检测头的输入尺寸分别为[13*13][26*26][52*52],输出为瑕疵物体的位置和类别参数。
[0019]进一步的,根据基于改进YOLOV5X的玻璃容器瑕疵检测方法及系统,其特征在于,所述的步骤5中,还包含以下步骤:1. 采用特定的对玻璃容器瑕疵识别的模型的训练方法,首先加载预训练权重保
存参数,随后进行训练,前3次迭代预训练权重不参与更新,对整体的模型参数进行建立。
[0020]2. 在完成前3次完全训练后,预训练权重参与加载,模型引入预训练权重进行更新,进行完所有训练轮次保存模型参数为pt文件,并构建模型训练过程曲线。
[0021]与现有的玻璃容器瑕疵检测技术相比,本专利技术的创新与提升主要在以下几点:1.与传统的玻璃容器瑕本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于改进YOLOV5X的玻璃容器瑕疵检测方法及系统主要有以下步骤:步骤1:利用玻璃容器瑕疵数据集进行分析标注,生成XML图片标签数据集,将其转化为TXT格式,并对其进行数量划分;步骤2:搭建CSPDarknet53—MHSA主干特征提取网络模块,在主干特征提取模块的高层卷积之后加入MHSA注意力机制模块,在加载数据时进行数据增强;步骤3:搭建Bi

FPN加强特征提取网络模块;步骤4:搭建检测头模块,其中包含3*3卷积以及1*1卷积;步骤5:通过反向传播CIOU函数计算损失以及更新模型、对构建好的模型进行测试,并保留测试过程结果以及训练好的模型。2.根据权利要求1所述的基于改进YOLOV5X的玻璃容器瑕疵检测方法及系统,步骤1所述的图像数据集其特性在于:将玻璃容器瑕疵数据集划分为训练集、测试集、验证集,比例为6:2:2,模型标签中包含物体的位置以及宽高。3.根据权利要求1所述的基于改进YOLOV5X的玻璃容器瑕疵检测方法及系统,步骤2所述的CSPDarknet53其特性在于:将玻璃容器瑕疵目标检测模型的主干特征提取网络CSPDarknet53高层特征加入MHSA模块,特征提取网络的输入维度为640*640*3,输出维度为32*32*1024;为了获取更好的训练效果,采用一些数据增强处理数据,采用基本的光度失真以及特殊的数据增强方法Mixup,光度失真是调节图片的对比度,将泛白的图片灰度增强,Mixup是将两...

【专利技术属性】
技术研发人员:周鸣乐张泽恺李刚李敏李旺刘一鸣邵瑞
申请(专利权)人:山东省计算中心国家超级计算济南中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1