一种复杂混叠场景下多类别五金件的快速识别方法技术

技术编号:32658387 阅读:37 留言:0更新日期:2022-03-17 11:07
本公开提供了一种复杂混叠场景下多类别五金件的快速识别方法,涉及计算机图像识别技术领域,该方法包括获取训练样本集,所述训练样本集中的训练样本包括图像以及该图像对应的xml格式文件,所述xml格式文件用于标注对应的图像中五金件的位置和类别;将所述训练样本集输入基于yolov5改进的模型进行训练,生成五金件检测模型;获取待检测的图像,将所述待检测的图像输入五金件检测模型进行检测,对所述待检测的图像中包含的五金件进行识别;输出所述待检测的图像中包含的五金件的位置和类别;本公开能够在五金件杂乱摆放的场景下,准确地识别出其类别与位置。识别出其类别与位置。识别出其类别与位置。

【技术实现步骤摘要】
一种复杂混叠场景下多类别五金件的快速识别方法


[0001]本公开涉及但不限于计算机图像识别
,尤其涉及一种复杂混叠场景下多类别五金件的快速识别方法。

技术介绍

[0002]对于五金件生产加工行业而言,五金件表面存在反光强烈现象以及加工现场光照条件复杂等因素,这对机器视觉检测技术的应用带来较大挑战,尤其是在上下料及分拣环节中,多种类别五金件由于随意摆放会出现外轮廓相互粘连、混叠和遮挡的情况,导致现有的视觉检测算法在五金件识别及定位过程中会出现误识别率高、识别速度慢及定位精度差的问题,无法有效辅助工业机器人实现五金件的智能抓取。
[0003]如今普遍的做法通过是修改目标检测算法程序的运行参数,使用分辨率更加清晰的输出图像,改变训练验证样本比例,改进损失函数等方式提高识别算法的精度。但是对于相互粘连、混叠和遮挡的五金件识别效果并不能有很大的性能提升,反而会因为添加或修改算法导致算法的速度下降,无法进行实时检测。

技术实现思路

[0004]以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
[0005]本公开实施例提供了一种复杂混叠场景下多类别五金件的快速识别方法,为了解决现有视觉检测算法在多类别五金件复杂混叠场景中出现的误检及漏检问题,本专利技术提出了一种复杂混叠场景下多类别五金件的快速识别算法,能够在五金件杂乱摆放的场景下,准确地识别出其类别与位置,为工业机器人实现五金件智能抓取打下坚实的基础。
[0006]本公开实施例提供了一种复杂混叠场景下多类别五金件的快速识别方法,包括:
[0007]步骤S100,获取训练样本集,所述训练样本集中的训练样本包括图像以及该图像对应的xml格式文件,所述xml格式文件用于标注对应的图像中五金件的位置和类别;
[0008]步骤S200,将所述训练样本集输入基于yolov5改进的模型进行训练,生成五金件检测模型;
[0009]步骤S300,获取待检测的图像,将所述待检测的图像输入五金件检测模型进行检测,对所述待检测的图像中包含的五金件进行识别;
[0010]步骤S400,输出所述待检测的图像中包含的五金件的位置和类别。
[0011]在一些实施例中,步骤S200中,所述将所述训练样本集输入基于yolov5改进的模型进行训练,生成五金件检测模型,包括但不限于有以下步骤:
[0012]步骤S210,搭建YOLOv5模型;其中,所述YOLOv5模型包括:输入端、Backbone端、Neck端和输出端;
[0013]步骤S220,将初始化的YOLOv5模型中的Anchor值设置为四组,在Neck端中增加一组特征融合模块,将YOLOv5模型的输出端设置为四层,得到基于yolov5改进的模型;其中,
所述特征融合模块包含一个CSP2_X结构,一个CBL结构,一个上采样操作模块和一个Concat操作模块;
[0014]步骤S230,获取对基于yolov5改进的模型进行训练的训练参数,将所述训练样本集输入基于yolov5改进的模型进行训练;其中,所述训练参数包括:目标类别数,网络深度,网络宽度,批量大小,输入端接收图像的尺寸,初始学习率,网络的权重衰减率,以及动量参数;
[0015]步骤S240,将完成训练的基于yolov5改进的模型作为五金件检测模型。
[0016]在一些实施例中,所述目标类别数为3,网络深度为0.33,网络宽度为0.5,批量大小为1,初始学习率为0.01,网络的权重衰减率是0.0005,动量参数为0.8。
[0017]在一些实施例中,在训练过程中所述训练样本集被迭代的次数为100。
[0018]在一些实施例中,所述训练样本集中图像的尺寸为640*640。
[0019]在一些实施例中,所述方法还包括:
[0020]步骤S101,选取不同规格的螺栓、螺母和垫片随机摆放的图像作为实验数据集;
[0021]步骤S102,使用LabelImg标注工具对实验数据集中图像内的五金件的位置和类别进行标注,生成实验数据集中每张图像对应的xml格式文件;其中,所述xml格式文件包含对应的图像中五金件的位置和类别;
[0022]步骤S103,对实验数据集中的每张图像,以及每张图像对应的xml格式文件进行数据增强操作,得到训练样本集;其中,所述数据增强操作包括旋转、翻转变化和裁剪。
[0023]本公开实施例包括:获取训练样本集,所述训练样本集中的训练样本包括图像以及该图像对应的xml格式文件,所述xml格式文件用于标注对应的图像中五金件的位置和类别;将所述训练样本集输入基于yolov5改进的模型进行训练,生成五金件检测模型;获取待检测的图像,将所述待检测的图像输入五金件检测模型进行检测,对所述待检测的图像中包含的五金件进行识别;输出所述待检测的图像中包含的五金件的位置和类别。
[0024]本公开的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本公开而了解。本公开的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
[0025]附图用来提供对本公开技术方案的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开的技术方案,并不构成对本公开技术方案的限制。
[0026]图1是本公开一个实施例提供的复杂混叠场景下多类别五金件的快速识别方法的流程图;
[0027]图2是本公开一个实施例中基于yolov5改进的模型的结构图。
具体实施方式
[0028]为了使本公开的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本公开进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本公开,并不用于限定本公开。
[0029]需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻
辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书、权利要求书或上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
[0030]如图1所示,图1是本公开一个实施例提供的一种复杂混叠场景下多类别五金件的快速识别方法的流程图,在该方法中,包括但不限于有以下步骤:
[0031]步骤S100,获取训练样本集,所述训练样本集中的训练样本包括图像以及该图像对应的xml格式文件,所述xml格式文件用于标注对应的图像中五金件的位置和类别;
[0032]步骤S200,将所述训练样本集输入基于yolov5改进的模型进行训练,生成五金件检测模型;
[0033]步骤S300,获取待检测的图像,将所述待检测的图像输入五金件检测模型进行检测,对所述待检测的图像中包含的五金件进行识别;
[0034]步骤S400,输出所述待检测的图像中包含的五金件的位置和类别。
[0035]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种复杂混叠场景下多类别五金件的快速识别方法,其特征在于,包括:步骤S100,获取训练样本集,所述训练样本集中的训练样本包括图像以及该图像对应的xml格式文件,所述xml格式文件用于标注对应的图像中五金件的位置和类别;步骤S200,将所述训练样本集输入基于yolov5改进的模型进行训练,生成五金件检测模型;步骤S300,获取待检测的图像,将所述待检测的图像输入五金件检测模型进行检测,对所述待检测的图像中包含的五金件进行识别;步骤S400,输出所述待检测的图像中包含的五金件的位置和类别。2.根据权利要求1所述的复杂混叠场景下多类别五金件的快速识别方法,其特征在于,步骤S200中,所述将所述训练样本集输入基于yolov5改进的模型进行训练,生成五金件检测模型,包括但不限于有以下步骤:步骤S210,搭建YOLOv5模型;其中,所述YOLOv5模型包括:输入端、Backbone端、Neck端和输出端;步骤S220,将初始化的YOLOv5模型中的Anchor值设置为四组,在Neck端中增加一组特征融合模块,将YOLOv5模型的输出端设置为四层,得到基于yolov5改进的模型;其中,所述特征融合模块包含一个CSP2_X结构,一个CBL结构,一个上采样操作模块和一个Concat操作模块;步骤S230,获取对基于yolov5改进的模型进行训练的训练参数,将所述训练样本集输入基于yolov5改进的模型进行训...

【专利技术属性】
技术研发人员:卢清华严光源张云志
申请(专利权)人:佛山科学技术学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1