一种带有标签的多类型缺陷数据集生成方法和系统技术方案

技术编号:36162878 阅读:14 留言:0更新日期:2022-12-31 20:11
本发明专利技术提供一种带有标签的多类型缺陷数据集生成方法和系统,涉及深度学习缺陷检测技术领域,该方法包括:获取无缺陷的初始图像;随机生成缺陷轮廓,获取不同类型的缺陷轮廓图像;将不同类型的缺陷轮廓图像与无缺陷的初始图像叠加,获取带有不同类型缺陷轮廓的初始图像;对带有不同类型缺陷轮廓的初始图像中的缺陷轮廓内部区域进行像素填充,获得不同类型的缺陷图像;生成与不同类型的缺陷图像相对应的标签,将不同类型的缺陷图像及其对应的标签保存为带有标签的多类型缺陷数据集;该方法能够生成多种多样的缺陷样本,并直接生成缺陷图像的标签,显著降低了缺陷数据集的获取难度,提高了工作效率。高了工作效率。高了工作效率。

【技术实现步骤摘要】
一种带有标签的多类型缺陷数据集生成方法和系统


[0001]本专利技术涉及深度学习缺陷检测
,更具体地,涉及一种带有标签的多类型缺陷数据集生成方法和系统。

技术介绍

[0002]缺陷检测是生活中和工业上非常重要的一个应用,由于缺陷多种多样,传统的机器视觉算法很难做到对缺陷特征完整的建模和迁移,复用性不大,在进行检测时会浪费大量的人力成本;深度学习在特征提取和定位上取得了非常好的效果,但缺陷样本的获取在各类缺陷检测中都是困难的,目前缺陷检测领域的数据集极其有限,有瓷砖、布匹、PCB板等,这类的缺陷样本获取也需要耗费大量的人力物力,较少的缺陷样本数据集也难以满足一个深度卷积网络对大训练数据的需求;
[0003]缺陷数据集的获取通常是在非常有限的样本上用数据增强(翻转,旋转,裁剪,缩放,平移,抖动,仿射变换等)的方法来扩充数据集;在语义分割和目标检测数据集上,数据增强方法能在一定程度上丰富数据集,但是在缺陷数据集上,由于缺陷无固定形状和颜色,并且在固定的标签上,数据增强的方法在缺陷数据集上增强局限性非常强;数据增强能在一定程度上丰富数据,但它所生成的数据也保留了原有数据的一些特点,局限性较大;
[0004]目前的现有技术公开了一种缺陷检测方法、装置、设备及存储介质,现有技术中的方法包括:获取无缺陷图像和目标检测图像;根据预设缺陷样本生成模型对所述无缺陷图像进行缺陷生成,得到仿真缺陷样本;根据所述仿真缺陷样本对所述目标检测图像进行缺陷检测,得到缺陷检测结果;现有技术中的方法虽然能增大缺陷样本数量,利用数量增加后的缺陷样本对目标检测图像进行检测识别,但缺陷样本生成种类单一,数量较少,依旧无法满足广泛应用;另外,上述方法所生成的缺陷样本需要人工进行标注标签,费时费力。

技术实现思路

[0005]本专利技术为克服上述现有技术多类型缺陷数据集获取困难的缺陷,提供一种带有标签的多类型缺陷数据集生成方法和系统,能够生成多种多样的缺陷样本,并直接生成对应的标签,省时省力。
[0006]为解决上述技术问题,本专利技术的技术方案如下:
[0007]一种带有标签的多类型缺陷数据集生成方法,包括以下步骤:
[0008]S1:获取无缺陷的初始图像;
[0009]S2:随机生成缺陷轮廓,获取不同类型的缺陷轮廓图像;
[0010]S3:将不同类型的缺陷轮廓图像与无缺陷的初始图像叠加,获取带有不同类型缺陷轮廓的初始图像;
[0011]S4:对带有不同类型缺陷轮廓的初始图像中的缺陷轮廓区域内部进行像素填充,获得不同类型的缺陷图像;
[0012]S5:生成与不同类型的缺陷图像相对应的标签,将不同类型的缺陷图像及其对应
的标签保存为带有标签的多类型缺陷数据集。
[0013]优选地,所述步骤S2中,随机生成缺陷轮廓,获取不同类型的缺陷轮廓图像的具体方法为:
[0014]所述缺陷轮廓包括闭合曲线形缺陷轮廓,所述闭合曲线形缺陷轮廓的生成方法具体为:
[0015]S2.1.1:在极坐标系下随机生成若干缺陷轮廓基点,获取每个缺陷轮廓基点对应的极角;
[0016]S2.1.2:对每个缺陷轮廓基点随机生成相应的极半径;
[0017]S2.1.3:将极坐标系下的每个轮廓基点的极角和相应的极半径转换到直角坐标系中,获得每个轮廓基点直角坐标;
[0018]S2.1.4:根据每个轮廓基点直角坐标,利用预设函数进行曲线拟合,获取若干闭合曲线形缺陷轮廓图像。
[0019]优选地,所述步骤S2.1.3中,将极坐标系下的每个轮廓基点的极角和相应的极半径转换到直角坐标系中,获得每个轮廓基点直角坐标,具体方法为:
[0020]将极坐标系下的第i个轮廓基点的极角α
i
和极半径R
i
转换到直角坐标系,转换公式具体为:
[0021]x
i
=R
i
*cos(α
i
)
[0022]y
i
=R
i
*sin(α
i
)
[0023]其中,x
i
和y
i
分别为第i个轮廓基点直角坐标的横坐标和纵坐标。
[0024]优选地,所述步骤S2.1.4中,预设函数具体为interp1d()插值函数。
[0025]优选地,所述步骤S2中,随机生成缺陷轮廓,获取不同类型的缺陷轮廓图像的具体方法为:
[0026]所述缺陷轮廓还包括长形缺陷轮廓,所述长形缺陷轮廓的生成方法具体为:
[0027]S2.2.1:在极坐标下,在(0,π)范围内随机选取两个极角,两个极角的角度值之差小于预设角度阈值;
[0028]S2.2.2:将两个极角中任意一个极角与随机极角相加,另一个极角保持不变,获得第一极角和第二极角;
[0029]S2.2.3:分别对第一极角和第二极角随机生成对应的长形缺陷轮廓极半径;
[0030]S2.2.4:根据第一极角和第二极角及其对应的长形缺陷轮廓极半径获取长形缺陷轮廓;
[0031]S2.2.5:重复步骤S2.2.1

2.2.4,获取若干长形缺陷轮廓。
[0032]优选地,所述步骤S3中,将不同类型的缺陷轮廓图像与无缺陷的初始图像叠加,获取带有不同类型缺陷轮廓的初始图像,具体方法为:
[0033]S3.1:将无缺陷的初始图像转换为灰度图并获取初始图像长宽数据;
[0034]S3.2:利用第一检测函数检测所述灰度图的轮廓,获得灰度图轮廓点数据;
[0035]S3.3:利用第二检测函数检测所述灰度图轮廓点数据中的最小矩形框,获得矩形框左上角坐标和矩形框长宽数据;
[0036]S3.4:将矩形框左上角坐标添加随机值,获得叠加坐标,记为(x+x
add
,y+y
add
),其中x
add
和y
add
分别为矩形框左上角横坐标和纵坐标的随机值,所述随机值的大小小于初始图像
长宽数据的大小;将不同类型的缺陷轮廓图像的某一点与叠加坐标重合,获取带有不同类型缺陷轮廓的初始图像。
[0037]优选地,所述步骤S3中,所述第一检测函数为cv2.findContours()函数,所述第二检测函数为cv2.boundingRect()函数。
[0038]优选地,所述步骤S4中,对带有不同类型缺陷轮廓的初始图像中的缺陷轮廓区域内部进行像素填充,获得不同类型的缺陷图像,具体方法为:
[0039]根据叠加坐标和矩形框长宽数据对带有不同类型缺陷轮廓的初始图像进行部分扫描,判断包含叠加坐标的最小矩形框中灰度图轮廓点的数量;当灰度图轮廓点的数量大于1时,获取包含叠加坐标的最小矩形框中灰度图轮廓点的纵坐标最大值y
max
和最小值y
min
,对缺陷轮廓区域内部(x+x
add...

【技术保护点】

【技术特征摘要】
1.一种带有标签的多类型缺陷数据集生成方法,其特征在于,包括以下步骤:S1:获取无缺陷的初始图像;S2:随机生成缺陷轮廓,获取不同类型的缺陷轮廓图像;S3:将不同类型的缺陷轮廓图像与无缺陷的初始图像叠加,获取带有不同类型缺陷轮廓的初始图像;S4:对带有不同类型缺陷轮廓的初始图像中的缺陷轮廓区域内部进行像素填充,获得不同类型的缺陷图像;S5:生成与不同类型的缺陷图像相对应的标签,将不同类型的缺陷图像及其对应的标签保存为带有标签的多类型缺陷数据集。2.根据权利要求1所述的一种带有标签的多类型缺陷数据集生成方法,其特征在于,所述步骤S2中,随机生成缺陷轮廓,获取不同类型的缺陷轮廓图像的具体方法为:所述缺陷轮廓包括闭合曲线形缺陷轮廓,所述闭合曲线形缺陷轮廓的生成方法具体为:S2.1.1:在极坐标系下随机生成若干缺陷轮廓基点,获取每个缺陷轮廓基点对应的极角;S2.1.2:对每个缺陷轮廓基点随机生成相应的极半径;S2.1.3:将极坐标系下的每个轮廓基点的极角和相应的极半径转换到直角坐标系中,获得每个轮廓基点直角坐标;S2.1.4:根据每个轮廓基点直角坐标,利用预设函数进行曲线拟合,获取若干闭合曲线形缺陷轮廓图像。3.根据权利要求2所述的一种带有标签的多类型缺陷数据集生成方法,其特征在于,所述步骤S2.1.3中,将极坐标系下的每个轮廓基点的极角和相应的极半径转换到直角坐标系中,获得每个轮廓基点直角坐标,具体方法为:将极坐标系下的第i个轮廓基点的极角α
i
和极半径R
i
转换到直角坐标系,转换公式具体为:x
i
=R
i
*cos(α
i
)y
i
=R
i
*sin(α
i
)其中,x
i
和y
i
分别为第i个轮廓基点直角坐标的横坐标和纵坐标。4.根据权利要求2所述的一种带有标签的多类型缺陷数据集生成方法,其特征在于,所述步骤S2.1.4中,预设函数具体为interp1d()插值函数。5.根据权利要求1所述的一种带有标签的多类型缺陷数据集生成方法,其特征在于,所述步骤S2中,随机生成缺陷轮廓,获取不同类型的缺陷轮廓图像的具体方法为:所述缺陷轮廓还包括长形缺陷轮廓,所述长形缺陷轮廓的生成方法具体为:S2.2.1:在极坐标下,在(0,π)范围内随机选取两个极角,两个极角的角度值之差小于预设角度阈值;S2.2.2:将两个极角中任意一个极角与随机极角相加,另一个极角保持不变,获得第一极角和第二极角;S2.2.3:分别对第一极角和第二极角随机生成对应的长形缺陷轮廓极半径;S2.2.4:根据第一极角和第二极角及其对应的长形缺陷轮廓极半径获取长形缺陷轮
廓;S2.2.5:重复步骤S2.2.1

2.2.4,获取若干长形缺陷轮廓。6.根据权利要求1所述的一种带有标签的多类型缺陷数据集生成方法,其特征在于,所述步骤S3中,将不同类型的缺陷轮廓图像与无缺陷的初始图像叠加,获取带有不同类型...

【专利技术属性】
技术研发人员:李志忠黄秋灵
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1