基于组合优化算法的工业零部件缺陷检测区间聚类方法技术

技术编号:30447807 阅读:19 留言:0更新日期:2021-10-24 18:41
本发明专利技术公开了一种基于组合优化算法的工业零部件缺陷检测区间聚类方法,具体步骤如下:第1步骤、采集数据;第2步骤、数据清洗;第3步骤、平衡数据分布;第4步骤、特征选择;第5步骤、选取正样本数据点,设置区间组合,逐步收缩区间进行优化,生成规则;第6步骤、将规则内的数据从数据集中去除,余下数据重复第5步骤,直到所有正样本均被规则选出,得到一系列规则描述,组合优化逼近算法结束。该方法对工业零部件的不同缺陷各个光学面进行正负样本的组合优化聚类区分,并且具有一定的鲁棒性,以确保可以得到多项目的缺陷精准检测及划分。可以得到多项目的缺陷精准检测及划分。可以得到多项目的缺陷精准检测及划分。

【技术实现步骤摘要】
基于组合优化算法的工业零部件缺陷检测区间聚类方法


[0001]本专利技术涉及图像数据处理的
,尤其是一种基于组合优化算法的工业零部件缺陷检测区间聚类方法。

技术介绍

[0002]目前,基于图像数据处理的方法大多是根据经验选取物理量区间进行聚类,物理量权重、光学面及缺陷种类的不同影响着正负样本划分的准确性,存在很多的局限性。最明显的就是线状缺陷的长宽物理量权重较大,不考虑面积物理量;块状缺陷则是缺陷的面积物理量权重较大,不考虑长宽物理量。这导致部分区间组合并不是较优的结果。同时,相同缺陷的光学面不同,使得设置区间组合变得复杂。然而,为了精确的进行工业数据分析,必须找到工件准确的正负样本划分。

技术实现思路

[0003]本专利技术要解决的技术问题是:为了解决上述
技术介绍
中存在的问题,提供一种基于组合优化算法的工业零部件缺陷检测区间聚类方法,对工业零部件的不同缺陷各个光学面进行正负样本的组合优化聚类区分,并且具有一定的鲁棒性,以确保可以得到多项目的缺陷精准检测及划分。
[0004]本专利技术解决其技术问题所采用的技术方案是:一种基于组合优化算法的工业零部件缺陷检测区间聚类方法,具体步骤如下:第1步骤、采集数据:由设备机台拍摄出工件图片,读取原始图片中的轮廓点,完成数据采集工作;第2步骤、数据清洗:进行数据一致性检查、数据缺失值处理以及数据异常值处理;第3步骤、平衡数据分布:由于变量数据类别分布不平衡,正样本数量极少,负样本数量极多,考虑数据的特殊性采用过采样方法进行平衡,随机复制正样本数据,将正样本的数量扩充到负样本的数量;第4步骤、特征选择:使用过滤法对扩充后的数据进行特征选择,以方差作为特征评分标准,从扩充前的数据中选择前 k个贡献度最大的特征进行组合优化,k表示特征选择之后的物理量个数,1≤k≤数据总物理量数,且k是正整数;第5步骤、选取正样本数据点,设置区间组合,逐步收缩区间进行优化,生成规则,具体步骤如下:第5.1步骤、选取正样本数据点,设置区间组合:首先从特征选择后的数据集中随机选取正样本数据点M,然后以数据集中各物理量的极大值、极小值为区间边界形成区间组合;第5.2步骤、逐步收缩区间进行优化,生成规则:再以点M在区间组合内的条件下,收缩区间组合,过滤负样本,直到区间组合内负样本数量小于等于一定比例且正样本数量最多,则将该区间组合设置为一个规则;
第6步骤、将规则内的数据从数据集中去除,余下数据重复第5步骤,直到所有正样本均被规则选出,得到一系列规则描述,组合优化逼近算法结束,即从数据集中去除规则内的数据,并用余下数据重复第5步骤直到数据中没有正样本,得出一组规则描述将正负样本进行较优划分。
[0005]进一步具体地限定,上述技术方案中,在第5步骤的第5.2步骤中,如果区间组合内负样本数量小于等于一定比例,且正样本数量最多,则该区间组合为局部优化规则,从数据集中去除选定规则内的数据;如果区间组合内负样本数量不是小于等于一定比例,且正样本数量不是最多,则重复第5.2步骤,以点M在区间组合内的条件下,收缩区间组合,过滤负样本。
[0006]进一步具体地限定,上述技术方案中,在第5步骤的第5.2步骤中,如果区间组合内负样本数量不是小于等于一定比例,且正样本数量最多,则重复第5.2步骤;如果区间组合内负样本数量小于等于一定比例,且正样本数量不是最多,则重复第5.2步骤。
[0007]进一步具体地限定,上述技术方案中,在第6步骤中,完整的算法流程结束后,生成了一系列规则描述并实施,如果有新的数据集,新的数据集含有正样本,且不符合现有已生成的规则,则将新数据集放入算法内重复第5步骤;如果新数据集没有正样本,则得到一系列规则描述,组合优化逼近算法结束。
[0008]进一步具体地限定,上述技术方案中,在第4步骤中,特征物理量的方差计算公式如下:
ꢀꢀꢀꢀ
(1)其中,S2表示特征物理量的方差;表示点物理量X的平均数;表示该物理量在每条数据上的值;n表示数据集中含正负样本的样本总个数。
[0009]本专利技术的有益效果是:本专利技术的一种基于组合优化算法的工业零部件缺陷检测区间聚类方法,通过对缺陷物理量的特征筛选,以减少规则数量,使用组合优化逼近对数据进行样本划分,使得规则内的正样本数量较多,负样本数量维持在相对比例以内,这样就得到了该缺陷光学面下的正负样本组合优化逼近的一系列规则描述;该可以对工业零部件的不同缺陷各个光学面进行正负样本的聚类区分,同时使得区间规则具有一定的鲁棒性,克服了由于光照条件、工件材质、工件形状等导致的缺陷物理量描述不一的不利因素,完成对多项目的缺陷精准检测及划分。
附图说明
[0010]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0011]图1是工业相机采集原图;
图2是缺陷分布坐标图;图3是缺陷面积与最小平均亮度分布图;图4是组合优化逼近算法流程图;图5是缺陷面积与最小平均亮度规则划分图;图6是缺陷面积与最小平均亮度规则划分逼近中的图;图7是缺陷面积与最小平均亮度规则划分局部最优图;图8是本专利技术的算法流程图。
具体实施方式
[0012]为了使本专利技术所解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0013]见图4和图8,本专利技术的一种基于组合优化算法的工业零部件缺陷检测区间聚类方法,具体步骤如下:第1步骤、采集数据:由设备机台拍摄出工件图片,读取原始图片中的轮廓点(像素坐标),完成数据采集工作。其中,设备机台可以是电子3C类表面缺陷外观检测设备。工件是电子3C类工件,如手机外壳、笔记本外壳、手机配件等。
[0014]第2步骤、数据清洗:进行数据一致性检查、数据缺失值处理以及数据异常值处理;一致性检查即检查数据当中各物理量下有无极大值或极小值等与该物理量下大部分数值不同的数据。数据缺失值处理即某条数据中有缺失的数值时,删除该条数据。数据异常值处理即某条数据在某个或某几个物理量下的数值超过了该物理量的取值范围,删除该条数据。
[0015]第3步骤、平衡数据分布:由于变量数据类别分布不平衡,正样本数量极少,负样本数量极多,考虑数据的特殊性采用过采样方法进行平衡,这里的数据均为常量数据,是具有实际意义的真实数据。随机复制正样本数据,将正样本的数量扩充到负样本的数量;本专利技术主要用于缺陷检测,默认缺陷数据为正样本数据,所有非缺陷的数据均为负样本数据。数据为工业真实数据,所有正样本均为缺陷数据,在不遗漏正样本数据的前提下平衡数据分布;选用过采样方法进行平衡,分别统计正/负样本数量,在正样本数据中有放回的随机抽取并复制到正样本数据中,直到正样本的数量与负样本数量相同本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于组合优化算法的工业零部件缺陷检测区间聚类方法,其特征在于,具体步骤如下:第1步骤、采集数据:由设备机台拍摄出工件图片,读取原始图片中的轮廓点,完成数据采集工作;第2步骤、数据清洗:进行数据一致性检查、数据缺失值处理以及数据异常值处理;第3步骤、平衡数据分布:由于变量数据类别分布不平衡,正样本数量极少,负样本数量极多,考虑数据的特殊性采用过采样方法进行平衡,随机复制正样本数据,将正样本的数量扩充到负样本的数量;第4步骤、特征选择:使用过滤法对扩充后的数据进行特征选择,以方差作为特征评分标准,从扩充前的数据中选择前 K个贡献度最大的特征进行组合优化,K表示特征选择之后的物理量个数,1≤K≤数据总物理量数,且K是正整数;第5步骤、选取正样本数据点,设置区间组合,逐步收缩区间进行优化,生成规则,具体步骤如下:第5.1步骤、选取正样本数据点,设置区间组合:首先从特征选择后的数据集中随机选取正样本数据点M,然后以数据集中各物理量的极大值、极小值为区间边界形成区间组合;第5.2步骤、逐步收缩区间进行优化,生成规则:再以点M在区间组合内的条件下,收缩区间组合,过滤负样本,直到区间组合内负样本数量小于等于一定比例且正样本数量最多,则将该区间组合设置为一个规则;第6步骤、将规则内的数据从数据集中去除,余下数据重复第5步骤,直到所有正样本均被规则选出,得到一系列规则描述,组合优化逼近算法结束,即从数据集中去除规则内的数据,并用余下数据重复第5步骤直到数据中没有正样本,得出一组规则描述将正负样本进行较...

【专利技术属性】
技术研发人员:邱增帅王罡侯大为潘正颐
申请(专利权)人:常州微亿智造科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1