缺陷特征识别的有效抽象描述方法技术

技术编号:35581145 阅读:59 留言:0更新日期:2022-11-12 16:10
本发明专利技术涉及缺陷识别的领域,尤其涉及缺陷特征的有效抽象描述方法,其步骤为:S100、采集零部件的缺陷信息,得到样本数据,对样本数据集进行一致性检查,对样本数据集进行缺失值、异常值处理;S200、将样本数据进行中心标准化处理;S300、以合成特征的方式对特征物理量进行降维,形成少数有效描述缺陷的抽象特征;S400、将生成的抽象特征依次排序,计算抽象特征的方差贡献率及方差累计贡献率,确定抽象特征个数;S500、对确定的抽象特征进行提取,生成少于原始特征物理量维度新的数据集,新的数据集放入集成算法内进行预测,与原始数据集预测的结果对比,得出结论,算法完成。本发明专利技术减少了工业零部件缺陷的识别不准确的情况。工业零部件缺陷的识别不准确的情况。工业零部件缺陷的识别不准确的情况。

【技术实现步骤摘要】
缺陷特征识别的有效抽象描述方法


[0001]本专利技术涉及缺陷识别的领域,尤其涉及缺陷特征的有效抽象描述方法。

技术介绍

[0002]在工业质检当中,通过设备机台检测工业零部件的表面缺陷,零部件一般为电子3C类零部件,如手机外壳、笔记本外壳、手机配件等,零部件的表面缺陷为刮伤、碰伤、刀纹等,数据样本量远远小于合格(良品)数据样本量,并且描述同一样本的特征物理量非常多的情况,以及数据集中、不同缺陷样本分类不均衡造成某些缺陷样本数量小于特征物理量维度的情况,以上这些情况使样本数量小于特征物理量的缺陷数据无法在现有集成算法当中进行训练及识别。
[0003]目前集成算法只能对样本数量大于特征物理量的缺陷数据识别或导致识别错误,这就直接导致了工业零部件缺陷的识别不准确,造成集成算法生成的工业质检数据与实际现场人工核对存在误差。

技术实现思路

[0004]本专利技术要解决的技术问题是:为了解决工业零部件缺陷的识别不准确,造成集成算法生成的工业质检数据与实际现场人工核对存在误差的问题,本专利技术提供一种可以不受数据样本量约束,并对缺陷特征进行降维的缺陷特征识别的有效抽象描述方法。
[0005]本专利技术解决其技术问题所采用的技术方案是:一种缺陷特征识别的有效抽象描述方法,其步骤为:
[0006]S100、、通过设备机台采集工业零部件的缺陷信息,得到零部件的样本数据,对样本数据集进行一致性检查,并对样本数据集进行缺失值、异常值处理;
[0007]S200、将样本数据进行中心标准化处理,便于不同物理量之间能够进行比较和加权;
[0008]S300、以合成特征的方式对特征物理量进行降维,形成少数可以有效描述缺陷的抽象特征;
[0009]S400、将生成的抽象特征依次排序,并计算抽象特征的方差贡献率及方差累计贡献率,确定抽象特征的个数;
[0010]S500、对确定的抽象特征进行提取,生成少于原始特征物理量维度新的数据集,新的数据集放入集成算法内进行预测,与集成算法内的原始数据集在现有集成算法内预测的结果进行对比,得出结论,算法完成。
[0011]本专利技术属于数据的特征降维,与集成算法协同合作,可以使算法不受特征物理量维度的桎梏,减少工业零部件缺陷的识别出现不准确的情况,减少工业零部件的不同缺陷在设备上识别出现断层,减少集成算法生成的工业质检数据与实际现场人工核对存在的误差,从而提高模型精确度,降低现场工作难度。在满足工业现场的动态需求情况下,提高执行效率,降低已有集成算法的训练成本和影响。采用本专利技术进行特征降维成本低并且准确
率高,尤其适用于新出现的小样本量缺陷类型或样本数据不均衡的情况,降低了由于数据量过小导致的工业设备识别的不准确性,克服了由于光照条件、相机角度、工件差异、亮度湿度等导致的缺陷物理量描述不一的不利因素,辅助完成对多项目多缺陷的缺陷精准检测及划分。
[0012]进一步,为了提高对样本数据检测的准确率和提高执行效率,步骤100中,检查样本数据有无缺失和检查数据是否在实际物理量取值范围之内。
[0013]进一步,为了提高了后续检测步骤的准确性,减少由于物理量单位和取值范围不同造成后续步骤结果的偏差,提高对样本数据检测的准确率,步骤200中,将样本数据进行中心标准化处理后,去除物理量之间的单位限制,转化为无量纲的纯数值数据。
[0014]进一步,步骤200中,中心标准化处理公式如下,对某特征物理量序列x1、x2、x3、......、x
n
进行标准化转换,计算公式可以如下:
[0015][0016]n表示数据样本量,x表示某个特征物理量,x
i
为某特征物理量数值,
[0017]s表示标准差,y
i
为中心标准化转换后的物理量,i为取值范围在[1,n]的正整数。
[0018]进一步,由于特征维度高,多个特征物理量之间的关系可能存在多重共线性,抽象特征是由多个特征合成得到,合成特征是通过一定方法将多个特征(原始特征)线性组合形成少数特征,合成后的特征属于可以有效描述缺陷的抽象特征,但其不具有实际物理意义,因此,使缺陷数据的不确定性较小且去除了部分冗余特征,克服了不同类样本之间混叠的现象,步骤300中,合成特征属于有效描述缺陷的抽象特征,抽象特征合成方法:
[0019]Z1=φ
11
Y1+φ
21
Y2+φ
31
Y3+...+φ
p1
Y
p

[0020]其中,Z1表示第一个抽象特征,Y表示中心标准化后的原始物理量特征,p表示原始特征物理量的维度,φ
p1
表示第p个原始特征Y
p
在第一个抽象特征Z1上面的相关系数。
[0021]进一步,通过计算方差得到特征向量,找到一组抽象特征对应的正交特征向量Φ1(Φ1=(φ
11
,φ
21
,...,φ
p1
),使得Z1的方差最大,方差最大化公式为:
[0022][0023]且
[0024]其中,n表示数据样本量,j表示第j个原始特征,j为取值范围在[1,p]的正整数。
[0025]进一步,将抽象特征中的原始特征对应的特征值写作λ,且λ1≥λ2≥

≥λ
p
。且抽象特征满足∑Φ
j
=λ
j
Φ
j
,λ
jT
λ
j
=1,λ
jT
λ非j的任意特征=0。
[0026]进一步,将生成的抽象特征Z1,.....,Z
p
依次排序,并计算方差贡献率及方差累计贡献率,计算公式如下:
[0027]抽象特征Z
j
的方差为var(Z
j
)=Φ
jT
∑Φ
j
=Φ
jT
λ
j
Φ
j
=λ
j
Φ
jT
Φ
j
=λ
j

[0028]第m个抽象特征Z
m
的方差贡献率为:m为取值范围在[1,p]的正整数;
[0029]前m个抽象特征Z1,Z2,...,Z
m
的方差累计贡献率为:
[0030]进一步,步骤S500中,抽象特征数据集预测结果高于原始数据集预测结果,证明抽象特征描述为真实有效的缺陷特征降维方法,则算法完成。
[0031]本专利技术的有益效果是,本专利技术的关键在于,其充分迎合了工业现场新出现的小样本量缺陷类型或样本数据不均衡导致某些类别数量极少的情况,具有以下两个特点:
[0032]1、未知新缺陷数据往往存在样本量极小但每个样本数据都很珍贵,在没有历史数据支撑的情况下,很难将数据量极少的缺陷识别出来,因此,本专利技术将原始物理量特征进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种缺陷特征识别的有效抽象描述方法,其步骤为:S100、通过设备机台采集工业零部件的缺陷信息,得到零部件的样本数据,对样本数据集进行一致性检查,并对样本数据集进行缺失值、异常值处理;S200、将样本数据进行中心标准化处理,便于不同物理量之间能够进行比较和加权;S300、以合成特征的方式对特征物理量进行降维,形成少数可以有效描述缺陷的抽象特征;S400、将生成的抽象特征依次排序,并计算抽象特征的方差贡献率及方差累计贡献率,确定抽象特征的个数;S500、对确定的抽象特征进行提取,生成少于原始特征物理量维度新的数据集,新的数据集放入集成算法内进行预测,与集成算法内的原始数据集在现有集成算法内预测的结果进行对比,得出结论,算法完成。2.如权利要求1所述的缺陷特征识别的有效抽象描述方法,其特征在于:步骤100中,检查样本数据有无缺失和检查数据是否在实际物理量取值范围之内。3.如权利要求1所述的缺陷特征识别的有效抽象描述方法,其特征在于:步骤200中,将样本数据进行中心标准化处理后,去除物理量之间的单位限制,转化为无量纲的纯数值数据。4.如权利要求3所述的缺陷特征识别的有效抽象描述方法,其特征在于:步骤200中,中心标准化处理公式如下,对某特征物理量序列x1、x2、x3、......、x
n
进行标准化转换,计算公式可以如下:n表示数据样本量,x表示某个特征物理量,x
i
为某特征物理量数值,s表示标准差,y
i
为中心标准化转换后的物理量,i为取值范围在[1,n]的正整数。5.如权利要求1所述的缺陷特征识别的有效抽象描述方法,其特征在于:步骤300中,合成特征属于有效描述缺陷的抽象特征,抽象特征合成公式为:抽象特征合成方法:Z1=φ
11
Y1+φ
21
Y2+φ
31
Y3+...+φ
p1
Y
p
;其中,Z1表示第一个抽象特征,Y表示中心标准化后的原始物理量特征,p表示原始特征物理量的维度,φ
p1

【专利技术属性】
技术研发人员:邱增帅王罡童竹勍潘正颐侯大为
申请(专利权)人:常州微亿智造科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1