一种表面缺陷的分析方法技术

技术编号:15499889 阅读:145 留言:0更新日期:2017-06-03 22:00
本发明专利技术涉及表面缺陷的分析方法,第一步,收集在线检测系统的缺陷及其原因数据;第二步,将检测系统中数据收集存入数据库中,一方面直接进入缺陷分类库,另一方面经过专家判定进入缺陷原因库;第三步,运用加权模糊层次关联关系算法找出缺陷与原因之间的关系通过正反馈更新缺陷库以及原因库信息。本发明专利技术通过数据关联关系挖掘的算法找出原因与原因、原因与缺陷、缺陷与缺陷之间的关联关系,然后将这些关系反馈到缺陷库和原因库中。在缺陷库中将有关联关系的缺陷自动归类,缺陷原因有相关性的也自动归类。本发明专利技术通过关联关系匹配的方法把有关联的缺陷与原因进行归类后,加快了查询缺陷发生原因对应的类别。

An analytical method for surface defects

The analysis method, the present invention relates to the surface defects of the first step, the data collection of defects and causes of the online detection system; the second step, the detection system to collect data stored in the database, a defect classification directly into the library, on the other hand, through expert judgment into the defect base; third step, the relationship between the use of weighted fuzzy relation the relationship between algorithm to identify the defects and reasons through positive feedback and update the defect library library information. The invention discovers the relation between the cause and the cause, the reason and the defect, the defect and the defect through the algorithm of the data association relation mining, and then returns the relation to the defect database and the reason library. The defects in the defect library are automatically classified, and the reasons for defects are classified automatically. The invention classifies the related defects and causes by the method of association relation matching, thereby speeding up the categories corresponding to the causes of the query defects.

【技术实现步骤摘要】
一种表面缺陷的分析方法
本专利技术属于缺陷原因的匹配方法,具体是利用数据关联匹配的方法对缺陷及其对应的原因进行更新归类。
技术介绍
随着信息技术在钢铁工业广泛应用,钢铁企业管理者逐步认识到信息的价值及其在提升企业生产效率与效益中的重要性,并开始投入大量人力、财力、物力收集和储存各类信息,但钢铁企业仅对相关信息实现了简单应用,缺乏对信息内在属性和规律的挖掘。钢铁工业泛在信息间通常存在各种关联关系,通过合适的方法和手段,获得信息间的关联关系,将无序的原始信息梳理为方便用户使用的有序的信息资源,是提升信息价值的重要途径。由于目前缺陷原因数据的分类主要依靠一些传统的分类方法,比如支持向量机、决策树、神经网络、遗传算法等。并且这类的分类方法大多依靠提取特征来划分类别,并且会将同一种元的划分为一块,并未将挖掘出不同元不同维度的数据进行归类。
技术实现思路
本专利技术提供一种表面缺陷原因的多维多元分析方法,克服现有技术的不足,有效解决复杂的缺陷分类和缺陷原因分类后的只在同一元中的类别,而不能找出不同元之间的关联关系的问题,本专利技术通过将缺陷分类方法与数据关联匹配方法结合起来,利用数据关联挖掘的结果去更新缺陷分类后的结果,让缺陷数据库和缺陷原因数据库中的数据更加具有参考价值。本专利技术解决上述问题所采用的技术方案为:一种表面缺陷的分析方法,包括如下步骤步骤1:收集在线检测系统的缺陷及其原因的数据;将从生产现场获得历史缺陷数据,根据文本推荐的方法将缺陷进行初步划分,缺陷原因按照来源可以分为:来料、设备、工艺、生产,对应下文矩阵中的横向;步骤2:分别将缺陷以及缺陷原因按照来源建立数据库。1)建立缺陷原因数据库,把每一种产生的缺陷原因首先根据部门所属的不同进行划分,然后进行连续编号;如工艺部门缺陷原因A编号为:GY-WA1、GY-WA2……;来料部门缺陷原因B编号:LL-WB1、LL-WB2……;设备部门缺陷原因C编号:SB-WC1、SB-WC2……;生产部门缺陷原因D编号:SC-WD1、SC-WD2……2)建立缺陷库,根据文本推荐中寻找关键字段的方法找出缺陷数据库中缺陷对应的部门,并且将其对应的原因编号进行标注,文本推荐具体方法如下:(1)词频计算:设钢材表面缺陷处理方案的文本集合为:UW={uw1,uw2,uw3,uw4}其中,uw1代表工艺部处理方案文本,uw2代表来料部处理方案文本,uw3代表设备维修部处理方案文本,uw4代表生产部处理方案文本;选取的特征空间为:UF={uf1,uf2,…,ufm}根据文本描述以及用户对缺陷的认识,选取具有代表性的词汇作为关键词,设定训练案例缺陷有i种,训练部门有j个;处理方案文本各个缺陷对应各个部门的关键词分布状况,如下矩阵形式:其中,QXi代表缺陷,QXij代表关键词出现的频数,反映了缺陷在该部门的权重;例如:QXij=uti,j+uti,j-3+uti,2,其中uti,j表示在第i个文本中关键词ufm的出现的频率。设有N个文本文件,关键词ki在ni个文件中出现,设fij为关键词ki在文件dj中出现的次数,那么ki在dj中的词频TFij定义为:设文档集合为W={w1,w2,…,wn},选取的特征空间为F={f1,f2,…,fm},文档wi的特征向量表示为wi={ti1,ti2,…,tim},分量tij表示特征fj相对于文档wi的权重,那么记关键词出现的词频相对于各个部门的权重公式为:得到处理方案文档中各缺陷对应部门的关键词权重矩阵W如下所示:同理产生原因文本中各缺陷对应部门的关键词权重值计算方法一样;(2)计算相似度,将上步中解码后的权重矩阵,经过相似度计算公式得到各个缺陷的相似度矩阵,相似度的计算,在规模为n的特征空间中分别表示为特征权重向量和二者的夹角余弦相似度计算可以表示为:而后进而计算权值的绝对偏差,将绝对偏差较小的保留得到推荐结果矩阵如下:其中ωij=[10](i=1,2…),(j=1,2…)取0或者1,大于设定某一个隶属度值推荐出去,值取1;(3)将已经归类的缺陷存放在数据库中,与对应的原因匹配起来,将有相同原因的缺陷进行排序分类,得到更新后的缺数据库作为下一步分层用;步骤3:获取已经归类好的缺陷和缺陷原因,进行缺陷原因分层处理,关系如图3所示:其中φle表示下层到上层的隶属度,隶属度是反映事务之间关联程度的大小,一般取值在(0~1)之间,隶属度的表示方法:其中,x→y表示从项目x到y的在模糊分类结构上的访问路径,eonl表示e是路径l上的一条边,和可以根据具体情况,分别取最大或者最小。如果x→y之间无访问路径,那么μxy=0。步骤4:获取权重,根据文本推荐方法给出的结果,结合专家经验给出缺陷数据库中每种缺陷对应的权重大小,每种缺陷对应在不同部门之间的权重矩阵H如下所示:此处权重矩阵H与步骤2中权重矩阵W区别在于,矩阵H是在神经网络学习中结合步骤2中推荐结果获得;步骤5:根据步骤2以及步骤3准备的基础上建立关联关系挖掘模型,在步骤3中已经得知了同一元之间的缺陷与缺陷原因之间的隶属度,在步骤4中得知了缺陷的权重大小,集合步骤3以及步骤4中的结果计算出各个层次之间的概化权重,概化权重的表示为:步骤6:获得关联关系挖掘结果;通过引入加权模糊层次关联算法计算出三个维度的关联关系,分别是:缺陷=>缺陷、缺陷=>原因、原因=>原因。其中,关联关系是通过计算加权支持度以及加权置信度,并且通过设置最小加权支持度和最小加权置信度来筛选关联关系,最后可以得到缺陷与缺陷、缺陷与原因、原因与原因多维关联关系。步骤7:反馈找出的关联关系到原始缺陷数据库和缺陷原因数据库中,将关联关系程度较大的缺陷与缺陷可以尽可能放在一起重新存放在缺陷数据库中,再将关联关系程度较大的原因与原因也尽可能排列在一起,更新后存入在缺陷原因数据库。具体地,步骤6中所述的加权模糊层次关联算法,算法是在计算各缺陷的概化权重后,计算出缺陷与原因之间的多维关联关系,即加权置信度和加权支持度:(1)加权支持度:设加权模糊层次关联规则令X∪Y=Z,它的加权支持度为:假定H={i1,i2,i3,…,in}是事务集合,h∈H是H中一个事务,a是事务h中的一个项目,X是一个项目集合,x∈X是X中的一个项目。那么,Wxa就可以当作是项集{a}中加权支持x的度量,故得到h加权支持X的度量:同时,对于所有的事务集合H,H对X的加权支持度量通过下式计算可以得到:(2)加权置信度:对于加权模糊层次关联规则X∪Y=Z,它的加权置信度为:其中X,Y为项目集合,且X∪Y中任意两个项目之间都不存在祖孙关系。本专利技术的上述方式是智能检测缺陷系统中如何快速有效提取有关联的缺陷及原因的方法,方便智能系统更加有效准确处理数据。本专利技术成功运用于冷轧钢材表面缺陷原因检测系统中,较为有效地处理在线系统检测传输的数据。本专利技术的创新性主要体现在:本专利技术创新性之一,采用文本推荐中混合推荐的方法,将缺陷通过计算词频的方式进行分类;在挖掘不同维度的数据关联关系时,采用了加权模糊层次关联关系算法进行不同属性项目之间关联关系挖掘。本专利技术创新性之二,传统的数据库分类只是把不同元类别的关系数据归为一类,而此专利技术是在这种归类基础上,采用关联关系算法把多维数据之间关联关系挖掘出本文档来自技高网...
一种表面缺陷的分析方法

【技术保护点】
一种表面缺陷的分析方法,其特征在于:包括如下步骤步骤1:收集在线检测系统的缺陷及其原因的数据;将从生产现场获得历史缺陷数据,根据文本推荐的方法将缺陷进行初步划分,缺陷原因按照来源可以分为:来料、设备、工艺、生产,对应下文矩阵中的横向;步骤2:分别将缺陷以及缺陷原因按照来源建立数据库。1)建立缺陷原因数据库,把每一种产生的缺陷原因首先根据部门所属的不同进行划分,然后进行连续编号;2)建立缺陷库,根据文本推荐中寻找关键字段的方法找出缺陷数据库中缺陷对应的部门,并且将其对应的原因编号进行标注,文本推荐具体方法如下:(1)词频计算:设钢材表面缺陷处理方案的文本集合为:UW={uw

【技术特征摘要】
1.一种表面缺陷的分析方法,其特征在于:包括如下步骤步骤1:收集在线检测系统的缺陷及其原因的数据;将从生产现场获得历史缺陷数据,根据文本推荐的方法将缺陷进行初步划分,缺陷原因按照来源可以分为:来料、设备、工艺、生产,对应下文矩阵中的横向;步骤2:分别将缺陷以及缺陷原因按照来源建立数据库。1)建立缺陷原因数据库,把每一种产生的缺陷原因首先根据部门所属的不同进行划分,然后进行连续编号;2)建立缺陷库,根据文本推荐中寻找关键字段的方法找出缺陷数据库中缺陷对应的部门,并且将其对应的原因编号进行标注,文本推荐具体方法如下:(1)词频计算:设钢材表面缺陷处理方案的文本集合为:UW={uw1,uw2,uw3,uw4}其中,uw1代表工艺部处理方案文本,uw2代表来料部处理方案文本,uw3代表设备维修部处理方案文本,uw4代表生产部处理方案文本;选取的特征空间为:UF={uf1,uf2,…,ufm}根据文本描述以及用户对缺陷的认识,选取具有代表性的词汇作为关键词,设定训练案例缺陷有i种,训练部门有j个;处理方案文本各个缺陷对应各个部门的关键词分布状况,如下矩阵形式:其中,QXi代表缺陷,QXij代表关键词出现的频数,反映了缺陷在该部门的权重;设有N个文本文件,关键词ki在ni个文件中出现,设fij为关键词ki在文件dj中出现的次数,那么ki在dj中的词频TFij定义为:设文档集合为W={w1,w2,…,wn},选取的特征空间为F={f1,f2,…,fm},文档wi的特征向量表示为wi={ti1,ti2,…,tim},分量tij表示特征fj相对于文档wi的权重,那么记关键词出现的词频相对于各个部门的权重公式为:得到处理方案文档中各缺陷对应部门的关键词权重矩阵W如下所示:同理产生原因文本中各缺陷对应部门的关键词权重值计算方法一样;(2)计算相似度,将上步中解码后的权重矩阵,经过相似度计算公式得到各个缺陷的相似度矩阵后,进而计算权值的绝对偏差,将绝对偏差较小的保留得到推荐结果矩阵如下:其中ωij=[10](i=1,2…),(j=1,2…)取0或者1,大于设定某一个隶属度值推荐出去,值取1;(3)将已经归类的缺陷存放在数据库中,与对应的原因匹配起来,将有相同原因的缺陷进行排序分类,得到更新后的缺数据库作为下一步分层用;步骤3:获取已经归类好的缺陷和缺陷原因,进行缺陷原因分层处理,关系如图3所示:其中φle表示下层到上层的隶属度,隶属度是反映事务之间关...

【专利技术属性】
技术研发人员:卢小丽腾胜吴腾杨双峰
申请(专利权)人:武汉延锋时代检测技术服务有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1