一种数据驱动的SMT生产线上SPI缺陷类别智能识别方法技术

技术编号:20918467 阅读:60 留言:0更新日期:2019-04-20 10:05
一种数据驱动的SMT生产线上SPI缺陷类别智能识别方法,第一阶段:SPI历史质量检测数据集聚类处理,对所得K类训练数据集采用Bagging算法独立抽样20次,利用BP神经网络模型对K类共计K×20组训练集分别训练独立缺陷分类器,得到K×20个独立缺陷分类器构成分类器集合;第二阶段:SPI在线检测6个锡膏印刷质量参数,对比历史训练数据集对该检测记录“T”进行归类,确定实时检测点属于K类训练数据集中的哪一个类别,当T恰好处于两类或多类训练数据集的边界上,则同时从多类K类训练数据集以约等量选择总计20个独立缺陷分类器进行检测记录T的类别判定;将T输入各独立缺陷分类器对输出结果按照集成规则进行集成预测,判定缺陷类别。本发明专利技术降低了人在自动检测中的作用,提高在线实时检测效率与准确度。

A Data-driven Intelligent Method for SPI Defect Classification Recognition in SMT Production Line

A data-driven intelligent recognition method for SPI defect classes on SMT production lines is presented. The first stage is clustering processing of SPI historical quality detection data sets. Bagging algorithm is used to independently sample the K-type training data sets for 20 times. The BP neural network model is used to train independent defect classifiers for K-type training sets totalling 20 sets, and K-20 independent defect classifiers are obtained to form a set of classifiers. In the second stage, SPI detects six solder paste printing quality parameters online, classifies the detection record \T\ by comparing the historical training data set, and determines which category of the real-time detection points belong to the K-training data set. When T happens to be on the boundary of two or more training data sets, a total of 20 independent defect classifiers are selected from the various K-training data sets at the same time. T is input into each independent defect classifier to predict the output results according to the integration rules and determine the defect category. The invention reduces the role of human in automatic detection and improves the efficiency and accuracy of online real-time detection.

【技术实现步骤摘要】
一种数据驱动的SMT生产线上SPI缺陷类别智能识别方法
本专利技术生产加工质量在线检测与预测领域,具体涉及一种数据驱动的SMT生产线上SPI缺陷类别智能识别方法。
技术介绍
在智能制造中,质量在线检测与预测技术是提升质量管理能力、建设智能生产线的关键技术之一。质量在线自动检测与预测的应用减少了人工检测操作,提高了质量检测结果的一致性与稳定性、检测速度与检测结果的准确性,一定程度上避免误报、漏报质量问题造成的时间和成本损失。随着科技不断创新、电子产品微型化的快速发展对表面贴装技术(SMT,SurfaceMountTechnology)自动化与智能化提出更高要求,其中,锡膏印刷的质量检测SPI(SolderPasteInspection)技术通过3D-SPI自动检测技术检测焊盘上锡膏的体积、面积、高度、偏移及拉尖,并根据质量过程控制所设定的各检测参数上下限进行质量结果识别,然而实际生产过程中对检测参数体积、高度、面积、位置偏移等控制上下限的设定是操作工人按照经验来设定的,故而实际生产中的误警率、漏报率都很高,传统过程质量控制方法的优化效果较差。随着数据挖掘技术、机器学习等方法的兴起,更智能的基于数据的智能质量预测与控制方案被设计出来,这些方法可以有效利用质量在线检测的历史数据,充分学习与挖掘检测数据与质量结果之间的相关关系,并以学习模型方式进行记录与展示,当前该技术在在线检测与质量预测领域应用多集中在设备上,对SMT生产线的应用较少,SPI检测环节的质量识别仍然处于人工经验设定检测参数控制上下限的现状。
技术实现思路
本专利技术要解决的技术问题是提供一种数据驱动的SMT生产线上SPI缺陷类别智能识别方法,降低了人在自动检测中的作用,提高在线实时检测效率与准确度。为了解决上述技术问题,本专利技术采取以下技术方案:一种SMT生产线上SPI缺陷类别智能识别方法,用于实现锡膏印刷质量在线自动检测与预测,包括以下步骤:步骤一:训练SPI历史质量检测记录容量确定,总数据量≥10000条,该总数据量中包含各类的缺陷类别记录信息;步骤二:数据标准化处理;步骤三:K-means聚类,将SPI历史质量检测数据集进行K组划分,形成K类训练数据集,K取值≤7;步骤四:对K类训练数据集采用Bagging算法抽样20次,每次样本容量为该组内数据量的70%-80%;步骤五:利用BP神经网络模型对K组共计K×20组训练集分类训练独立缺陷分类器,得到K×20个独立缺陷分类器构成分类器集合;步骤六:SPI在线检测6个锡膏印刷质量参数,按照欧氏空间距离最近法对检测记录“T”进行归类,确定实时检测点属于K类训练数据集中的哪一个类别,当T恰好处于两类K类训练数据集或多类K类训练数据集的边界上,则同时从多类K类训练数据集以约等量选择总计20个独立缺陷分类器进行检测记录T的类别判定,锡膏印刷质量参数包括面积、体积、高度、X偏移量、Y偏移量、拉尖;步骤七:选择T所属类别中的20个独立缺陷分类器,将T输入各独立缺陷分类器对输出结果进行集成预测,判定缺陷类别。所述步骤七的集成预测具体包括以下方法:动态检测记录T的类别划分采用欧氏空间距离最近法,即该检测结果归一化后计算在多维线性空间中当前点到所述K类训练数据集的各类别聚类中心点的欧氏距离,选择欧氏距离最近的类别中20个独立缺陷分类器进行缺陷类别集成预测,当该检测点恰好处于两类别或多类别训练数据集的边界上时,以等量原则从各类训练数据集中随机抽取独立缺陷分类器构成20个独立分类器进行集成缺陷类别预测,集成预测规则如下:当:1)20个独立缺陷分类器全部输出为0,则确定为无缺陷;2)输出有一个判定缺陷时如果同属该组的独立缺陷分类器存在三个以上分类器输出结果为0,则该输出判定为无缺陷;3)当输出有2个及以上判别有缺陷并输出相应的缺陷类别时进行报警,并输出响应类别识别结果,CN表示集成的独立缺陷分类器集合,A、B、C、D、E表示数据集最初的各组分类编号。所述训练独立缺陷分类器的具体操作为:具体步骤为:设定K=N,对第N组总共m个数据有放回重复取样,取出一组数量为70%*m的样品数据集,完成20次取样,每组得到20个训练数据集;对每组得到的20个训练数据集分别利用BP神经网络模型训练得到20个独立缺陷分类器,最终得到K×20的独立缺陷分类器集合。所述步骤三的聚类处理具体包括以下步骤:设定所有样本点集合W,初始类别数C=1,聚类总类别数K,计算所有样本点的方差以及所有样本点的平均距离,样本点距离公式:意样本点到其他多有样本点之间的平均距离:任意样本点的方差值:所有样本点的平均距离:找出样本点集合W中方差最小的样本点作为聚类中心Cc;以聚类中心Cc为圆心,所述样本点的平均距离为半径画圆,找出聚类中心Cc数据集Wc,C=C+1,W=W-Wc;遍历各个样本点,查看当前的类别数C是否小于总类别数K;若小于,返回重新在样本点集合中找出方差最小的样本点;若C大于等于K,则已经遍历完成,找出样本点集合W中方差最小点作为第K类聚类中心,得到的初始聚类中心为C1、C2…Ck;将空间内非聚类中心的样本点按照欧氏距离最近法分配给K个类别,计算每个类别中所有数据点的平均距离作为下一次的聚类中心,计算各个样本点到所在聚类中心的距离平方和,聚类后所有类别内数据点到聚类中心的平方和J(C):判断聚类中心是否发生变化,若发生变化,则返回重新将空间内非聚类中心的样本点进行分配;若没有发生变化,则结束聚类,输出结果。所述数据标准化处理具体为:对数据采用0-1标准化,将各检测参数的检测结果处理到[0,1]:其中,max为样本数据的最大值,min为样本数据的最小值。所述在生产线设备停机时间内,可对离线模型的训练数据集进行更新,使用设定的期限内的历史检测记录数据重新训练,完成自动更新。本专利技术的有益效果如下:1)降低甚至取消人在“SPI在线检测与缺陷类别判定”中的参与,减少人为经验造成的参数设定失误,提高检测效率、缺陷类别智能分类与分类准确性;2)锡膏检测各检测参数同时参与缺陷类别判定,更符合实际,克服SPC对单变量控制的不足;3)利用历史数据对分类器模型进行更新,可以更多的将反应当前设备及生产状态的检测数据应用在模型中,实现自主自动更新,及时追溯产品质量趋势变化。附图说明图1为本专利技术基于神经网络集成的SPI缺陷类别判定模型结构示意图;图2为本专利技术的改进的K-means聚类算法流程图;图3为本专利技术聚类处理后得到的聚类平方和和聚类类别数的J-N曲线图。具体实施方式为能进一步了解本专利技术的特征、技术手段以及所达到的具体目的、功能,下面结合附图与具体实施方式对本专利技术作进一步详细描述。某SMT生产线上SPI检测的单条检测数据记录格式与质量结果如表1,锡膏印刷的缺陷类别及编号如表2,上述本专利技术的目的就是在根据3D-SPI检测得到的单条检测记录数据判定锡膏印刷锡膏体缺陷与否和缺陷类别进行较准确的自动判断。本示例中所用质量检测数据18703条,包含“32”条无锡膏和“4096”条桥接缺陷独立出现的情况。具体情况如表3,按照本专利技术所示的流程,对18703进行学习与模型验证。具体操作步骤如下:表1五条示例SPI检测记录表2缺陷类别及编号表3历史记录数据信息本专利技术具体揭示了一种SMT生产线本文档来自技高网...

【技术保护点】
1.一种数据驱动的SMT生产线上SPI缺陷类别智能识别方法,用于实现锡膏印刷质量在线自动检测与预测,包括以下步骤:步骤一:训练SPI历史质量检测记录容量确定,总数据量≥10000条,该总数据量中包含各类的缺陷类别记录信息;步骤二:数据标准化处理;步骤三:K‑means聚类,将SPI历史质量检测数据集进行K组划分,形成K类训练数据集,K取值≤7;步骤四:对K类训练数据集采用Bagging算法抽样20次,每次样本容量为该组内数据量的70%‑80%;步骤五:利用BP神经网络模型对K组共计K×20组训练集分类训练独立缺陷分类器,得到K×20个独立缺陷分类器构成分类器集合;步骤六:SPI在线检测6个锡膏印刷质量参数,按照欧氏空间距离最近法对检测记录“T”进行归类,确定实时检测点属于K类训练数据集中的哪一个类别,当T恰好处于两类K类训练数据集或多类K类训练数据集的边界上,则同时从多类K类训练数据集以约等量选择总计20个独立缺陷分类器进行检测记录T的类别判定,锡膏印刷质量参数包括锡膏面积、体积、高度、X偏移量、Y偏移量、拉尖;步骤七:选择T所属类别中的20个独立缺陷分类器,将T输入各独立缺陷分类器对输出结果进行集成预测,判定缺陷类别。...

【技术特征摘要】
1.一种数据驱动的SMT生产线上SPI缺陷类别智能识别方法,用于实现锡膏印刷质量在线自动检测与预测,包括以下步骤:步骤一:训练SPI历史质量检测记录容量确定,总数据量≥10000条,该总数据量中包含各类的缺陷类别记录信息;步骤二:数据标准化处理;步骤三:K-means聚类,将SPI历史质量检测数据集进行K组划分,形成K类训练数据集,K取值≤7;步骤四:对K类训练数据集采用Bagging算法抽样20次,每次样本容量为该组内数据量的70%-80%;步骤五:利用BP神经网络模型对K组共计K×20组训练集分类训练独立缺陷分类器,得到K×20个独立缺陷分类器构成分类器集合;步骤六:SPI在线检测6个锡膏印刷质量参数,按照欧氏空间距离最近法对检测记录“T”进行归类,确定实时检测点属于K类训练数据集中的哪一个类别,当T恰好处于两类K类训练数据集或多类K类训练数据集的边界上,则同时从多类K类训练数据集以约等量选择总计20个独立缺陷分类器进行检测记录T的类别判定,锡膏印刷质量参数包括锡膏面积、体积、高度、X偏移量、Y偏移量、拉尖;步骤七:选择T所属类别中的20个独立缺陷分类器,将T输入各独立缺陷分类器对输出结果进行集成预测,判定缺陷类别。2.根据权利要求1所述数据驱动的SMT生产线上SPI缺陷类别智能识别方法,其特征在于,所述步骤六的在线集成预测中检测参数即锡膏面积、体积、高度、X偏移量、Y偏移量、拉尖6个项同时参与缺陷类别判定,充分考虑检测参数间的相关性。3.根据权利要求1所述数据驱动的SMT生产线上SPI缺陷类别智能识别方法,其特征在于,所述步骤七的集成预测具体包括以下方法:动态检测记录T的类别划分采用欧氏空间距离最近法,即该检测结果归一化后计算在多维线性空间中当前点到所述K类训练数据集的各类别聚类中心点的欧氏距离,选择欧氏距离最近的类别中20个独立缺陷分类器进行缺陷类别集成预测,当该检测点恰好处于两类别或多类别训练数据集的边界上时,以等量原则从各类训练数据集中随机抽取独立缺陷分类器构成20个独立分类器进行集成缺陷类别预测,集成预测规则如下:当:1)20个独立缺陷分类器全部输出为0,则确定为无缺陷;2)输出有一个判定缺陷时如果同属该组的独立缺陷分类器存在三个以上分类器输出结果为0,则该输出判定为无缺陷;3)当输出有2个及以上判别有缺...

【专利技术属性】
技术研发人员:朱海平孙志娟李晓涛何非关辉扆书樵李朝晖金炯华吴淑敏倪明堂张卫平黄培
申请(专利权)人:广东省智能机器人研究院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1