基于增量学习工业质检应用方法技术

技术编号:39152865 阅读:14 留言:0更新日期:2023-10-23 14:59
本发明专利技术涉及工业质检应用方法,为了解决现有工业质检不断产生新的缺陷数据,使得训练时间越来越长;新增的数据存在复杂,样本分布不均等;增量学习缺少实际落地应用案例的问题,提供一种基于增量学习工业质检应用方法,包括如下步骤:步骤1:加载任务的配置文件,对文件中的信息做样本数据读取分析;步骤2:通过功能函数自动判断当前任务使用的训练模式:步骤3:样本归档;步骤4:进行初始训练、联合训练、样本增量或混合增量;步骤5:输出模型;步骤6:更新步骤1的配置文件;步骤7:重复步骤1到步骤6,本发明专利技术具有训练时间短、样本分布均等和成本低的特点。特点。特点。

【技术实现步骤摘要】
基于增量学习工业质检应用方法


[0001]本专利技术涉及工业质检应用方法,尤其是一种基于增量学习工业质检应用方法。

技术介绍

[0002]现有的训练加速主要有以下方法:(1)模型压缩:通过对模型进行压缩,减少模型的参数数量,可以在不影响模型准确率的前提下,提高训练速度。缺点是压缩较大的情况下会出现准确率下降的情况。压缩过程会增加模型计算负担,导致训练时间增加。压缩算法的选择和调参需要一定的经验和技巧,增加模型设计的复杂度。
[0003](2)预训练模型:利用大规模数据对模型进行预训练,利用预训练模型和少量采样数据实现训练加速。缺点是预训练模型依赖于大规模数据集,需要大量计算资源,不适用于特定领域,预训练数据的不准确性会对模型产生不利影响。
[0004](3)分布式训练:将训练任务分配到多个计算节点上进行并行计算以提高训练效率。缺点是占用大量计算资源,硬件成本较高。
[0005](4)增量学习算法:通过不断添加新数据进行模型的更新和优化。缺点是增量学习的研究基于特定的增量类别数和指定的样本数,缺乏对实际落地应用的考虑。
[0006]增量学习方法更多是学术界的探索,根据我们的了解,工业界依然缺乏相关案例。目前学术界对增量学习的研究主要集中在图像分类领域,近年典型的算法有:(1)Bic算法,最早探讨大规模增量学习的问题,通过给旧类加上偏差纠正,实现新旧类的较好区分,进而提高增量学习模型精度;(2)WA算法,在不平衡的训练集上训练之后,新类所对应的的线性分类器往往具有相较于旧类线性分类器更大的权值。比较新旧类分类器权值的L2范数可以发现,新类的L2范数显著大于旧类。WA通过拉平新旧类的L2范数实现新旧类的高精度;(3)DER算法,为了实现更好的稳定性

可塑性权衡,开发了一个动态可扩展的表示和一个两阶段的类别增量学习策略。提出了一个辅助损失来促进新增的特征模块有效地学习新类,以及一个模型修剪步骤来学习紧凑的特征。
[0007]这些技术的缺点是增量类别数固定,且样本数充足。例如,Bic算法论文的实验采用了公开的ImgNet数据集和CIFAR数据集,实验增量类别数有5类,10类,20类,50类。由于实际工业质检场景中存在每次新增类别数不等的情况,同时还伴有旧类的样本增量,学术界定义的增量类别数并不能直接应用于工业质检领域。并且新缺陷样本的苛刻产生条件导致新数据的非常稀少,完全不同于数据充足的ImgNet和CIFAR,现有技术难以落地。现有技术还缺少对应的数据归档机制,对于数据累积的过程未能做到及时的更新和管理。
[0008]综上,本专利技术需要解决现有工业质检不断产生新的缺陷数据,使得训练时间越来越长;新增的数据存在复杂,样本分布不均等问题;增量学习缺少实际落地应用案例的问题。

技术实现思路

[0009]本专利技术要解决的技术问题是:为了解决现有工业质检不断产生新的缺陷数据,使得训练时间越来越长;新增的数据存在复杂,样本分布不均等;增量学习缺少实际落地应用案例的问题,提供一种基于增量学习工业质检应用方法。
[0010]本专利技术解决其技术问题所采用的技术方案是:一种基于增量学习工业质检应用方法,其特征在于:包括如下步骤:步骤1:加载任务的配置文件,对文件中的信息做样本数据读取分析;步骤2:通过功能函数判断当前任务使用的训练模式,包括如下步骤:步骤21:读取当前训练数据,选择非空文件夹,形成当前训练的类别列表;步骤22:判断数据集已知的类别列表是否为空,如果为空,判断为“初始训练”模式;步骤23:判断当前训练的类别列表和数据集已知的类别列表的差集是否为空,判断是空为“样本增量”模式,判断是非空则为“混合增量”模式;步骤24:通过当前训练的类别列表和数据集已知的类别列表的交集,获取样本增量的类别列表;通过当前训练的类别列表和数据集已知的类别列表的差集,获取类别增量的类别列表;将新增类列表与已知类列表进行合并,形成本次任务后的新已知类列表;步骤25:模式判断功能函数返回初始训练模式、样本增量模式或混合增量模式,以及新已知类列表、样本增量类列表和类别增量类列表;步骤3:样本归档;步骤4:进行初始训练、联合训练、样本增量或混合增量;步骤5:输出模型;步骤6:更新步骤1的配置文件;步骤7:重复步骤1到步骤6。
[0011]进一步的,所述步骤3的样本归档,在开始任何模式的增量学习之前,对新样本数据进行归档处理,待归档完成后,从归档路径中读取验证集数据进行后续的增量学习训练;联合训练将直接读取归档文件夹下的所有数据进行训练。
[0012]进一步的,所述步骤3的样本归档,还包括提前计算样本库各类均值并存储、无监督聚类方法计算单类亚型样本均值并存储、或人工挑选单类亚型样本计算均值并存储。
[0013]进一步的,所述步骤4的初始训练是模型第一次最原始的训练;联合训练是模型增量中期对归档数据进行的模型训练,采用和初始训练相同的训练模式。
[0014]进一步的,所述步骤4的样本增量,包括如下步骤:步骤411:初始化增量网络,加载上一次的模型参数;步骤412:读取归档数据,形成一个数据管理类;步骤413:通过一个统计功能函数,统计当前样本增量数据,并根据统计结果得到样本增量补齐最大值;步骤414:通过一个样本生成策略,生成增量学习所需训练样本, 样本生成策略采
用增量学习样本生成方法,包括如下步骤:步骤4

1:获取当前类别待补充样本数量,通过当前训练数据的统计结果字典,得到当前训练数据的每一个类别以及类别对应的样本数量,将提前设定好的阈值减去样本数量得到该类别仍需要补充的样本数量,具体的计算公式如下:m
c
=t

n
c
m
c
为c类仍需补充的样本数量,t表示预设的阈值,即单类训练样本数量的上限,通过调节t值可有效控制增量学习训练时间,n
c
表示增量数据中c类文件夹下含有的样本数量;步骤4

2:通过未知增量类别列表判断类别c是已知类或未知类,类别c未存在于未知增量类别列表中,判定类别c是已知类别;跳过步骤4

3;步骤4

4:生成已知类样本,包括如下步骤:步骤4

41:判断仍需补充的样本数量是否小于等于零,即m
c
≤0;步骤4

42:当仍需补充的样本数量小于等于零时,直接合并m
c
;当仍需补充的样本数量大于零时,从样本库中获取该已知类样本,数量称作o
c
,将样本库中已知类样本数量和该已知类仍需补充的数量m
c
比较大小,进而判断已知类样本库样本是否充足,当已知类样本库样本不足时,计算二者差值作为随机采样的次数,计算公式如下:s=m
c

o
c
s代表该已知类随机采样的次数,m
c
为c类仍需补充的样本数量,o
c
表示该已知类样本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于增量学习工业质检应用方法,其特征在于:包括如下步骤:步骤1:加载任务的配置文件,对文件中的信息做样本数据读取分析;步骤2:通过功能函数判断当前任务使用的训练模式,包括如下步骤:步骤21:读取当前训练数据,选择非空文件夹,形成当前训练的类别列表;步骤22:判断数据集已知的类别列表是否为空,如果为空,判断为“初始训练”模式;步骤23:判断当前训练的类别列表和数据集已知的类别列表的差集是否为空,判断是空为“样本增量”模式,判断是非空则为“混合增量”模式;步骤24:通过当前训练的类别列表和数据集已知的类别列表的交集,获取样本增量的类别列表;通过当前训练的类别列表和数据集已知的类别列表的差集,获取类别增量的类别列表;将新增类列表与已知类列表进行合并,形成本次任务后的新已知类列表;步骤25:模式判断功能函数返回初始训练模式、样本增量模式或混合增量模式,以及新已知类列表、样本增量类列表和类别增量类列表;步骤3:样本归档;步骤4:进行初始训练、联合训练、样本增量或混合增量;步骤5:输出模型;步骤6:更新步骤1的配置文件;步骤7:重复步骤1到步骤6。2.如权利要求1所述的基于增量学习工业质检应用方法,其特征在于:所述步骤3的样本归档,在开始任何模式的增量学习之前,对新样本数据进行归档处理,待归档完成后,从归档路径中读取验证集数据进行后续的增量学习训练;联合训练将直接读取归档文件夹下的所有数据进行训练。3.如权利要求1或2所述的基于增量学习工业质检应用方法,其特征在于:所述步骤3的样本归档,还包括提前计算样本库各类均值并存储、无监督聚类方法计算单类亚型样本均值并存储、或人工挑选单类亚型样本计算均值并存储。4.如权利要求1所述的基于增量学习工业质检应用方法,其特征在于:所述步骤4的初始训练是模型第一次最原始的训练;联合训练是模型增量中期对归档数据进行的模型训练,采用和初始训练相同的训练模式。5.如权利要求1所述的基于增量学习工业质检应用方法,其特征在于:所述步骤4的样本增量,包括如下步骤:步骤411:初始化增量网络,加载上一次的模型参数;步骤412:读取归档数据,形成一个数据管理类;步骤413:通过一个统计功能函数,统计当前样本增量数据,并根据统计结果得到样本增量补齐最大值;步骤414:通过一个样本生成策略,生成增量学习所需训练样本, 样本生成策略采用增量学习样本生成方法,包括如下步骤:步骤4

1:获取当前类别待补充样本数量,通过当前训练数据的统计结果字典,得到当
前训练数据的每一个类别以及类别对应的样本数量,将提前设定好的阈值减去样本数量得到该类别仍需要补充的样本数量,具体的计算公式如下:m
c
=t

n
c
m
c
为c类仍需补充的样本数量,t表示预设的阈值,即单类训练样本数量的上限,通过调节t值可有效控制增量学习训练时间,n
c
表示增量数据中c类文件夹下含有的样本数量;步骤4

2:通过未知增量类别列表判断类别c是已知类或未知类,类别c未存在于未知增量类别列表中,判定类别c是已知类别;跳过步骤4

3;步骤4

4:生成已知类样本,包括如下步骤:步骤4

41:判断仍需补充的样本数量是否小于等于零,即m
c
≤0;步骤4

42:当仍需补充的样本数量小于等于零时,直接合并m
c
;当仍需补充的样本数量大于零时,从样本库中获取该已知类样本,数量称作o
c
,将样本库中已知类样本数量和该已知类仍需补充的数量m
c
比较大小,进而判断已知类样本库样本是否充足,当已知类样本库样本不足时,计算二者差值作为随机采样的次数,计算公式如下:s=m
c

o
c
s代表该已知类随机采样的次数,m
c
为c类仍需补充的样本数量,o
c
表示该已知类样本库中的样本数,当已知类样本数足够时,通过最近零均值算法及其优化算法提取最具代表性的样本添加到已知类范例集中;跳过步骤4

5,或执行步骤4

5:合并一个空的训练样本,生成最终训练样本;步骤415:将本次训练进行样本归档,并将归档后的验证集作为增量学习验证集;步骤416:完成增量学习的训练产出模型,计算得分,并自动更新配置文件。6.如权利要求1所述的基于增量学习工业质检应用方法,其特征在于:所述步骤4的混合增量,用于处理新增的样本为单纯的未知类别增量或包含部分已知类别的未知类别增量,具体步骤如下:步骤421:获取旧类列表,读取已知类别增量任务数;步骤422:构建增量网络,并加载历史模型参数;步骤423:根据旧类列表读取旧类的归档数据,形成一个数据管理类;步骤424:通过一个统计功能函数统计当前增量样本数据,提供最大值补齐或者阈值补齐,以实现“性能最优策略”或者“时间最优策略”;步骤425:通过一个样本生成策...

【专利技术属性】
技术研发人员:都卫东和江镇王岩松陈嘉杰吴健雄
申请(专利权)人:征图新视江苏科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1