【技术实现步骤摘要】
基于增量学习工业质检应用方法
[0001]本专利技术涉及工业质检应用方法,尤其是一种基于增量学习工业质检应用方法。
技术介绍
[0002]现有的训练加速主要有以下方法:(1)模型压缩:通过对模型进行压缩,减少模型的参数数量,可以在不影响模型准确率的前提下,提高训练速度。缺点是压缩较大的情况下会出现准确率下降的情况。压缩过程会增加模型计算负担,导致训练时间增加。压缩算法的选择和调参需要一定的经验和技巧,增加模型设计的复杂度。
[0003](2)预训练模型:利用大规模数据对模型进行预训练,利用预训练模型和少量采样数据实现训练加速。缺点是预训练模型依赖于大规模数据集,需要大量计算资源,不适用于特定领域,预训练数据的不准确性会对模型产生不利影响。
[0004](3)分布式训练:将训练任务分配到多个计算节点上进行并行计算以提高训练效率。缺点是占用大量计算资源,硬件成本较高。
[0005](4)增量学习算法:通过不断添加新数据进行模型的更新和优化。缺点是增量学习的研究基于特定的增量类别数和指定的样本数,缺乏对实际落地应用的考虑。
[0006]增量学习方法更多是学术界的探索,根据我们的了解,工业界依然缺乏相关案例。目前学术界对增量学习的研究主要集中在图像分类领域,近年典型的算法有:(1)Bic算法,最早探讨大规模增量学习的问题,通过给旧类加上偏差纠正,实现新旧类的较好区分,进而提高增量学习模型精度;(2)WA算法,在不平衡的训练集上训练之后,新类所对应的的线性分类器往往具有相较于旧类线性分类器更大的 ...
【技术保护点】
【技术特征摘要】
1.一种基于增量学习工业质检应用方法,其特征在于:包括如下步骤:步骤1:加载任务的配置文件,对文件中的信息做样本数据读取分析;步骤2:通过功能函数判断当前任务使用的训练模式,包括如下步骤:步骤21:读取当前训练数据,选择非空文件夹,形成当前训练的类别列表;步骤22:判断数据集已知的类别列表是否为空,如果为空,判断为“初始训练”模式;步骤23:判断当前训练的类别列表和数据集已知的类别列表的差集是否为空,判断是空为“样本增量”模式,判断是非空则为“混合增量”模式;步骤24:通过当前训练的类别列表和数据集已知的类别列表的交集,获取样本增量的类别列表;通过当前训练的类别列表和数据集已知的类别列表的差集,获取类别增量的类别列表;将新增类列表与已知类列表进行合并,形成本次任务后的新已知类列表;步骤25:模式判断功能函数返回初始训练模式、样本增量模式或混合增量模式,以及新已知类列表、样本增量类列表和类别增量类列表;步骤3:样本归档;步骤4:进行初始训练、联合训练、样本增量或混合增量;步骤5:输出模型;步骤6:更新步骤1的配置文件;步骤7:重复步骤1到步骤6。2.如权利要求1所述的基于增量学习工业质检应用方法,其特征在于:所述步骤3的样本归档,在开始任何模式的增量学习之前,对新样本数据进行归档处理,待归档完成后,从归档路径中读取验证集数据进行后续的增量学习训练;联合训练将直接读取归档文件夹下的所有数据进行训练。3.如权利要求1或2所述的基于增量学习工业质检应用方法,其特征在于:所述步骤3的样本归档,还包括提前计算样本库各类均值并存储、无监督聚类方法计算单类亚型样本均值并存储、或人工挑选单类亚型样本计算均值并存储。4.如权利要求1所述的基于增量学习工业质检应用方法,其特征在于:所述步骤4的初始训练是模型第一次最原始的训练;联合训练是模型增量中期对归档数据进行的模型训练,采用和初始训练相同的训练模式。5.如权利要求1所述的基于增量学习工业质检应用方法,其特征在于:所述步骤4的样本增量,包括如下步骤:步骤411:初始化增量网络,加载上一次的模型参数;步骤412:读取归档数据,形成一个数据管理类;步骤413:通过一个统计功能函数,统计当前样本增量数据,并根据统计结果得到样本增量补齐最大值;步骤414:通过一个样本生成策略,生成增量学习所需训练样本, 样本生成策略采用增量学习样本生成方法,包括如下步骤:步骤4
‑
1:获取当前类别待补充样本数量,通过当前训练数据的统计结果字典,得到当
前训练数据的每一个类别以及类别对应的样本数量,将提前设定好的阈值减去样本数量得到该类别仍需要补充的样本数量,具体的计算公式如下:m
c
=t
‑
n
c
m
c
为c类仍需补充的样本数量,t表示预设的阈值,即单类训练样本数量的上限,通过调节t值可有效控制增量学习训练时间,n
c
表示增量数据中c类文件夹下含有的样本数量;步骤4
‑
2:通过未知增量类别列表判断类别c是已知类或未知类,类别c未存在于未知增量类别列表中,判定类别c是已知类别;跳过步骤4
‑
3;步骤4
‑
4:生成已知类样本,包括如下步骤:步骤4
‑
41:判断仍需补充的样本数量是否小于等于零,即m
c
≤0;步骤4
‑
42:当仍需补充的样本数量小于等于零时,直接合并m
c
;当仍需补充的样本数量大于零时,从样本库中获取该已知类样本,数量称作o
c
,将样本库中已知类样本数量和该已知类仍需补充的数量m
c
比较大小,进而判断已知类样本库样本是否充足,当已知类样本库样本不足时,计算二者差值作为随机采样的次数,计算公式如下:s=m
c
‑
o
c
s代表该已知类随机采样的次数,m
c
为c类仍需补充的样本数量,o
c
表示该已知类样本库中的样本数,当已知类样本数足够时,通过最近零均值算法及其优化算法提取最具代表性的样本添加到已知类范例集中;跳过步骤4
‑
5,或执行步骤4
‑
5:合并一个空的训练样本,生成最终训练样本;步骤415:将本次训练进行样本归档,并将归档后的验证集作为增量学习验证集;步骤416:完成增量学习的训练产出模型,计算得分,并自动更新配置文件。6.如权利要求1所述的基于增量学习工业质检应用方法,其特征在于:所述步骤4的混合增量,用于处理新增的样本为单纯的未知类别增量或包含部分已知类别的未知类别增量,具体步骤如下:步骤421:获取旧类列表,读取已知类别增量任务数;步骤422:构建增量网络,并加载历史模型参数;步骤423:根据旧类列表读取旧类的归档数据,形成一个数据管理类;步骤424:通过一个统计功能函数统计当前增量样本数据,提供最大值补齐或者阈值补齐,以实现“性能最优策略”或者“时间最优策略”;步骤425:通过一个样本生成策...
【专利技术属性】
技术研发人员:都卫东,和江镇,王岩松,陈嘉杰,吴健雄,
申请(专利权)人:征图新视江苏科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。