System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能,尤其涉及一种模型训练方法、缺陷检测方法以及相关装置。
技术介绍
1、工业质检是指在工业生产过程中,对产品或零部件进行质量检测和控制的过程,其目的是确保产品符合规定的质量标准和要求,从而提高产品的合格率和质量稳定性。
2、目前,基于深度学习的缺陷检测技术已经能够达到较高的精度,具体地,预先获取大量的训练数据进行模型训练,然后使用训练得到的神经网络模型进行缺陷检测。然而,随着工业质检项目的进行,所收集到的用于训练深度学习模型的数据量会呈现逐步增大的情况。而在项目进行到中后期时,由于训练数据巨大,训练时间很长,训练卡数的消耗很多,造成迭代一次成本非常大。
3、在相关技术中,主要采用两种技术方案:使用全量训练数据进行模型迭代和使用增量数据进行模型微调。然而,这两种方案都存在一些问题。使用全量数据进行模型迭代时,如果数据量很大,训练所需的计算资源和时间成本都很高。使用增量数据进行模型微调时,随着训练时间的延长或微调次数的增加,模型会逐渐偏离原有知识,导致对历史数据发生灾难性的遗忘,进而导致模型整体能力快速下降,不够稳定。
技术实现思路
1、本申请实施例提供了一种模型训练方法、缺陷检测方法以及相关装置,在模型训练方法中,通过使用部分已经训练过的历史训练数据和全量新增的训练数据对初始检测模型进行训练,解决了相关技术中使用全量训练数据进行模型更新造成的计算资源和时间成本过高的问题,以及使用全量新增的训练数据对模型微调时造成的灾难性遗忘的问题。在缺陷检测方
2、本申请的一方面提供一种模型训练方法,包括:
3、获取第一训练图像集、第二训练图像集及初始检测模型,其中,初始检测模型为基于第一训练图像集训练得到的,第一训练图像集包括样本缺陷图像,第二训练图像集包含样本缺陷图像且与第一训练图像集包含的样本缺陷图像不同,初始检测模型包含第一权重参数集,第一权重参数集中包含初始检测模型中多个网络参数的第一权重参数,第一权重参数用于表征初始检测模型的网络参数的重要程度;
4、基于第一采样图像集、第二训练图像集及第一权重参数对初始检测模型进行训练,以调整初始检测模型的网络参数,得到训练后的优化检测模型,其中,第一采样图像集合包含第一训练图像集中的部分样本缺陷图像,第一权重参数集用于限制初始检测模型中的网络参数的调整范围。
5、本申请的另一方面提供了一种模型训练装置,包括:训练图像及初始模型获取模块及模型训练模块;具体的:
6、训练图像及初始模型获取模块,用于获取第一训练图像集、第二训练图像集及初始检测模型,其中,初始检测模型为基于第一训练图像集训练得到的,第一训练图像集包括样本缺陷图像,第二训练图像集包含样本缺陷图像且与第一训练图像集包含的样本缺陷图像不同,初始检测模型包含第一权重参数集,第一权重参数集中包含初始检测模型中多个网络参数的第一权重参数,第一权重参数用于表征初始检测模型的网络参数的重要程度;
7、模型训练模块,用于基于第一采样图像集、第二训练图像集及第一权重参数对初始检测模型进行训练,以调整初始检测模型的网络参数,得到训练后的优化检测模型,其中,第一采样图像集合包含第一训练图像集中的部分样本缺陷图像,第一权重参数集用于限制初始检测模型中的网络参数的调整范围。
8、在本申请实施例的另一种实现方式中,模型训练模块,还用于:
9、获取基础检测模型的网络参数,其中,初始检测模型为基于对基础检测模型的网络参数进行调整后得到的;
10、根据第一权重参数、初始检测模型的网络参数、基础检测模型的网络参数、第一采样图像集及第二训练图像集,计算初始检测模型的目标函数,其中,第一权重参数与初始检测模型的目标函数成正相关;
11、基于初始检测模型的目标函数,对初始检测模型进行训练,以调整初始检测模型的网络参数。
12、在本申请实施例的另一种实现方式中,模型训练模块,还用于:
13、根据第一采样图像集、第二训练图像集,计算初始检测模型的增量数据目标函数;
14、计算初始检测模型的网络参数与基础检测模型的网络参数的参数差;
15、获取超参数;
16、将超参数、第一权重参数及参数差的平方结果相乘,将相乘结果与初始检测模型的增量数据目标函数相加,得到初始检测模型的目标函数。
17、在本申请实施例的另一种实现方式中,模型训练模块,还用于:
18、获取裁切阈值,其中,裁切阈值用于表征对初始检测模型进行参数更新时的梯度阈值;
19、根据裁切阈值,对初始检测模型的目标函数进行更新,以限制对初始检测模型进行参数更新时的梯度范围。
20、在本申请实施例的另一种实现方式中,模型训练模块,还用于:
21、计算第一权重参数的根式,以及计算初始检测模型的网络参数与基础检测模型的网络参数的参数差,将第一权重参数的根式与参数差相乘,得到第一计算值;
22、若第一计算值小于等于裁切阈值时,根据第一权重参数、初始检测模型的网络参数、基础检测模型的网络参数、第一采样图像集及第二训练图像集,计算初始检测模型的目标函数;
23、若第一计算值大于裁切阈值时,根据裁切阈值、第一权重参数、初始检测模型的网络参数、基础检测模型的网络参数、第一采样图像集及第二训练图像集,计算初始检测模型的目标函数。
24、在本申请实施例的另一种实现方式中,模型训练装置,还包括:权重计算模块;具体的,权重计算模块,用于:
25、根据初始检测模型的目标函数及第一权重参数集,计算优化检测模型的第二权重参数集,其中,第二权重参数集中包含优化检测模型中多个网络参数的第二权重参数,第二权重参数用于表征优化检测模型的网络参数的重要程度,第二权重参数集用于限制优化检测模型中的网络参数的调整范围。
26、在本申请实施例的另一种实现方式中,权重计算模块,还用于:
27、对初始检测模型的目标函数进行多次损失计算,得到多个第三权重参数集,其中,损失计算是通过对初始检测模型的目标函数进行导数计算,第三权重参数集中包含多个第三权重参数,第三权重参数用于表征第二训练图像集对于初始检测模型的网络参数的重要程度;
28、将多个第三权重参数集与第一权重参数集相加,得到优化检测模型对应的第二权重参数集。
29、在本申请实施例的另一种实现方式中,模型训练模块,还用于:
30、获取对初始检测模型进行训练时训练批次对应的图像数量,其中,图像数量为n,n为大于1的整数;
31、从第一采样图像集中取k个样本缺陷图像,以及从第二训练图像集中取l个样本缺陷图像,其中,k与l均为大于等于1的整数,且k+l=n;
32、基于第一采样图像集中的k个样本缺陷图像、第二训练本文档来自技高网...
【技术保护点】
1.一种模型训练方法,其特征在于,包括:
2.如权利要求1所述的模型训练方法,其特征在于,所述基于第一采样图像集、所述第二训练图像集及所述第一权重参数对所述初始检测模型进行训练,以调整所述初始检测模型的网络参数,包括:
3.如权利要求2所述的模型训练方法,其特征在于,所述根据所述第一权重参数、所述初始检测模型的网络参数、所述基础检测模型的网络参数、所述第一采样图像集、所述第二训练图像集,计算所述初始检测模型的目标函数,包括:
4.如权利要求2所述的模型训练方法,其特征在于,所述根据所述第一权重参数、所述初始检测模型的网络参数、所述基础检测模型的网络参数、所述第一采样图像集、所述第二训练图像集,计算所述初始检测模型的目标函数,包括:
5.如权利要求4所述的模型训练方法,其特征在于,所述根据所述裁切阈值,对所述初始检测模型的目标函数进行更新,以限制对所述初始检测模型进行参数更新时的梯度范围,包括:
6.如权利要求1所述的模型训练方法,其特征在于,所述基于第一采样图像集、所述第二训练图像集及所述第一权重对所述初始检测模型进行训
7.如权利要求6所述的模型训练方法,其特征在于,所述根据所述初始检测模型的目标函数及所述第一权重参数集,计算所述优化检测模型的第二权重参数集,包括:
8.如权利要求1所述的模型训练方法,其特征在于,所述基于所述第一采样图像集、所述第二训练图像集及所述第一权重对所述初始检测模型进行训练,包括:
9.如权利要求8所述的模型训练方法,其特征在于,所述从所述第一采样图像集中取K个样本缺陷图像之后,还包括:
10.如权利要求1所述的模型训练方法,其特征在于,所述基于第一采样图像集、所述第二训练图像集及所述第一权重对所述初始检测模型进行训练,以调整所述初始检测模型的网络参数,得到训练后的优化检测模型之前,还包括:
11.一种缺陷检测方法,其特征在于,包括:
12.一种模型训练装置,其特征在于,包括:
13.一种缺陷检测装置,其特征在于,包括:
14.一种计算机设备,其特征在于,包括:存储器、处理器以及总线系统;
15.一种计算机可读存储介质,包括指令,其特征在于,当其在计算机上运行时,使得计算机执行如权利要求1至10中任一项所述的模型训练方法或如权利要求11所述的缺陷检测方法。
16.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行如权利要求1至10中任一项所述的模型训练方法或如权利要求11所述的缺陷检测方法。
...【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:
2.如权利要求1所述的模型训练方法,其特征在于,所述基于第一采样图像集、所述第二训练图像集及所述第一权重参数对所述初始检测模型进行训练,以调整所述初始检测模型的网络参数,包括:
3.如权利要求2所述的模型训练方法,其特征在于,所述根据所述第一权重参数、所述初始检测模型的网络参数、所述基础检测模型的网络参数、所述第一采样图像集、所述第二训练图像集,计算所述初始检测模型的目标函数,包括:
4.如权利要求2所述的模型训练方法,其特征在于,所述根据所述第一权重参数、所述初始检测模型的网络参数、所述基础检测模型的网络参数、所述第一采样图像集、所述第二训练图像集,计算所述初始检测模型的目标函数,包括:
5.如权利要求4所述的模型训练方法,其特征在于,所述根据所述裁切阈值,对所述初始检测模型的目标函数进行更新,以限制对所述初始检测模型进行参数更新时的梯度范围,包括:
6.如权利要求1所述的模型训练方法,其特征在于,所述基于第一采样图像集、所述第二训练图像集及所述第一权重对所述初始检测模型进行训练,以调整所述初始检测模型的网络参数,得到训练后的优化检测模型之后,还包括:
7.如权利要求6所述的模型训练方法,其特征在于,所述根据所述初始检测模型的目标函数...
【专利技术属性】
技术研发人员:曾怡,刘俊,汪铖杰,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。