基于长尾分布概率的外观缺陷检测模型的训练方法及装置制造方法及图纸

技术编号:39589918 阅读:9 留言:0更新日期:2023-12-03 19:42
本发明专利技术公开了一种基于长尾分布概率的外观缺陷检测模型的训练方法及装置,外观缺陷检测模型中包括教师模型和学生模型,该方法包括:将样本图像输入教师模型,得到伪标签信息;获取与伪类别信息对应的伪类别缺陷数量和预设概率;根据伪类别缺陷数量确定伪标签信息对应的采样概率;将采样概率达到预设概率的伪标签信息确定为目标伪标签信息;将样本图像输入学生模型,得到第一外观缺陷检测结果;根据目标伪标签信息和第一外观缺陷检测结果,确定学生模型对应的当前损失;根据当前损失对学生模型进行训练,得到训练后的学生模型;根据训练后的学生模型,对教师模型进行训练,得到训练后的教师模型

【技术实现步骤摘要】
基于长尾分布概率的外观缺陷检测模型的训练方法及装置


[0001]本专利技术涉及缺陷检测
,具体而言,涉及一种基于长尾分布概率的外观缺陷检测模型的训练方法及装置


技术介绍

[0002]集装箱是长途运输大量货物的常用载体,但是由于长距离运输和中转,集装箱易损伤形成缺陷

目前可以通过外观缺陷检测方法对集装箱外观的缺陷进行检测

然而,在实践中发现,集装箱外观缺陷的训练样本数量较少

缺陷区分困难,且多种天气时间模态也对集装箱外观缺陷检测造成了影响,现有的外观缺陷检测方法基于半监督训练无法在样本类别较少的情况下,对外观缺陷检测模型进行有效的训练,导致外观缺陷检测模型的准确率较低

[0003]针对上述的问题,目前尚未提出有效的解决方案


技术实现思路

[0004]本专利技术实施例提供了一种基于长尾分布概率的外观缺陷检测模型的训练方法及装置,通过长尾分布概率,动态选择伪标签进行长尾分布矫正,以至少提高外观缺陷检测模型的准确率

[0005]根据本专利技术实施例的一个方面,提供了一种基于长尾分布概率的外观缺陷检测模型的训练方法,所述外观缺陷检测模型中包括教师模型和学生模型,所述方法包括:
[0006]将样本图像输入所述教师模型,得到伪标签信息;其中,所述伪标签信息中至少包括伪检测框信息和伪类别信息;
[0007]获取与所述伪类别信息对应的伪类别缺陷数量和预设概率;
[0008]根据所述伪类别缺陷数量确定所述伪标签信息对应的采样概率;
[0009]将所述采样概率达到所述预设概率的伪标签信息确定为目标伪标签信息;
[0010]将所述样本图像输入所述学生模型,得到第一外观缺陷检测结果;
[0011]根据所述目标伪标签信息和所述第一外观缺陷检测结果,确定所述学生模型对应的当前损失;
[0012]根据所述当前损失对所述学生模型进行训练,得到训练后的学生模型;
[0013]根据所述训练后的学生模型,利用指数滑动平均算法对所述教师模型进行训练,得到训练后的教师模型

[0014]作为一种可选的实施方式,所述将样本图像输入所述教师模型,得到伪标签信息,包括:
[0015]确定样本图像的图像类型;其中,所述图像类型为有标签类型或无标签类型;
[0016]若所述图像类型为所述无标签类型时,对所述无标签类型的样本图像进行弱数据增强,得到弱数据增强图像;
[0017]将所述弱数据增强图像输入所述教师模型,得到伪标签信息;
[0018]以及,所述将所述样本图像输入所述学生模型,得到第一外观缺陷检测结果,包括:
[0019]对所述无标签类型的样本图像进行强数据增强,得到强数据增强图像;
[0020]将所述强数据增强图像输入所述学生模型,得到第一外观缺陷检测结果

[0021]作为一种可选的实施方式,所述对所述无标签类型的样本图像进行弱数据增强,得到弱数据增强图像,包括:
[0022]对所述无标签类型的样本图像进行随机翻转,得到翻转图像;
[0023]对所述翻转图像进行随机擦除,得到擦除图像;
[0024]对所述擦除图像进行色彩增强,得到弱数据增强图像

[0025]作为一种可选的实施方式,所述对所述无标签类型的样本图像进行强数据增强,得到强数据增强图像,包括:
[0026]对所述无标签类型的样本图像进行图像色彩空间偏置,得到偏置图像;
[0027]对所述偏置图像进行图像模糊,得到强数据增强图像

[0028]作为一种可选的实施方式,若所述图像类型为所述有标签类型时,所述方法还包括:
[0029]确定所述有标签类型的样本图像的样本标签信息;其中,所述样本标签信息中至少包括检测框信息和类别信息;
[0030]将所述有标签类型的样本图像输入所述学生模型,得到第二外观缺陷检测结果;
[0031]根据所述样本标签信息和所述第二外观缺陷检测结果,确定所述学生模型对应的有监督损失

[0032]作为一种可选的实施方式,所述确定所述学生模型对应的有监督损失之后,所述方法还包括:
[0033]根据所述有监督损失对所述学生模型进行训练,得到训练后的学生模型;
[0034]根据所述训练后的学生模型,利用指数滑动平均算法对所述教师模型进行训练,得到训练后的教师模型

[0035]作为一种可选的实施方式,所述第一外观缺陷检测结果中包括检测框预测信息和类别预测信息,所述目标伪标签信息中包括目标伪检测框信息和目标伪类别信息,所述根据所述目标伪标签信息和所述第一外观缺陷检测结果,确定所述学生模型对应的当前损失,包括:
[0036]对所述目标伪类别信息和所述类别预测信息进行交叉熵损失计算,得到类别损失;
[0037]对所述目标伪检测框信息和所述检测框预测信息进行损失计算,得到检测框损失;
[0038]根据所述类别损失和所述检测框损失,确定所述学生模型对应的当前损失

[0039]根据本专利技术实施例的另一方面,还提供了一种基于长尾分布概率的外观缺陷检测模型的训练装置,所述外观缺陷检测模型中包括教师模型和学生模型,所述装置包括:
[0040]第一输入单元,用于将样本图像输入所述教师模型,得到伪标签信息;其中,所述伪标签信息中至少包括伪检测框信息和伪类别信息;
[0041]获取单元,用于获取与所述伪类别信息对应的伪类别缺陷数量和预设概率;
[0042]第一确定单元,用于根据所述伪类别缺陷数量确定所述伪标签信息对应的采样概率;
[0043]第二确定单元,用于将所述采样概率达到所述预设概率的伪标签信息确定为目标伪标签信息;
[0044]第二输入单元,用于将所述样本图像输入所述学生模型,得到第一外观缺陷检测结果;
[0045]第三确定单元,用于根据所述目标伪标签信息和所述第一外观缺陷检测结果,确定所述学生模型对应的当前损失;
[0046]第一训练单元,用于根据所述当前损失对所述学生模型进行训练,得到训练后的学生模型;
[0047]第二训练单元,用于根据所述训练后的学生模型,利用指数滑动平均算法对所述教师模型进行训练,得到训练后的教师模型

[0048]根据本专利技术实施例的又一方面,还提供了一种计算设备,所述计算设备包括:至少一个处理器

存储器和输入输出单元;其中,所述存储器用于存储计算机程序,所述处理器用于调用所述存储器中存储的计算机程序来执行上述基于长尾分布概率的外观缺陷检测模型的训练方法

[0049]根据本专利技术实施例的又一方面,还提供了一种计算机可读存储介质,其包括指令,当其在计算机上运行时,使得计算机执行上述基于长尾分布概率的外观缺陷检测模型的训练方法<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于长尾分布概率的外观缺陷检测模型的训练方法,所述外观缺陷检测模型中包括教师模型和学生模型,所述方法包括:将样本图像输入所述教师模型,得到伪标签信息;其中,所述伪标签信息中至少包括伪检测框信息和伪类别信息;获取与所述伪类别信息对应的伪类别缺陷数量和预设概率;根据所述伪类别缺陷数量确定所述伪标签信息对应的采样概率;将所述采样概率达到所述预设概率的伪标签信息确定为目标伪标签信息;将所述样本图像输入所述学生模型,得到第一外观缺陷检测结果;根据所述目标伪标签信息和所述第一外观缺陷检测结果,确定所述学生模型对应的当前损失;根据所述当前损失对所述学生模型进行训练,得到训练后的学生模型;根据所述训练后的学生模型,利用指数滑动平均算法对所述教师模型进行训练,得到训练后的教师模型
。2.
根据权利要求1所述的基于长尾分布概率的外观缺陷检测模型的训练方法,所述将样本图像输入所述教师模型,得到伪标签信息,包括:确定样本图像的图像类型;其中,所述图像类型为有标签类型或无标签类型;若所述图像类型为所述无标签类型时,对所述无标签类型的样本图像进行弱数据增强,得到弱数据增强图像;将所述弱数据增强图像输入所述教师模型,得到伪标签信息;以及,所述将所述样本图像输入所述学生模型,得到第一外观缺陷检测结果,包括:对所述无标签类型的样本图像进行强数据增强,得到强数据增强图像;将所述强数据增强图像输入所述学生模型,得到第一外观缺陷检测结果
。3.
根据权利要求2所述的基于长尾分布概率的外观缺陷检测模型的训练方法,所述对所述无标签类型的样本图像进行弱数据增强,得到弱数据增强图像,包括:对所述无标签类型的样本图像进行随机翻转,得到翻转图像;对所述翻转图像进行随机擦除,得到擦除图像;对所述擦除图像进行色彩增强,得到弱数据增强图像
。4.
根据权利要求2或3所述的基于长尾分布概率的外观缺陷检测模型的训练方法,所述对所述无标签类型的样本图像进行强数据增强,得到强数据增强图像,包括:对所述无标签类型的样本图像进行图像色彩空间偏置,得到偏置图像;对所述偏置图像进行图像模糊,得到强数据增强图像
。5.
根据权利要求2所述的基于长尾分布概率的外观缺陷检测模型的训练方法,若所述图像类型为所述有标签类型时,所述方法还包括:确定所述有标签类型的样本图像的样本标签信息;其中,所述样本标签信息中至少包括检测框信息和类别信息;将所述有标签类型的样本图像输入所述学生模型,得到第二外观缺陷检测结果;根据所述样...

【专利技术属性】
技术研发人员:黄桁汪瀚严磊
申请(专利权)人:哪吒港航智慧科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1