基于知识蒸馏的瓷砖色差检测方法及装置制造方法及图纸

技术编号:30524524 阅读:17 留言:0更新日期:2021-10-27 23:09
本发明专利技术涉及基于知识蒸馏的瓷砖色差检测方法,包括以下:获取瓷砖样本的图像作为样本数据;将所述样本数据划分为训练集以及测试集;输入训练集的瓷砖的色号以及标签至教师网络,对所述教师网络进行训练,得到训练完成的教师网络模型;输入瓷砖图像至训练完成的教师网络模型,得到色号软标签,将瓷砖图像、色号的软标签以及色号的硬标签共同输入学生网络,运用梯度下降的方法对瓷砖进行训练,得到训练完成的学生网络模型;获取待检测的瓷砖图像,将待检测的瓷砖图像输入学生网络模型,得到瓷砖色号标签。本发明专利技术采用蒸馏学习的方法训练神经网络模型,可实现对瓷砖色差的快速检测;简化了大规模神经网络的结构,提升瓷砖检测的速度的同时保证检测的精度。的同时保证检测的精度。的同时保证检测的精度。

【技术实现步骤摘要】
基于知识蒸馏的瓷砖色差检测方法及装置


[0001]本专利技术涉及人工智能领域,尤其涉及基于知识蒸馏的瓷砖色差检测方法及装置。

技术介绍

[0002]瓷砖在生产中,由于烧制环节发生化学反应,导致个别瓷砖具有色差。相关生产要求,需要把具有色差的瓷砖进行检测得到对应的色号并按色号归类分拣。
[0003]现有技术往往分为两种是,一种是通过人工进行分拣,这种方式往往费时费力;另一种是智能分拣,但是目前的瓷砖智能分拣技术往往会面临精度不高、调试困难的问题。

技术实现思路

[0004]本专利技术的目的是为了至少解决现有技术的不足之一,提供基于知识蒸馏的瓷砖色差检测方法及装置。
[0005]为了实现上述目的,本专利技术采用以下的技术方案:
[0006]具体的,提出基于知识蒸馏的瓷砖色差检测方法,包括以下:
[0007]获取瓷砖样本的图像作为样本数据;
[0008]将所述样本数据划分为训练集以及测试集;
[0009]输入训练集的瓷砖的色号以及标签至教师网络,运用梯度下降的方法对所述教师网络进行训练,得到训练完成的教师网络模型;
[0010]输入瓷砖图像至训练完成的教师网络模型,得到色号软标签,将瓷砖图像、色号的软标签以及色号的硬标签共同输入学生网络,运用梯度下降的方法对瓷砖进行训练,得到训练完成的学生网络模型;
[0011]获取待检测的瓷砖图像,将待检测的瓷砖图像输入学生网络模型,得到瓷砖色号标签。
[0012]进一步,上述将所述样本数据划分为训练集以及测试集的过程具体包括以下,
[0013]对所述数据样本进行K折交叉验证,将所述数据样本平均分成K份,将其中K

1份作为训练集,将其余1分作为测试集,并在完成一次训练后,在训练集中继续抽出1份样本,将测试集放回训练集,重复此过程K次,使训练集样本被选择。
[0014]进一步,所述方法还包括,
[0015]瓷砖样本的图像为3维RGB图像,其大小为512x512,在训练过程中使用随机翻转、增加高斯模糊和增加高斯噪声的方法对训练集进行拓展,在测试和预测过程不使用以上拓展。
[0016]进一步,具体的,教师网络使用VGG19网络并使用预训练权重,以加速模型收敛能力,使用Adam梯度下降方法对VGG19网络进行训练,学习率设置为0.001,其损失函数使用交叉熵函数,其公式为:
[0017][0018]其中z
i
为输出层第i个节点的输出值,C为输出节点的个数,即分类的类别个数。
[0019]进一步,具体的,所述学生网络模型结构包括卷积神经网络,其中卷积使用二维卷积Conv2d,卷积核大小为3,卷积步长为1,对边缘使用padding操作,ReLU函数在卷积后对模型增加非线性化的能力,模型使用2维最大池化MaxPool2d,对图像特征进行降维,使用平均池化AdaptiveAvgPool2d对模型进行压缩,最后使用线性层Linear对瓷砖色号进行分类,
[0020]学生网络使用Adam梯度下降方法进行训练,学习率设置为0.001,损失函数由软标签和硬标签的损失线性叠加,其公式其下:
[0021]Loss=λL
soft
+(1

λ)L
hard
[0022]其中,λ为蒸馏学习的超参数,设置为0.5,L
soft
为软标签损失,L
hard
为硬标签损失。
[0023]进一步,软标签损失L
soft
是衡量学生网络输出与教师网络里输出的误差,硬标签损失L
hard
是衡量学生网络输出与真实标签输出的误差,这两个损失函数使用改进的sofimax函数进行计算,其公式其下:
[0024][0025]其中z
i
为网络最后线性层中第i个节点的输出值,C为输出节点的个数,T为温度参数,设置为2。
[0026]进一步,上述教师网络以及学生网络训练停止的准则包括以下,
[0027]通过使用召回率对学生网络以及教师网络模型进行预测,其公式如下:
[0028][0029]其中,TP是把原来的正类预测成正类的数量,FN是是把原来的正类预测为负类的数量;
[0030]教师网络训练时,当测试集K折平均召回率高于第一阈值时,停止网络训练,学生网络训练时,当测试集K折平均召回率高于第二阈值时,停止网络训练。
[0031]进一步,具体的,所述第一阈值为99%,所述第二阈值为97%。
[0032]本专利技术还提出基于知识蒸馏的瓷砖色差检测装置,包括以下:
[0033]样本数据获取模块,用于获取瓷砖样本的图像作为样本数据;
[0034]数据划分模块,用于将所述样本数据划分为训练集以及测试集;
[0035]教师网络模块,用于输入训练集的瓷砖的色号以及标签至教师网络,运用梯度下降的方法对所述教师网络进行训练,得到训练完成的教师网络模型;
[0036]学生网络模块,用于输入瓷砖图像至训练完成的教师网络模型,得到色号软标签,将瓷砖图像、色号的软标签以及色号的硬标签共同输入学生网络,运用梯度下降的方法对瓷砖进行训练,得到训练完成的学生网络模型;
[0037]检测模块,用于获取待检测的瓷砖图像,将待检测的瓷砖图像输入学生网络模型,得到瓷砖色号标签。
[0038]本专利技术还提出一种计算机可读存储的介质,所述计算机可读存储的介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1

8中任一项所述方法的步骤。
[0039]本专利技术的有益效果为:
[0040]本专利技术采用蒸馏学习的方法训练神经网络模型,可实现对瓷砖色差的快速检测;简化了大规模神经网络的结构,提升瓷砖检测的速度的同时保证检测的精度。
附图说明
[0041]通过对结合附图所示出的实施方式进行详细说明,本公开的上述以及其他特征将更加明显,本公开附图中相同的参考标号表示相同或相似的元素,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,在附图中:
[0042]图1所示为本专利技术基于知识蒸馏的瓷砖色差检测方法流程图;
[0043]图2所示为本专利技术基于知识蒸馏的瓷砖色差检测方法的训练总架构图;
[0044]图3所示为本专利技术基于知识蒸馏的瓷砖色差检测方法的学生网络模型的具体结构示意图;
[0045]图4所示为本专利技术基于知识蒸馏的瓷砖色差检测方法的测试过程示意图。
具体实施方式
[0046]以下将结合实施例和附图对本专利技术的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本专利技术的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。附图中各处使用的相同的附图标记指示相同或相似的部分。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于知识蒸馏的瓷砖色差检测方法,其特征在于,包括以下:获取瓷砖样本的图像作为样本数据;将所述样本数据划分为训练集以及测试集;输入训练集的瓷砖的色号以及标签至教师网络,运用梯度下降的方法对所述教师网络进行训练,得到训练完成的教师网络模型;输入瓷砖图像至训练完成的教师网络模型,得到色号软标签,将瓷砖图像、色号的软标签以及色号的硬标签共同输入学生网络,运用梯度下降的方法对瓷砖进行训练,得到训练完成的学生网络模型;获取待检测的瓷砖图像,将待检测的瓷砖图像输入学生网络模型,得到瓷砖色号标签。2.根据权利要求1所述的基于知识蒸馏的瓷砖色差检测方法,其特征在于,上述将所述样本数据划分为训练集以及测试集的过程具体包括以下,对所述数据样本进行K折交叉验证,将所述数据样本平均分成K份,将其中K

1份作为训练集,将其余1分作为测试集,并在完成一次训练后,在训练集中继续抽出1份样本,将测试集放回训练集,重复此过程K次,使训练集样本被选择。3.根据权利要求2所述的基于知识蒸馏的瓷砖色差检测方法,其特征在于,所述方法还包括,瓷砖样本的图像为3维RGB图像,其大小为512x512,在训练过程中使用随机翻转、增加高斯模糊和增加高斯噪声的方法对训练集进行拓展,在测试和预测过程不使用以上拓展。4.根据权利要求1所述的基于知识蒸馏的瓷砖色差检测方法,其特征在于,具体的,教师网络使用VGG19网络并使用预训练权重,以加速模型收敛能力,使用Adam梯度下降方法对VGG19网络进行训练,学习率设置为0.001,其损失函数使用交叉熵函数,其公式为:其中z
i
为输出层第i个节点的输出值,C为输出节点的个数,即分类的类别个数。5.根据权利要求4所述的基于知识蒸馏的瓷砖色差检测方法,其特征在于,具体的,所述学生网络模型结构包括卷积神经网络,其中卷积使用二维卷积Conv2d,卷积核大小为3,卷积步长为1,对边缘使用padding操作,ReLU函数在卷积后对模型增加非线性化的能力,模型使用2维最大池化MaxPool2d,对图像特征进行降维,使用平均池化AdaptiveAvgPool2d对模型进行压缩,最后使用线性层Linear对瓷砖色号进行分类,学生网络使用Adam梯度下降方法进行训练,学习率设置为0.001,损失函数由软标签和硬标签的损失线性叠加,其公式其下:Los...

【专利技术属性】
技术研发人员:练洋奇陈新度吴磊林行
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1