图像数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号:39296784 阅读:8 留言:0更新日期:2023-11-07 11:04
本申请实施例公开了一种图像数据处理方法、装置、设备及存储介质,应用于人工智能技术领域,该方法包括:获取训练数据集合;通过候选缺陷识别模型对该样本图像中的样本产品进行缺陷识别,得到该样本图像中的样本产品的识别缺陷标签,以及该识别缺陷标签的识别不确定度;根据该识别缺陷标签和该识别不确定度,从该训练数据集合中筛选出标注缺陷标签具有噪声的样本图像,作为噪声样本图像;根据该噪声样本图像更新该训练数据集合,得到更新后的训练数据集合,根据该更新后的训练数据集合对该候选缺陷识别模型进行优化训练。通过本申请能够减少训练数据集合中的具有噪声的标注缺陷标签,提高缺陷识别模型的泛化性能和质检准确度。度。度。

【技术实现步骤摘要】
图像数据处理方法、装置、设备及存储介质


[0001]本申请涉及人工智能技术等领域,尤其涉及一种图像数据处理方法、装置、设备及存储介质。

技术介绍

[0002]工业缺陷质检是指对生产制造过程中的工业产品进行质量检测,传统的工业缺陷质检一般是由质检工人进行人工目检。近年来随着人工智能(Artificial Intelligence,AI)技术的兴起,基于机器视觉的AI质检可以大幅提升质检的准确率,并可节省人力成本。
[0003]现有技术中,通过预先训练的缺陷识别模型对工业产品图像进行质检,缺陷识别模型的输入为工业产品图像,输出为指示工业产品图像中的工业产品是否存在缺陷的标签。缺陷识别模型根据多个样本数据训练得到的,每个样本数据包括样本图像和该样本图像的标注缺陷标签,标注缺陷标签用于指示该样本图像中的工业产品是否存在缺陷,样本图像的标注缺陷标签为人工标注得到的。由于人工标注样本图像的标签的过程中带有较多主观性,导致样本图像的标注缺陷标签中带有噪声,如果采用带有噪声的标注缺陷标签对缺陷识别模型进行训练,缺陷识别模型会拟合到这些噪声标签上,进而降低缺陷识别模型的泛化性能,使得训练出的缺陷识别模型质检的准确度不高。

技术实现思路

[0004]本申请实施例提供一种图像数据处理方法、装置、设备及存储介质,减少训练数据集合中的具有噪声的标注缺陷标签,提高缺陷识别模型的泛化性能和质检准确度。
[0005]本申请实施例一方面提供一种图像数据处理方法,包括:
[0006]获取训练数据集合;所述训练数据集合包括样本图像,以及所述样本图像中的样本产品的标注缺陷标签;
[0007]通过候选缺陷识别模型对所述样本图像中的样本产品进行缺陷识别,得到所述样本图像中的样本产品的识别缺陷标签,以及所述识别缺陷标签的识别不确定度;所述候选缺陷识别模型是通过所述训练数据集合进行优化训练得到的;
[0008]根据所述识别缺陷标签和所述识别不确定度,从所述训练数据集合中筛选出标注缺陷标签具有噪声的样本图像,作为噪声样本图像;
[0009]根据所述噪声样本图像更新所述训练数据集合,得到更新后的训练数据集合,根据所述更新后的训练数据集合对所述候选缺陷识别模型进行优化训练。
[0010]本申请实施例一方面提供一种图像数据处理装置,包括:
[0011]获取模块,用于获取训练数据集合;所述训练数据集合包括样本图像,以及所述样本图像中的样本产品的标注缺陷标签;
[0012]识别模块,用于通过候选缺陷识别模型对所述样本图像中的样本产品进行缺陷识别,得到所述样本图像中的样本产品的识别缺陷标签,以及所述识别缺陷标签的识别不确定度;所述候选缺陷识别模型是通过所述训练数据集合进行优化训练得到的;
[0013]筛选模块,用于根据所述识别缺陷标签和所述识别不确定度,从所述训练数据集合中识别出标注缺陷标签具有噪声的样本图像,作为噪声样本图像;
[0014]训练模块,用于根据所述噪声样本图像更新所述训练数据集合,得到更新后的训练数据集合,根据所述更新后的训练数据集合对所述候选缺陷识别模型进行优化训练。
[0015]可选的,所述筛选模块根据所述识别缺陷标签和所述识别不确定度,从所述训练数据集合中筛选出标注缺陷标签具有噪声的样本图像,作为噪声样本图像,包括:
[0016]根据所述识别缺陷标签和所述识别不确定度,确定所述样本图像中的样本产品的缺陷得分;
[0017]将所述训练数据集合中缺陷得分小于得分阈值的样本图像,确定为标注缺陷标签具有噪声的样本图像;
[0018]将标注缺陷标签具有噪声的样本图像,作为噪声样本图像。
[0019]训练模块包括移除单元和更新单元;
[0020]移除单元,用于从所述训练数据集合中移除所述噪声样本图像以及所述噪声样本图像的标注缺陷标签,得到更新后的训练数据集合;或者,
[0021]更新单元,用于对所述训练数据集合中的所述噪声样本图像的标注缺陷标签进行更新,得到更新后的训练数据集合。
[0022]该装置还包括预测模块和优化模块;
[0023]预测模块,用于通过初始缺陷识别模型对所述样本图像中的样本产品进行缺陷预测,得到所述样本图像中的样本产品的预测缺陷标签,以及所述预测缺陷标签的预测不确定度;
[0024]优化模块,用于根据所述标注缺陷标签、所述预测缺陷标签以及所述预测不确定度,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型。
[0025]可选的,所述优化模块包括第一生成单元、第二生成单元和优化单元;
[0026]第一生成单元,用于根据所述标注缺陷标签和所述预测缺陷标签,生成所述初始缺陷识别模型的缺陷预测损失;
[0027]第二生成单元,用于根据所述预测缺陷标签、所述标注缺陷标签和所述预测不确定度,生成所述初始缺陷识别模型的输出分布损失;
[0028]优化单元,用于根据所述初始缺陷识别模型的所述缺陷预测损失和所述输出分布损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型。
[0029]可选的,第二生成单元根据所述预测缺陷标签、所述标注缺陷标签和所述预测不确定度,生成所述初始缺陷识别模型的输出分布损失,包括:
[0030]确定所述训练数据集合中的样本图像对应的预测缺陷标签的均值;
[0031]根据所述均值和所述预测不确定度,生成所述预测不确定度应的分布函数,根据所述标注缺陷标签获取所述预测不确定度对应的监督函数;
[0032]根据所述预测不确定度对应的分布函数和所述监督函数,生成所述初始缺陷识别模型的输出分布损失。
[0033]可选的,第二生成单元根据所述预测不确定度对应的分布函数和所述监督函数,生成所述初始缺陷识别模型的输出分布损失,包括:
[0034]计算所述预测不确定度对应的分布函数和所述监督函数之间的散度,得到候选输
出分布损失;
[0035]对所述候选输出分布损失进行近似处理,得到所述初始缺陷识别模型的输出分布损失。
[0036]可选的,优化单元根据所述初始缺陷识别模型的所述缺陷预测损失和所述输出分布损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型,包括:
[0037]对所述初始缺陷识别模型的所述缺陷预测损失和所述输出分布损失进行加权求和处理,得到所述初始缺陷识别模型的预测总损失;
[0038]根据所述初始缺陷识别模型的预测总损失,确定所述初始缺陷识别模型的收敛状态;
[0039]若所述初始缺陷识别模型的收敛状态为未收敛状态,则根据所述预测总损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型。
[0040]可选的,优化单元若所述初始缺陷识别模型的收敛状态为未收敛状态,则根据所述预测总损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型,包括:
[0041]若所述初始缺陷识别模型的收敛状态为未收敛状态,则根据所述预测总本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像数据处理方法,其特征在于,包括:获取训练数据集合;所述训练数据集合包括样本图像,以及所述样本图像中的样本产品的标注缺陷标签;通过候选缺陷识别模型对所述样本图像中的样本产品进行缺陷识别,得到所述样本图像中的样本产品的识别缺陷标签,以及所述识别缺陷标签的识别不确定度;所述候选缺陷识别模型是通过所述训练数据集合进行优化训练得到的;根据所述识别缺陷标签和所述识别不确定度,从所述训练数据集合中筛选出标注缺陷标签具有噪声的样本图像,作为噪声样本图像;根据所述噪声样本图像更新所述训练数据集合,得到更新后的训练数据集合,根据所述更新后的训练数据集合对所述候选缺陷识别模型进行优化训练。2.如权利要求1所述的方法,其特征在于,所述根据所述识别缺陷标签和所述识别不确定度,从所述训练数据集合中筛选出标注缺陷标签具有噪声的样本图像,作为噪声样本图像,包括:根据所述识别缺陷标签和所述识别不确定度,确定所述样本图像中的样本产品的缺陷得分;将所述训练数据集合中缺陷得分小于得分阈值的样本图像,确定为标注缺陷标签具有噪声的样本图像;将标注缺陷标签具有噪声的样本图像,作为噪声样本图像。3.如权利要求1所述的方法,其特征在于,所述根据所述噪声样本图像更新所述训练数据集合,得到更新后的训练数据集合,包括:从所述训练数据集合中移除所述噪声样本图像以及所述噪声样本图像的标注缺陷标签,得到更新后的训练数据集合;或者,对所述训练数据集合中的所述噪声样本图像的标注缺陷标签进行更新,得到更新后的训练数据集合。4.如权利要求1所述的方法,其特征在于,所述方法还包括:通过初始缺陷识别模型对所述样本图像中的样本产品进行缺陷预测,得到所述样本图像中的样本产品的预测缺陷标签,以及所述预测缺陷标签的预测不确定度;根据所述标注缺陷标签、所述预测缺陷标签以及所述预测不确定度,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型。5.如权利要求4所述的方法,其特征在于,所述根据所述标注缺陷标签、所述预测缺陷标签以及所述预测不确定度,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型,包括:根据所述标注缺陷标签和所述预测缺陷标签,生成所述初始缺陷识别模型的缺陷预测损失;根据所述预测缺陷标签、所述标注缺陷标签和所述预测不确定度,生成所述初始缺陷识别模型的输出分布损失;根据所述初始缺陷识别模型的所述缺陷预测损失和所述输出分布损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型。6.如权利要求5述的方法,其特征在于,所述根据所述预测缺陷标签、所述标注缺陷标
签和所述预测不确定度,生成所述初始缺陷识别模型的输出分布损失,包括:确定所述训练数据集合中的样本图像对应的预测缺陷标签的均值;根据所述均值和所述预测不确定度,生成所述预测不确定度应的分布函数,根据所述标注缺陷标签获取所述预测不确定度对应的监督函数;根据所述预测不确定度对应的分布函数和所述监督函数,生成所述初始缺陷识别模型的输出分布损失。7.如权利要求6述的方法,其特征在于,所述根据所述预测不确定度对应的分布函数和所述监督函数,生成所述初始缺陷识别模型的输出分布损失,包括:计算所述预测不确定度对应的分布函数和所述监督函数之间的散度,得到候选输出分布损失;对所述候选输出分布损失进行近似处理,得到所述初始缺陷识别模型的输出分布损失。8.如权利要求5述的方法,其特征在于,所述根据所述初始缺陷识别模型的所述缺陷预测损失和所述输出分布损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型,包括:对所...

【专利技术属性】
技术研发人员:张博深
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1