图像数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号：39296784 阅读：8 留言：0更新日期：2023-11-07 11:04

本申请实施例公开了一种图像数据处理方法、装置、设备及存储介质，应用于人工智能技术领域，该方法包括：获取训练数据集合；通过候选缺陷识别模型对该样本图像中的样本产品进行缺陷识别，得到该样本图像中的样本产品的识别缺陷标签，以及该识别缺陷标签的识别不确定度；根据该识别缺陷标签和该识别不确定度，从该训练数据集合中筛选出标注缺陷标签具有噪声的样本图像，作为噪声样本图像；根据该噪声样本图像更新该训练数据集合，得到更新后的训练数据集合，根据该更新后的训练数据集合对该候选缺陷识别模型进行优化训练。通过本申请能够减少训练数据集合中的具有噪声的标注缺陷标签，提高缺陷识别模型的泛化性能和质检准确度。度。度。

全部详细技术资料下载

【技术实现步骤摘要】
图像数据处理方法、装置、设备及存储介质

[0001]本申请涉及人工智能技术等领域，尤其涉及一种图像数据处理方法、装置、设备及存储介质。

技术介绍

[0002]工业缺陷质检是指对生产制造过程中的工业产品进行质量检测，传统的工业缺陷质检一般是由质检工人进行人工目检。近年来随着人工智能(Artificial Intelligence，AI)技术的兴起，基于机器视觉的AI质检可以大幅提升质检的准确率，并可节省人力成本。
[0003]现有技术中，通过预先训练的缺陷识别模型对工业产品图像进行质检，缺陷识别模型的输入为工业产品图像，输出为指示工业产品图像中的工业产品是否存在缺陷的标签。缺陷识别模型根据多个样本数据训练得到的，每个样本数据包括样本图像和该样本图像的标注缺陷标签，标注缺陷标签用于指示该样本图像中的工业产品是否存在缺陷，样本图像的标注缺陷标签为人工标注得到的。由于人工标注样本图像的标签的过程中带有较多主观性，导致样本图像的标注缺陷标签中带有噪声，如果采用带有噪声的标注缺陷标签对缺陷识别模型进行训练，缺陷识别模型会拟合到这些噪声标签上，进而降低缺陷识别模型的泛化性能，使得训练出的缺陷识别模型质检的准确度不高。

技术实现思路

[0004]本申请实施例提供一种图像数据处理方法、装置、设备及存储介质，减少训练数据集合中的具有噪声的标注缺陷标签，提高缺陷识别模型的泛化性能和质检准确度。
[0005]本申请实施例一方面提供一种图像数据处理方法，包括：
[0006]获取训练数据集合；所述训练数据...

【技术保护点】

【技术特征摘要】
1.一种图像数据处理方法，其特征在于，包括：获取训练数据集合；所述训练数据集合包括样本图像，以及所述样本图像中的样本产品的标注缺陷标签；通过候选缺陷识别模型对所述样本图像中的样本产品进行缺陷识别，得到所述样本图像中的样本产品的识别缺陷标签，以及所述识别缺陷标签的识别不确定度；所述候选缺陷识别模型是通过所述训练数据集合进行优化训练得到的；根据所述识别缺陷标签和所述识别不确定度，从所述训练数据集合中筛选出标注缺陷标签具有噪声的样本图像，作为噪声样本图像；根据所述噪声样本图像更新所述训练数据集合，得到更新后的训练数据集合，根据所述更新后的训练数据集合对所述候选缺陷识别模型进行优化训练。2.如权利要求1所述的方法，其特征在于，所述根据所述识别缺陷标签和所述识别不确定度，从所述训练数据集合中筛选出标注缺陷标签具有噪声的样本图像，作为噪声样本图像，包括：根据所述识别缺陷标签和所述识别不确定度，确定所述样本图像中的样本产品的缺陷得分；将所述训练数据集合中缺陷得分小于得分阈值的样本图像，确定为标注缺陷标签具有噪声的样本图像；将标注缺陷标签具有噪声的样本图像，作为噪声样本图像。3.如权利要求1所述的方法，其特征在于，所述根据所述噪声样本图像更新所述训练数据集合，得到更新后的训练数据集合，包括：从所述训练数据集合中移除所述噪声样本图像以及所述噪声样本图像的标注缺陷标签，得到更新后的训练数据集合；或者，对所述训练数据集合中的所述噪声样本图像的标注缺陷标签进行更新，得到更新后的训练数据集合。4.如权利要求1所述的方法，其特征在于，所述方法还包括：通过初始缺陷识别模型对所述样本图像中的样本产品进行缺陷预测，得到所述样本图像中的样本产品的预测缺陷标签，以及所述预测缺陷标签的预测不确定度；根据所述标注缺陷标签、所述预测缺陷标签以及所述预测不确定度，对所述初始缺陷识别模型进行优化训练，得到候选缺陷识别模型。5.如权利要求4所述的方法，其特征在于，所述根据所述标注缺陷标签、所述预测缺陷标签以及所述预测不确定度，对所述初始缺陷识别模型进行优化训练，得到候选缺陷识别模型，包括：根据所述标注缺陷标签和所述预测缺陷标签，生成所述初始缺陷识别模型的缺陷预测损失；根据所述预测缺陷标签、所述标注缺陷标签和所述预测不确定度，生成所述初始缺陷识别模型的输出分布损失；根据所述初始缺陷识别模型的所述缺陷预测损失和所述输出分布损失，对所述初始缺陷识别模型进行优化训练，得到候选缺陷识别模型。6.如权利要求5述的方法，其特征在于，所述根据所述预测缺陷标签、所述标注缺陷标
签和所述预测不确定度，生成所述初始缺陷识别模型的输出分布损失，包括：确定所述训练数据集合中的样本图像对应的预测缺陷标签的均值；根据所述均值和所述预测不确定度，生成所述预测不确定度应的分布函数，根据所述标注缺陷标签获取所述预测不确定度对应的监督函数；根据所述预测不确定度对应的分布函数和所述监督函数，生成所述初始缺陷识别模型的输出分布损失。7.如权利要求6述的方法，其特征在于，所述根据所述预测不确定度对应的分布函数和所述监督函数，生成所述初始缺陷识别模型的输出分布损失，包括：计算所述预测不确定度对应的分布函数和所述监督函数之间的散度，得到候选输出分布损失；对所述候选输出分布损失进行近似处理，得到所述初始缺陷识别模型的输出分布损失。8.如权利要求5述的方法，其特征在于，所述根据所述初始缺陷识别模型的所述缺陷预测损失和所述输出分布损失，对所述初始缺陷识别模型进行优化训练，得到候选缺陷识别模型，包括：对所...

【专利技术属性】
技术研发人员：张博深，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人