【技术实现步骤摘要】
基于图一致性和半监督模型的标签含噪图像分类方法
[0001]本专利技术涉及计算机视觉和人工智能
,更具体而言,涉及基于图一致性和半监督模型的标签含噪图像分类方法。
技术介绍
[0002]现今深度学习取得巨大的成功,离不开大量正确的标注数据,然而这些大规模数据集的标注经常需要花费了巨大的人力、财力和时间成本,甚至一些数据(例如医学图像),对于专家而言,也难以正确分类数据。而且目前计算机视觉研究的场景繁多,如此高昂的数据集收集成本为具体场景下的模型训练带了巨大的挑战。
[0003]为解决收集精确标注数据时成本过高的问题,众包(Crowdsourcing)和网络查询(Web Query)两种低成本的方案成为企业和大型机构比较倾向的选择。众包方案雇佣大量廉价工人,相较于专家标注团队效率更高且具有更低的成本,但是高效的后果是标注质量差于专家团队;后者依托于网络搜索引擎的海量数据以及强大搜索能力,能够在短时间内从如谷歌、百度等公开平台上获取大量由用户标注的图像数据。两种方法虽然显著地提高了图像标注的效率,但图像标注必然存在 ...
【技术保护点】
【技术特征摘要】
1.基于图一致性和半监督模型的标签含噪图像分类方法,其特征在于:包括以下步骤:S1:对训练集中全量噪声标签数据进行训练,初始化模型;S2:根据所述步骤S1中的初始化模型得出样本的分布,然后采用高斯混合模型根据所述样本的分布将样本划分为标签正确样本和标签不正确样本;S3:对所述步骤S2中得到的样本进行分类筛选:标签正确的样本保留标签,作为有标签图像,标签错误的样本抹除标签,作为无标签图像;将所述有标签图像和所述无标签图像均传输到半监督模型中;S4:对所述有标签图像和所述无标签图像进行不同的数据增强;S5:将增强后的所述有标签图像和所述无标签图像,送入半监督模型进行训练;S6:对所述S5步骤中半监督模型训练得到的结果进行图编码,得到一致性图;S7:采用类分布一致性和图一致性正则化共同优化模型,并更新样本标签;S8:将所述步骤S7约束模型得到的半监督模型作为推理模型,将测试集的图像数据输入到其中,得到噪音标签数据分类的结果。2.根据权利要求1所述的基于图一致性和半监督模型的标签含噪图像分类方法,其特征在于:使用包含噪声标签的全量数据进行ResNet50模型训练;在模型训练阶段的第一个epoch,读取标签正确样本和标签错误样本数据;对所述数据进行增强,所述增强为进行翻转、裁剪、移位数据增强;将增强后的数据送入ResNet50模型,并且同时训练两个ResNet50模型;模型输出概率分布,根据概率分布计算交叉熵损失函数,并进行反向传播,从而训练该模型并保存模型参数。3.根据权利要求2所述的基于图一致性和半监督模型的标签含噪图像分类方法,其特征在于:将模型输出的概率分布输入高斯混合模型,通过高斯混合模型进行分布计算,混合高斯模型可以用下式表示:用两个二维高斯分布两个聚类,分量数K=2,且满足:其中,N(x∣μ
k
,∑
k
)为:混合模型中的第k个分量(component);π
k
为:每个分量N(x∣μ
k
,∑
k
)的权重。4.根据权利要求3所述的基于图一致性和半监督模型的标签含噪图像分类方法,其特征在于:所述步骤S3包括:S301、对于步骤三得到的p(x),如果p(x)大于等于0.5,其标签是正确的,保存原始标签;如果p(x)小于0.5,其标签是错误的,不保存标签;S302、将有标签图像和无标签图像一起送入到半监督模型准备训练。5.根据权利要求1所述的基于图一致性和半监督模型的标签含噪图像分类方法,其特征在于:所述步骤S4包括:S401、对于所述有标签图像进行弱增强操作,对于所述无标签图像分别采用弱增强技
术和AutoAugment技术进行数据增强,所述弱增强操作包括进行翻转、裁剪和移位数据增强;S402、同时对所述有标签图像和所述无标签图像进行mixup操作;Mixup可以用以下公式来表示:式来表示:其中,x
i
和x
j
...
【专利技术属性】
技术研发人员:佟子业,惠维,赵鲲,峁子富,郑艳,
申请(专利权)人:西安和硕物流科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。