一种基于动态样本选择的网络图像标签去噪方法技术

技术编号：36096924 阅读：46 留言：0更新日期：2022-12-24 11:15

本发明专利技术公开一种基于动态样本选择的网络图像标签去噪方法，包括S1.首先，将网络提取的样本特征投影到余弦空间，通过样本间的余弦距离确定每个样本的内点集；S2.将网络数据集中的样本送入深度神经网络，最后的全连接层输出样本的特征；本发明专利技术首先将网络提取的样本特征投影到余弦空间，再通过样本间的余弦距离确定每个样本的内点集，最后挑选出最大内点集并使用新的损失进行反向传播，DSSBR方法无需为每个数据集设定丢弃率，并且达到了很好的效果。并且达到了很好的效果。并且达到了很好的效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于动态样本选择的网络图像标签去噪方法

[0001]本专利技术涉及细粒度图像分类
，具体为一种基于动态样本选择的网络图像标签去噪方法。

技术介绍

[0002]与普通的图像分类任务不同，细粒度图像分类主要研究的是如何区分子类。而人工标记的细粒度图像数据集通常需要专家知识，这大大提升了人工标注的代价与难度；为了缓解人工标注的巨大压力，一些研究者将目光转向网络数据集，将网络数据集作为扩充以获得更好的性能。但现实中的网络数据集往往含有不可避免的大量的标签噪声，由于深度神经网络强大的学习能力，这些未经处理的网络数据集很容易误导深度神经网络的训练，从而影响训练性能。常规思路为通过小损失或者余弦相似度来挑选出相对干净的样本来训练细粒度分类网络。然而对于细粒度分类任务来说，样本类间差距小，类内差距大，这使得样本选择更加困难。现有的样本选择方法需要设定固定的丢弃率，对于有些噪声率高的类别，在进行样本选择之后，还会存在噪声样本遗留而影响图像分类性能的问题。

技术实现思路

[0003]由于现有的样本选择方法往往使用固定的丢弃率，本专利技术提出一种基于RANSAC的动态样本选择DSSBR（Dynamic Sample Selection based on RANSAC）的网络图像标签去噪方法。根据计算类内每个样本间的余弦距离来生成内点集并动态的确定每个类别的干净样本集，使用干净样本集进行反向传播，并使用中心损失约束的交叉熵损失更新网络。由于中心损失会使得类内样本特征距离变得更紧密，从而提升内点集选择的准确性，进一步...

【技术保护点】

【技术特征摘要】
1.一种基于动态样本选择的网络图像标签去噪方法，是基于RANSAC的动态样本选择方法DSSBR，其特征在于，包括如下步骤：S1.首先，将网络提取的样本集投影到余弦空间，通过样本间的余弦距离确定每个样本的内点集；S2.将网络数据集中的样本送入深度神经网络，最后的全连接层输出样本的特征，具体为：S21.利用特征归一化来约束特征的L2范数，从而输出Softmax层；S22.对Softmax层的输出进行标签平滑并计算损失以更新网络。2.根据权利要求1所述的一种基于动态样本选择的网络图像标签去噪方法，其特征在于，在S1中，将样本集划分为两个集合：干净样本集与噪声集；样本集；其中干净样本集又包含简单样本与硬样本，假设每个类别都有一个内点集和外点集，分别对应干净样本集与噪声集；网络全连接层提取的图片的特征为，对于样本的类别，分别计算样本与类中其他样本的余弦距离，计算公式如下：
ꢀꢀ
（6.1）（6.2）记录下样本与其他样本的余弦距离：
ꢀꢀꢀ
（6.3）样本与其他样本的最大余弦距离为：
ꢀꢀ
（6.4）。3.根据权利要求2所述的一种基于动态样本选择的网络图像标签去噪方法，其特征在于，将样本与其他样本的余弦距离归一化：
ꢀꢀ
（6.5）归一化后样本与其他样本的余弦距离：
ꢀꢀ
（6.6）
当样本与的余弦距离满足以下条件，则该样本属于的内点集:

【专利技术属性】
技术研发人员：姚亚洲，黄丹，孙泽人，姚钰龙，沈复民，
申请(专利权)人：南京码极客科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人