一种小规模可靠数据集驱动的噪声修正算法制造技术

技术编号：36268955 阅读：67 留言：0更新日期：2023-01-07 10:09

本发明专利技术公开一种小规模可靠数据集驱动的噪声修正算法，包括S1.采用骨干网络作为特征提取器，并为之搭配两个并行的全连接层作为预测头，输入图像特征，可输出相应的预测概率分布；S2.使用元预测头的预测概率作为伪标签，利用伪标签修正网络图像中错误的标签，联合使用伪标签和网络标签类训练模型对高比例噪声进行缓解；S3.依靠选择网络有效选择出分布内噪声样本，并通过重标注重新利用；本发明专利技术算法能有效地缓解标签噪声问题，并缓解了部分类别存在的高比例噪声问题。在的高比例噪声问题。在的高比例噪声问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种小规模可靠数据集驱动的噪声修正算法

[0001]本专利技术涉及高比例噪声修正
，具体为一种小规模可靠数据集驱动的噪声修正算法。

技术介绍

[0002]噪声数据集的复杂性体现在噪声比例在各个类别之间是非均衡的，噪声类别（分布内、分布外）也是非均衡的，并且噪声比例可能异常地高，标签噪声甚至可能淹没干净样本。这些复杂的实际情况大大增加了处理标签噪声的难度。解决策略的复杂性体现在可以不局限于仅使用深度神经网络模型本身来解决复杂的标签噪声问题，可以设计更贴近于现实应用的算法。在此背景下，部分研究者尝试借助干净可靠的数据集来为模型提供先验知识，以此在含噪的数据集中实现高性能的噪声净化。
[0003]在发表于2018年Conference on Neural Information Processing Systems会议上的“Using trusted data to train deep networks on labels corrupted by severe noise”文章中，提出了一种基于小规模干净样本的标签修正算法，用来克服高比例的标签噪声。该算法借助干净样本提供的先验知识，有效地在高噪声环境下估计了噪声转换矩阵，并使用噪声转换矩阵来修正模型的训练损失。在发表于2017年IEEE International Conference on Computer Vision会议上的“Learning from noisy labels with distillation”文章中，使用了一个规模相对略大的干...

【技术保护点】

【技术特征摘要】
1.一种小规模可靠数据集驱动的噪声修正算法，用于提升高噪声类别的识别准确率，其特征在于，包括如下步骤：S1.对训练集D进行分类；S2.采用一个骨干网络f作为特征提取器，并为之搭配两个并行的全连接层作为预测头，并且输入图像特征，可输出相应的预测概率分布；S3.使用元预测头的预测概率作为伪标签，利用伪标签修正网络图像中错误的标签，联合使用伪标签和网络标签类训练模型对高比例噪声进行缓解，具体为：S31.借助小损失准则在每个小批次中识别标签噪声；S32.在干净样本和分部内燥样本声被识别后，可被用作模型训练；S4.依靠选择网络有效选择出分布内噪声样本，并通过重标注重新利用。2.根据权利要求1所述的一种小规模可靠数据集驱动的噪声修正算法，其特征在于，在S1中，训练集包括网络集和元集，其中含噪的网络训练集和小规模的元集分别表示为和，其中 M
ꢀ≪ꢀ
N，元集 D
m 的标签为人工标注，每个样本表示为 (x
i
, y
i
)，且包含了图像 x
i 以及其对应的标签 y
i
。3.根据权利要求1所述的一种小规模可靠数据集驱动的噪声修正算法，其特征在于，在S2中，预测头分别是网络预测头 hw 和元预测头 hm，骨干网络、网络预测头 hw 和元预测头 hm参数分别记为 θf、θhw以及 θhm；骨干网络 f 和网络预测头 hw 可组成用于细粒度识别的分类网络 h，其参数记为θh={θf,θhw}，此外，还涉及一个选择网络 Snet，其参数定义为 θs；独热标签的分布 q 表示为 q(c = yi|xi) = 1, q(c ≠yi|xi) = 0，其中 c 表示各个类别；为了提升模型的泛化性，采用标签平滑策略，平滑后的标签分布表示为q(c = yi|xi) = 1
ꢀ−ꢀ
ϵ
, q(c ≠yi|xi) =，其中 C 表示类别总数；对于训练集 D 中的每组样本 (xi, yi)，分类网络 h 和元预测头 hm 输出的概率分布分别表示为 p(c|xi;θh) 和 p(c|xi;θhm)；将 p(c|xi;θhm) 简记为 pm(c|xi)；选用常用的交叉熵损失函数来计算每个训练样本的预测概率分布 p(c|xi;θh) 和其标签分布 q(c|xi) 之间的损失，其公式为： (6.1)。4.根据权利要求1所述的一种小规模可靠数据集驱动的噪声修正算法，其特征在于，在S31中，模型在训练过程中会先学习干净的样本，然后再逐步拟合标签噪声，首先在模型预处理阶段T ≤ Ts，T 和 Ts 分别表示训练周期和预处理周期，直接利用整个数据集 D 来训练分类网络 θh；在此阶段，对于每个迭代 t 中的小批次数据，使用学习率为α的随机梯度下降优化器来训练模型：（6.2）经过预处理阶段T ≥ Ts后，...

【专利技术属性】
技术研发人员：沈复民，姚亚洲，张传一，孙泽人，白泞玮，
申请(专利权)人：南京码极客科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人