一种具有难样本感知的强弱双分支网络的长尾识别方法技术

技术编号：35736734 阅读：21 留言：0更新日期：2022-11-26 18:39

本发明专利技术公开了一种具有难样本感知的强弱双分支网络的长尾识别方法，用于解决长尾分布数据识别的难题，所述方法包括构建了强分支和弱分支两个残差网络结构，两个分支的区别在于处理输入数据，一个分支使用强增强数据，另一个分支使用弱增强数据。同时，本发明专利技术通过最大化KL散度来增加两个分支之间的差异。此外，本发明专利技术为该网络结构提出了一种新的学习策略来将学习的重点从差异转到分类，通过构建的难样本感知损失函数，能够更有效地关注到困难样本，进一步提升预测的准确性。进一步提升预测的准确性。进一步提升预测的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种具有难样本感知的强弱双分支网络的长尾识别方法

[0001]本专利技术属于长尾分布视觉识别领域，具体涉及一种具有难样本感知的强弱双分支网络的长尾识别方法。

技术介绍

[0002]现实世界的数据通常呈现长尾分布，其中大多数示例仅来自少数几个类。在这种情况下，每个类的训练实例数量差异很大，从尾部类的几个样本到头部类的数千个样本。最先进的分类模型的性能通常有利于大多数类，导致罕见类的泛化性能较差。
[0003]早期工作通过重新平衡数据分布来缓解长尾训练数据的恶化。这些方法可以有效地减少头类在训练过程中的主导地位，但由于原始数据分布失真，它们往往存在过度拟合尾类的风险。最近，许多两阶段方法与一阶段重新平衡方法相比取得了显著的改进。延迟重采样和延迟重加权方法首先在第一阶段训练具有长尾分布的网络，然后在第二阶段使用不同的重采样或重加权策略调整网络。这种简单的两阶段训练方案已被证明能够处理过度拟合，并在许多长尾基准上设置新的最先进性能。最近还出现了许多将长尾数据分组训练的集成方法，例如LFME和BBN。这些方法通常为每个组训练一...

【技术保护点】

【技术特征摘要】
1.一种具有难样本感知的强弱双分支网络的长尾识别方法，其特征在于：包括如下步骤：(1)构建双分支的网络结构：所述双分支网路结构为相同的残差网络结构，包括弱分支和强分支，其中：弱分支基于传统的数据增强策略，对于强分支在弱分支的基础上随机添加灰度、模糊和颜色失真处理，包括添加正则化项提高两个分支之间的差异；(2)从差异到分类的学习策略：在训练的早期阶段通过差异损失获得尽可能不同的分支，并随着训练的进展逐渐将训练的重点转移到分类；(3)构建难样本感知损失函数，在长尾数据识别中，当且仅当训练接近尾声且每类精度稳定时，通过难样本感知损失代替分类损失LDAM
‑
DRW，所述难样本感知损失函数的表达式如下：其中是第c类的难样本感知损失权重，M是训练示例的数量，C是类的数量，w
c
是第c类的权重，是训练示例m的第c类的目标标签，由Softmax(z)计算；的设置规则如下：其中表示第c类在第e轮迭代的权重，m是动量因子，是第c类在第e轮迭代的验证集上的精度。2.根据权利要求1所述的具有难样本感知的强弱双分支网络的长尾识别方法，其特征在于：所述方法对于图像长尾数据识别的总损失定义如下：L
SDN
＝λ(L
cls
(y,P
s
)+L
cls
(y,P
w
))+(1
‑
λ)L
diff
(P
s
||P
w
)其中λ和1
‑
λ分别是分类损失和差异损失的权重；λ定义如下：上式中，E
max
是总训练迭代数，E是当...

【专利技术属性】
技术研发人员：叶海波，章青衡，胡译仁，杨易，祝予晗，
申请(专利权)人：南京航空航天大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人