System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种样本均衡学习类增量目标计数建模方法及装置制造方法及图纸_技高网

一种样本均衡学习类增量目标计数建模方法及装置制造方法及图纸

技术编号:41326979 阅读:7 留言:0更新日期:2024-05-13 15:04
本发明专利技术属于计算机视觉领域,具体为一种样本均衡学习类增量目标计数建模方法,旨在解决模型在类增量目标计数过程中由于新旧类样本失衡导致的灾难性遗忘问题,同时提高模型对新类的感知能力以及帮助模型更好的实现稳定性与可塑性的平衡。本发明专利技术主要包括提出的两个新损失函数:(1)样本再平衡损失函数,根据其样本计数的难易程度动态再平衡新旧类样本的损失贡献,使得模型在更关注旧类样本缓解灾难性遗忘的同时,提高其对新类样本的感知能力;(2)梯度衰减损失函数,通过动态约束计数模型的梯度信息,在不损害其可塑性的情况下,最大限度地保留旧知识,更好的实现稳定性与可塑性的平衡。

【技术实现步骤摘要】

本专利技术涉及计算机视觉领域,具体是涉及一种样本均衡学习类增量目标计数建模方法及装置


技术介绍

1、目标计数在计算机视觉领域是一个及其重要的任务,它旨在实现感兴趣目标的数目统计。常见的目标种类包括人群、车辆、动物、植物以及害虫等。基于这些统计的信息可以针对目标进行有效的管理,同时可以对当前态势进行积极的干预,避免不必要的损失。

2、在真实的世界中,环境在动态变化,同时类别也在动态变化。固定类别的目标计数任务不再适用这些动态变化。类增量目标根据类别和目标统计的变化进行任务的增加,实现对新类别的学习和预测。但该任务在学习新任务的同时面临灾难遗忘。一种有效的解决策略是选择一些旧类的样本与新类样本一起完成对新模型的训练,即基于复现的策略。然而,由于样本在新旧类之间的分布不均衡,模型往往偏向于新类而忽略旧类导致灾难性遗忘依然比较严重。


技术实现思路

1、专利技术目的:为了解决上述问题,本专利技术提出一种样本均衡学习类增量目标计数建模方法及装置。本专利技术两个重要的损失函数:样本再平衡损失和梯度衰减损失,能够提高类增量目标计数模型的计数准确性以及泛化能力。

2、技术方案:本专利技术所述的一种样本均衡学习类增量目标计数建模方法:

3、步骤s1:加载训练数据集,对数据集中的数据执行在线数据增广;

4、步骤s2:构建类增量目标计数网络模型;

5、步骤s3:设置网络训练参数,并计算分类损失、蒸馏损失、样本再平衡损失和梯度衰减损失进而对网络的参数进行优化;

6、步骤s4:通过验证数据集对当前训练模型进行验证,保存误差较小的模型;

7、步骤s5:如果当前类别的迭代次数完成后,选取代表性的样本构建范例集,并与新类的样本数据进行组合构成新的训练数据集;如果当前类别的迭代次数未完成,执行步骤s3;

8、步骤s6:使用测试数据对保存的模型进行测试,得出最终的计数结果。

9、进一步的,其特征在于,步骤s1中,对数据集中的数据执行在线数据增广具体如下:

10、步骤s1-1:图像进行随机缩放;

11、步骤s1-2:图像进行随机位置裁剪,裁剪大小为400*400;

12、步骤s1-3:图像进行随机翻转,概率为0.5;

13、步骤s1-4:图像进行伽马校正,校正系数范围为0.5-1.5,概率为0.3;

14、步骤s1-5:图像进行灰度图转换,概率为0.1。

15、进一步的,其特征在于,步骤s2中,构建类增量目标计数网络模型具体包括:

16、主干网络,用于提取网络输入的高级语义信息;

17、回归模块,用于对高级语义信息进行特征迁移,实现目标密度图的回归;

18、分类模块:利用高级语义信息对网络输入的类别进行识别;

19、类增量模块,根据新增类别的数量对回归模块最后一个回归层和分类模块的输出节点进行增加;

20、进一步的,其特征在于,步骤s3中,设置网络训练参数,并计算分类损失、样本再平衡损失和梯度衰减损失进而对网络的参数进行优化,具体步骤如下:

21、步骤s3-1:设置训练的迭代次数,学习速率,范例集内存大小(数目)等必要参数。在网络训练之前,如果是在学习基类阶段,对所述类增量目标计数网络模型进行初始化。如果不是基类阶段,直接用上一阶段训练好的网络模型对当前阶段网络模型进行初始化;在网络训练时,直接跳过步骤s3-1;

22、步骤s3-2:将训练数据送入类增量目标计数网络模型,分别得到第t阶段网络预测的目标密度图yt和分类结果pt,如果第t阶段不是基类阶段,将范例集ψ中的样本送入第t-1阶段训练到的网络模型中,得到目标密度图yt-1和分类结果pt-1;

23、步骤s3-3:计算分类损失、蒸馏损失、样本再平衡损失和梯度衰减损失的加和;

24、步骤s3-4:利用adam优化器对网络模型中的参数进行优化;

25、进一步的,其特征在于,所述步骤s3-3,样本再平衡损失lrebalance,具体如下:

26、lrebalance=[pia+β]*lden

27、

28、其中,|·|表示绝对值,∑表示计算密度图中所有元素之和,表示第t阶段第i个样本的预测密度图输出,表示第t阶段第i个样本的标签,α表示聚焦参数,piα表示第i个样本的调制因子,β表示样本再平衡损失的超参数,lden为mse损失,计算如下:

29、

30、其中n表示每个批次训练的样本总数,||·||2表示2-范数。

31、进一步的,其特征在于,所述步骤s3-3,梯度衰减损失ldecay,具体如下:

32、

33、其中,ht表示第t阶段类别的数量,φh表示第h个输出头的权重,ω表示梯度衰减损失的超参,||·||1表示1-范数。

34、进一步的,其特征在于,所述步骤s3-3,计算分类损失、蒸馏损失、样本再平衡损失和梯度衰减损失的加和ltotal,具体如下:

35、ltotal=lcls+(1-l)*lrebalance+l*lkd+ldecay

36、其中,λ表示损失之间的超参,蒸馏损失lkd:

37、

38、其中,表示第t-1阶段第i个范例集ψ中的样本的预测密度图输出,||·||2表示2-范数;

39、交叉熵损失lcls:

40、

41、其中,表示第i个样本的分类标签,表示第i个样本类别识别的结果。

42、本专利技术所述的一种样本均衡学习类增量目标计数装置,包括处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法。

43、有益效果:与现有技术相比,本专利技术的有益效果如下:

44、1)本专利技术设计了一种样本再平衡损失,根据样本的计数误差动态调整其损失贡献,从而在缓解模型对旧类遗忘的同时增强其对新类的感知能力,提高计数精度。

45、2)本专利技术设计了一种梯度衰减损失,通过约束计数模型的梯度信息,能够在不损害模型可塑性的前提下,最大限度地保留旧知识,更好地帮助计数模型实现稳定性与可塑性的平衡。

本文档来自技高网...

【技术保护点】

1.一种样本均衡学习类增量目标计数建模方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种样本均衡学习类增量目标计数建模方法,其特征在于,步骤S1中,对数据集中的数据执行在线数据增广具体如下:

3.根据权利要求1所述的一种样本均衡学习类增量目标计数建模方法,其特征在于,步骤S2中,构建类增量目标计数网络模型具体包括:

4.根据权利要求1所述的一种样本均衡学习类增量目标计数建模方法,其特征在于,步骤S3中,设置网络训练参数,并计算分类损失、样本再平衡损失和梯度衰减损失进而对网络的参数进行优化,具体步骤如下:

5.根据权利要求4所述的一种样本均衡学习类增量目标计数建模方法,其特征在于,所述步骤S3-3,样本再平衡损失Lrebalance,具体如下:

6.根据权利要求4所述的一种样本均衡学习类增量目标计数建模方法,其特征在于,所述步骤S3-3,梯度衰减损失Ldecay,具体如下:

7.根据权利要求4所述的一种样本均衡学习类增量目标计数建模方法,其特征在于,所述步骤S3-3,计算分类损失、蒸馏损失、样本再平衡损失和梯度衰减损失的加和Ltotal,具体如下:

8.一种样本均衡学习类增量目标计数装置,包括处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于:所述处理器执行所述程序时实现权利要求1-7中任意一项所述的方法。

...

【技术特征摘要】

1.一种样本均衡学习类增量目标计数建模方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种样本均衡学习类增量目标计数建模方法,其特征在于,步骤s1中,对数据集中的数据执行在线数据增广具体如下:

3.根据权利要求1所述的一种样本均衡学习类增量目标计数建模方法,其特征在于,步骤s2中,构建类增量目标计数网络模型具体包括:

4.根据权利要求1所述的一种样本均衡学习类增量目标计数建模方法,其特征在于,步骤s3中,设置网络训练参数,并计算分类损失、样本再平衡损失和梯度衰减损失进而对网络的参数进行优化,具体步骤如下:

5.根据权利要求4所述的一种样本均衡学习类...

【专利技术属性】
技术研发人员:姜胜芹王庆方耀煜刘青山
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1