当前位置: 首页 > 专利查询>东南大学专利>正文

长尾目标检测和细粒度大模型的预训练方法、存储介质及电子设备技术

技术编号:44699166 阅读:12 留言:0更新日期:2025-03-19 20:50
本发明专利技术公开了一种基于动态重平衡对比学习的长尾目标检测和细粒度大模型的预训练方法,包括以下步骤:首先,在不平衡的数据集上,通过动态重平衡策略强化尾类样本的采样,构建初步采样数据集。接下来,采用全局‑局部对比学习机制对初步采样数据集进行训练。最后,构建用于长尾目标检测和大规模细粒度图像特征学习的预训练模型。本发明专利技术通过全局‑局部对比学习、动态重平衡策略和对偶重构机制,提升了模型在图像中细粒度特征表示的能力,显著改善了模型在长尾物体检测中的性能,特别是对尾类样本的检测表现。

【技术实现步骤摘要】

本专利技术属于计算机视觉领域,涵盖长尾目标检测与细粒度大模型两个方向,具体涉及一种基于动态重平衡对比学习的长尾目标检测和细粒度大模型的预训练方法、存储介质及电子设备


技术介绍

1、随着深度学习技术的快速发展,计算机视觉领域取得了显著的进展,尤其是在大规模预训练和微调优化的范式方面。预训练方法的广泛应用使得模型能够捕捉领域特定或任务相关的概念,从而显著提升下游任务的性能。在目标检测领域,传统方法通常依赖大规模数据集进行预训练,以便使模型的骨干网络获得良好的特征表示。然而,这些预训练方法往往忽略了由于长尾数据分布所引发的模型组件随机初始化问题,这在关键检测组件上带来了显著的性能局限。

2、对于长尾数据分布场景,传统的监督预训练模式依赖于标注数据的分布,导致模型在头部类别上表现良好,而在尾部类别上效果欠佳。自监督学习虽然展示了无需依赖标注数据的潜力,使模型能够学习到更为丰富和有效的特征表示,但仍然面临挑战。其中最主要的问题之一是简单性偏差,即深度神经网络倾向于依赖简单的预测模式,忽略了对模型泛化至关重要的复杂特征。这种偏差在尾部类别中尤为突出,因为本文档来自技高网...

【技术保护点】

1.长尾目标检测和细粒度大模型的预训练方法,包括以下步骤:

2.根据权利要求1所述的长尾目标检测和细粒度大模型的预训练方法,其特征在于,步骤1通过动态重平衡策略在图像和实例层面精确控制类别分布并确保尾部类别得到充分表示;提出的动态重平衡策略结合了动态调整机制,使模型在预训练初期学习数据集的总体分布,并逐步将重点转向尾部类别;

3.根据权利要求1所述的长尾目标检测和细粒度大模型的预训练方法,其特征在于,步骤2的全局-局部对比学习和对偶重构机制是模型预训练的核心;

4.根据权利要求3所述的长尾目标检测和细粒度大模型的预训练方法,其特征在于,在步骤3中,将步...

【技术特征摘要】

1.长尾目标检测和细粒度大模型的预训练方法,包括以下步骤:

2.根据权利要求1所述的长尾目标检测和细粒度大模型的预训练方法,其特征在于,步骤1通过动态重平衡策略在图像和实例层面精确控制类别分布并确保尾部类别得到充分表示;提出的动态重平衡策略结合了动态调整机制,使模型在预训练初期学习数据集的总体分布,并逐步将重点转向尾部类别;

3.根据权利要求1所述的长尾目标检测和细粒度大模型的预训练方法,其特征在于,步骤2的全局-局部对比学习和对偶重构机制是模型预训练的核心;

4.根据权...

【专利技术属性】
技术研发人员:魏秀参段晨龙
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1