一种基于监控场景的长尾目标检测方法技术

技术编号:41489127 阅读:24 留言:0更新日期:2024-05-30 14:36
本发明专利技术公开了一种基于监控场景的长尾目标检测方法,涉及目标检测相关领域,该方法包括:基于监测场景,构建长尾目标检测数据集;根据长尾目标检测数据集,利用预训练CLIP模型生成语义信息;构建目标检测器;构建语义分支,将语义信息作为软标签进行数据标注,输入语义分支进行学习;构建损失函数,对目标检测器、语义分支进行模型训练收敛,得到检测模型进行目标检测。解决了现有技术在处理长尾目标检测问题时存在的语义特征歧义和语义信息损失,从而导致目标分类的准确性不高的技术问题,达到了通过利用丰富的语义信息解决语义特征歧义和语义信息损失,从而提高目标分类的准确性的技术效果。

【技术实现步骤摘要】

本申请涉及目标检测相关领域,尤其涉及一种基于监控场景的长尾目标检测方法


技术介绍

1、在监控视频图像的场景解析中,二维目标检测的视觉算法是主流方法,它使用矩形框来标示图像中的多个目标位置。实际监控场景中,目标类别存在明显的频率差异,其中频繁和经常出现的类别(如车辆、行人等)占少数,而不常出现的类别(如篮球、沙发等)占多数。这种数据的长尾分布问题给目标检测算法带来了挑战。现有的长尾目标检测方法中,当采用图像级标签时,通常只关注图像中的显著区域,这可能导致提取的语义特征存在歧义,并且在进行目标检测时,一般需要对原始图像进行裁剪、缩放等数据变换操作,这些变换操作会导致图像中某些区域的语义信息丢失或变形,此外,由于长尾分布问题中尾部类别的样本数量较少,这些类别在训练过程中无法得到充分的学习,从而导致其语义信息的损失。

2、现阶段相关技术中,在处理长尾目标检测问题时存在语义特征歧义和语义信息损失,从而导致目标分类的准确性不高的技术问题。


技术实现思路

1、本申请通过提供一种基于监控场景的长尾目标检测方法,本文档来自技高网...

【技术保护点】

1.一种基于监控场景的长尾目标检测方法,其特征在于,所述方法包括:

2.如权利要求1所述的一种基于监控场景的长尾目标检测方法,其特征在于,所述基于监测场景,构建长尾目标检测数据集,包括:

3.如权利要求2所述的一种基于监控场景的长尾目标检测方法,其特征在于,所述利用预训练CLIP模型生成语义信息,包括:

4.如权利要求3所述的一种基于监控场景的长尾目标检测方法,其特征在于,所述获得图像级语义信息,包括:

5.如权利要求3所述的一种基于监控场景的长尾目标检测方法,其特征在于,所述获得目标级语义信息,包括:

6.如权利要求1所述的一...

【技术特征摘要】

1.一种基于监控场景的长尾目标检测方法,其特征在于,所述方法包括:

2.如权利要求1所述的一种基于监控场景的长尾目标检测方法,其特征在于,所述基于监测场景,构建长尾目标检测数据集,包括:

3.如权利要求2所述的一种基于监控场景的长尾目标检测方法,其特征在于,所述利用预训练clip模型生成语义信息,包括:

4.如权利要求3所述的一种基于监控场景的长尾目标检测方法,其特征在于,所述获得图像级语义信息,包括:

5.如权利...

【专利技术属性】
技术研发人员:闫军丁丽珠
申请(专利权)人:智慧互通科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1