一种基于多模态模型的属性标注方法及装置制造方法及图纸

技术编号:40747795 阅读:16 留言:0更新日期:2024-03-25 20:05
本申请属于属性识别多模态预标注技术领域,特别涉及一种基于多模态模型的属性标注方法及装置。方法包括:步骤一、获取视频,并从所述视频中提取目标图像;步骤二、构建属性集合,所述属性集合中包含不同属性信息的文本描述;步骤三、将所述目标图像以及所述属性集合输入到多模态模型中,得到所述目标图像与各个属性信息的文本描述的匹配值,并根据所述匹配值确定所述目标图像中包含的属性信息。本申请可以实现对目标属性的准确识别和预标注,减轻了手动标注工作负担,提高了计算机视觉应用中目标属性信息的获取效率和精确性;允许用户自定义属性集合,无需受限于固定的属性模型,这使得标注目标属性更加灵活,适应不同的应用需求。

【技术实现步骤摘要】

本申请属于属性识别多模态预标注,特别涉及一种基于多模态模型的属性标注方法及装置


技术介绍

1、在当今的计算机视觉应用中,准确获取和利用行人的属性信息具有极大的重要性。行人属性识别是计算机视觉领域中的一项关键任务,它的目标是从行人的图像或视频中识别和描述不同的属性或特征,如性别、年龄、服装风格等,这些属性信息可以帮助计算机更好地理解和描述图像中的人物,对于行人追踪、行人重识别、行为分析、特定特征行人搜索等安防监控场景非常重要。

2、然而,传统的行人属性识别方法存在一些挑战。首先,属性的标注工作需要耗费大量人力和时间,因为属性种类繁多且标注过程困难。例如,年龄可以分为幼儿、青少年、青年、中年和老年,衣服颜色可以包括红、橙、黄、绿、紫、粉、黑、白、灰和棕十种选项,这使得标注工作繁重且容易出错。其次,传统方法通常依赖于预先训练好的属性模型,这些模型的属性是固定的,如果要在不同场景中新增或修改属性,需要重新训练模型,成本高且不易扩展。

3、因此,希望有一种技术方案来克服或至少减轻现有技术的至少一个上述缺陷。

/>

技术本文档来自技高网...

【技术保护点】

1.一种基于多模态模型的属性标注方法,其特征在于,包括:

2.根据权利要求1所述的基于多模态模型的属性标注方法,其特征在于,步骤一中,所述获取视频,并从所述视频中提取目标图像,包括:

3.根据权利要求1所述的基于多模态模型的属性标注方法,其特征在于,所述属性集合包括多个属性子集合,每个所述属性子集合中包含同一属性下的多个属性信息的文本描述,且每个所述属性信息具有多个文本描述。

4.根据权利要求3所述的基于多模态模型的属性标注方法,其特征在于,步骤三中,所述将所述目标图像以及所述属性集合输入到多模态模型中,得到所述目标图像与各个属性信息的文本描述的匹配值...

【技术特征摘要】

1.一种基于多模态模型的属性标注方法,其特征在于,包括:

2.根据权利要求1所述的基于多模态模型的属性标注方法,其特征在于,步骤一中,所述获取视频,并从所述视频中提取目标图像,包括:

3.根据权利要求1所述的基于多模态模型的属性标注方法,其特征在于,所述属性集合包括多个属性子集合,每个所述属性子集合中包含同一属性下的多个属性信息的文本描述,且每个所述属性信息具有多个文本描述。

4.根据权利要求3所述的基于多模态模型的属性标注方法,其特征在于,步骤三中,所述将所述目标图像以及所述属性集合输入到多模态模型中,得到所述目标图像与各个属性信息的文本描述的匹配值,并根据所述匹配值确定所述目标图像中包含的属性信息,包括:

5.根据权利要求4所述的基于多模态模型的属性标注方法,其特征在于,s32中,通过所述多模态模型将所述目标图像与该属性对应的属性子集合进行匹配,得到匹配值最高的文本描述的过程包...

【专利技术属性】
技术研发人员:贾哲恒唐矗蒲立
申请(专利权)人:北京积加科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1