一种基于多模态模型的属性标注方法及装置制造方法及图纸

技术编号：40747795 阅读：16 留言：0更新日期：2024-03-25 20:05

本申请属于属性识别多模态预标注技术领域，特别涉及一种基于多模态模型的属性标注方法及装置。方法包括：步骤一、获取视频，并从所述视频中提取目标图像；步骤二、构建属性集合，所述属性集合中包含不同属性信息的文本描述；步骤三、将所述目标图像以及所述属性集合输入到多模态模型中，得到所述目标图像与各个属性信息的文本描述的匹配值，并根据所述匹配值确定所述目标图像中包含的属性信息。本申请可以实现对目标属性的准确识别和预标注，减轻了手动标注工作负担，提高了计算机视觉应用中目标属性信息的获取效率和精确性；允许用户自定义属性集合，无需受限于固定的属性模型，这使得标注目标属性更加灵活，适应不同的应用需求。

全部详细技术资料下载

【技术实现步骤摘要】

本申请属于属性识别多模态预标注，特别涉及一种基于多模态模型的属性标注方法及装置。

技术介绍

1、在当今的计算机视觉应用中，准确获取和利用行人的属性信息具有极大的重要性。行人属性识别是计算机视觉领域中的一项关键任务，它的目标是从行人的图像或视频中识别和描述不同的属性或特征，如性别、年龄、服装风格等，这些属性信息可以帮助计算机更好地理解和描述图像中的人物，对于行人追踪、行人重识别、行为分析、特定特征行人搜索等安防监控场景非常重要。

2、然而，传统的行人属性识别方法存在一些挑战。首先，属性的标注工作需要耗费大量人力和时间，因为属性种类繁多且标注过程困难。例如，年龄可以分为幼儿、青少年、青年、中年和老年，衣服颜色可以包括红、橙、黄、绿、紫、粉、黑、白、灰和棕十种选项，这使得标注工作繁重且容易出错。其次，传统方法通常依赖于预先训练好的属性模型，这些模型的属性是固定的，如果要在不同场景中新增或修改属性，需要重新训练模型，成本高且不易扩展。

3、因此，希望有一种技术方案来克服或至少减轻现有技术的至少一个上述缺陷。

技术本文档来自技高网...

【技术保护点】

1.一种基于多模态模型的属性标注方法，其特征在于，包括：
2.根据权利要求1所述的基于多模态模型的属性标注方法，其特征在于，步骤一中，所述获取视频，并从所述视频中提取目标图像，包括：
3.根据权利要求1所述的基于多模态模型的属性标注方法，其特征在于，所述属性集合包括多个属性子集合，每个所述属性子集合中包含同一属性下的多个属性信息的文本描述，且每个所述属性信息具有多个文本描述。
4.根据权利要求3所述的基于多模态模型的属性标注方法，其特征在于，步骤三中，所述将所述目标图像以及所述属性集合输入到多模态模型中，得到所述目标图像与各个属性信息的文本描述的匹配值...

【技术特征摘要】

1.一种基于多模态模型的属性标注方法，其特征在于，包括：
2.根据权利要求1所述的基于多模态模型的属性标注方法，其特征在于，步骤一中，所述获取视频，并从所述视频中提取目标图像，包括：
3.根据权利要求1所述的基于多模态模型的属性标注方法，其特征在于，所述属性集合包括多个属性子集合，每个所述属性子集合中包含同一属性下的多个属性信息的文本描述，且每个所述属性信息具有多个文本描述。
4.根据权利要求3所述的基于多模态模型的属性标注方法，其特征在于，步骤三中，所述将所述目标图像以及所述属性集合输入到多模态模型中，得到所述目标图像与各个属性信息的文本描述的匹配值，并根据所述匹配值确定所述目标图像中包含的属性信息，包括：
5.根据权利要求4所述的基于多模态模型的属性标注方法，其特征在于，s32中，通过所述多模态模型将所述目标图像与该属性对应的属性子集合进行匹配，得到匹配值最高的文本描述的过程包...

【专利技术属性】
技术研发人员：贾哲恒，唐矗，蒲立，
申请(专利权)人：北京积加科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人

上一篇：一种蓄电池铸焊用上下料装置制造方法及图纸
下一篇：卷针装置及卷绕机制造方法及图纸

相关技术

鸟类图像畸变校正方法、装置、电子设备...

一种智能待监测宠物追踪的方法、装置及...

关键画面处理方法、装置、设备、介质和...

基于摄像头组的鸟类观测方法、装置、设...

基于喂鸟器的驱赶与喂食方法、装置、设...

一种PIR传感器的测试方法及装置制造...

运动检测方法、装置、计算机设备、产品...

鸟类监控装置、鸟类拍摄系统和方法制造...

识别信息生成方法、装置、电子设备和计...

图像处理方法、电子设备和计算机可读介...

网友询问留言已有0条评论

还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1

发布您的意见

相关领域技术

异常检测方法、装置、计算机设备及存储...

一种基于进化特征构建的工作量感知即时...

一种模型训练、文本检测方法、装置、存...

一种跨数据库迁移的数据比对方法、装置...

一种时间序列分段方法、装置、设备和存...

一种发电设备故障预警的方法和系统技术...

发动机气门间隙状态的确定方法、装置与...

电梯广告播放控制方法、系统、服务器以...