【技术实现步骤摘要】
本申请涉及计算机视觉,尤其涉及一种目标识别方法、装置、电子设备和存储介质。
技术介绍
1、从目标的角度感知和理解视觉场景,一直以来是计算机视觉技术发展的主要驱动力,受深度神经网络架构和大规模数据集的助力,目标检测已经取得了巨大的成功。目前,目标检测任务旨在定位图像中的目标并为目标分配一个预先定义好的类别标签,例如“车”、“人”或“树”,但这种定义过度简化了人类对于视觉世界的认知,因为一个目标往往可以从多个方面来表征,例如,一辆车可以具有“黄色的”、“长的”、“金属的”、“动态的”等多种属性,仅通过类别无法充分描述目标,导致对目标的感知程度受限。
技术实现思路
1、本申请提供一种目标识别方法、装置、电子设备和存储介质,可以同时实现对目标进行定位、类别识别以及属性识别,有利于提高对目标的感知程度。
2、第一方面,本申请实施例提供了一种目标识别方法,所述方法包括:
3、获取待识别图像;
4、确定所述待识别图像中的待识别目标的定位信息,根据所述待识别目标的定位信
...【技术保护点】
1.一种目标识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述从候选类别词集中确定与所述待识别目标的视觉特征相匹配的第一类别词,包括:
3.根据权利要求1所述的方法,其特征在于,所述从候选属性词集中确定与所述待识别目标的视觉特征相匹配的第一属性词,包括:
4.根据权利要求1至3中任意一项所述的方法,其特征在于,所述确定所述待识别图像中的待识别目标的定位信息,根据所述待识别目标的定位信息提取所述待识别目标的视觉特征,包括:
5.根据权利要求4所述的方法,其特征在于,还包括:
6
...【技术特征摘要】
1.一种目标识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述从候选类别词集中确定与所述待识别目标的视觉特征相匹配的第一类别词,包括:
3.根据权利要求1所述的方法,其特征在于,所述从候选属性词集中确定与所述待识别目标的视觉特征相匹配的第一属性词,包括:
4.根据权利要求1至3中任意一项所述的方法,其特征在于,所述确定所述待识别图像中的待识别目标的定位信息,根据所述待识别目标的定位信息提取所述待识别目标的视觉特征,包括:
5.根据权利要求4所述的方法,其特征在于,还包括:
6.根据权利要求5所述的方法,其特征在于,所述视觉语言模型的训练方法包括:
7.根据权利要求1至3中任意一项所述的方...
【专利技术属性】
技术研发人员:陈科研,蒋小龙,汤旭,
申请(专利权)人:书行科技北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。