目标识别方法、电子设备和计算机可读存储介质技术

技术编号:44930135 阅读:23 留言:0更新日期:2025-04-08 19:11
本申请公开了一种目标识别方法、电子设备和计算机可读存储介质,该方法包括:获取待识别图像及其对应的识别指示文本,将待识别图像和识别指示文本输入检测模型中,得到检测模型输出的目标识别结果;其中,识别指示文本包括目标场景中的目标的待识别类别;基于注册底库中的标准样本对目标识别结果进行分类,得到正确样本和误报样本;其中,标准样本是基于识别指示文本从注册底库中检索得到的,每个目标对应的类别相应匹配有一个注册底库;获取纠正后的误报样本,利用纠正后的误报样本和正确样本组成的训练样本对检测模型进行微调,得到微调后的检测模型,并将训练样本添加至目标对应类别的注册底库中。上述方案,能够提高目标识别的准确性。

【技术实现步骤摘要】

本申请涉及图像处理,特别是涉及一种目标识别方法、电子设备和计算机可读存储介质


技术介绍

1、跨模态目标识别技术作为计算机视觉领域中非常重要的任务之一,其发展为计算机下游任务奠定了基础。跨模态目标识别任务主要是将多个不同模态信息联合起来,进行目标识别任务,给出图像目标对应的类别。目前的跨模态目标识别方案,受限于较高的系统复杂性、训练数据质量依赖过高,模型的训练时间长等因素,导致目标类别的误检率较高。有鉴于此,如何提高目标识别的准确性成为了亟待解决的问题。


技术实现思路

1、本申请主要解决的技术问题是提供一种目标识别方法、电子设备和计算机可读存储介质,能够提高目标识别的准确性。

2、为解决上述技术问题,本申请第一方面提供一种目标识别方法,包括:获取待识别图像及其对应的识别指示文本,将所述待识别图像和所述识别指示文本输入检测模型中,得到所述检测模型输出的目标识别结果;其中,所述识别指示文本包括目标场景中的目标的待识别类别;基于注册底库中的标准样本对所述目标识别结果进行分类,得到正确样本和误报样本;其中本文档来自技高网...

【技术保护点】

1.一种目标识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述检测模型包括图文对齐模块,在基于注册底库中的标准样本对目标识别结果进行分类,得到正确样本和误报样本之前,还包括:

3.根据权利要求1所述的方法,其特征在于,所述检测模型包括匹配模块、视觉编码模块和文本编码模块,所述获取待识别图像及其对应的识别指示文本,将所述待识别图像和所述识别指示文本输入检测模型中,得到所述检测模型输出的目标识别结果,包括:

4.根据权利要求3所述的方法,其特征在于,所述利用纠正后的所述误报样本和所述正确样本组成的训练样本对所述检测模型进行微调,得...

【技术特征摘要】

1.一种目标识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述检测模型包括图文对齐模块,在基于注册底库中的标准样本对目标识别结果进行分类,得到正确样本和误报样本之前,还包括:

3.根据权利要求1所述的方法,其特征在于,所述检测模型包括匹配模块、视觉编码模块和文本编码模块,所述获取待识别图像及其对应的识别指示文本,将所述待识别图像和所述识别指示文本输入检测模型中,得到所述检测模型输出的目标识别结果,包括:

4.根据权利要求3所述的方法,其特征在于,所述利用纠正后的所述误报样本和所述正确样本组成的训练样本对所述检测模型进行微调,得到微调后的所述检测模型,包括:

5.根据权利要求1所述的方法,其特征在于,所述注册底库配置有与所述类别相匹配的优先级;

...

【专利技术属性】
技术研发人员:付建海俞元杰李宁钏陈启超赵蕾熊剑平
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1