图像识别方法及相关设备技术

技术编号:36564298 阅读:22 留言:0更新日期:2023-02-04 17:20
本申请实施例公开了一种图像识别方法及相关设备,方法包括:获取目标输入图像;采用基于感知未知RPN的自动标签模型为目标输入图像的前景和背景实例生成一组边界框,边界框包括P个边界框以及对应P个得分,每一边界框对应一个得分,P个边界框中包括具有类别标签的m个边界框和不具有类别标签的P

【技术实现步骤摘要】
图像识别方法及相关设备


[0001]本申请涉及图像处理
,具体涉及一种图像识别方法及相关设备。

技术介绍

[0002]现有技术中,图像识别方法在智能视频监控安防领域具有举足轻重的应用价值,生活中,用户可以通过图像识别,实现人脸解锁功能,但是,图像识别往往其应用范围局限于人脸识别,或者,目标跟踪这些简单应用场景,从而,降低了图像识别的应用价值,也体现不出图像识别的精准性,因此,如何提升图像识别精准性的问题亟待解决。

技术实现思路

[0003]本申请实施例提供了一种图像识别方法及相关设备,可以提升图像识别精准度。
[0004]第一方面,本申请实施例提供一种图像识别方法,所述方法包括:
[0005]获取目标输入图像;
[0006]采用基于感知未知RPN的自动标签模型为所述目标输入图像的前景和背景实例生成一组边界框,所述边界框包括P个边界框以及对应P个得分,每一边界框对应一个得分,所述P个边界框中包括具有类别标签的m个边界框和不具有类别标签的P

m个边界框,该m个边界框中每一个边界框对应一个类别标签;P为大于1的整数,m为小于或等于P的整数;
[0007]选取所述P个得分中大于预设阈值的得分,得到Q个得分,Q为小于或等于P的正整数;
[0008]确定所述P

m个边界框中不与具有类别标签的m个边界框中任一边界框存在重叠区域的n个边界框,n为小于或等于P

m的正整数;
[0009]根据所述Q个得分和所述n个边界框确定k个目标边界框,将所述k个目标边界框标记为未知对象,k为正整数。
[0010]第二方面,本申请实施例提供了一种图像识别装置,所述装置包括:获取单元、识别单元、选取单元和确定单元,其中,
[0011]所述获取单元,用于获取目标输入图像;
[0012]所述识别单元,用于采用基于感知未知RPN的自动标签模型为所述目标输入图像的前景和背景实例生成一组边界框,所述边界框包括P个边界框以及对应P个得分,每一边界框对应一个得分,所述P个边界框中包括具有类别标签的m个边界框和不具有类别标签的P

m个边界框,该m个边界框中每一个边界框对应一个类别标签;P为大于1的整数,m为小于或等于P的整数;
[0013]所述选取单元,用于选取所述P个得分中大于预设阈值的得分,得到Q个得分,Q为小于或等于P的正整数;
[0014]所述确定单元,用于确定所述P

m个边界框中不与具有类别标签的m个边界框中任一边界框存在重叠区域的n个边界框,n为小于或等于P

m的正整数;以及根据所述Q个得分和所述n个边界框确定k个目标边界框,将所述k个目标边界框标记为未知对象,k为正整数。
[0015]第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面中的步骤的指令。
[0016]第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
[0017]第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
[0018]实施本申请实施例,具备如下有益效果:
[0019]可以看出,本申请实施例中所描述的图像识别方法及相关设备,获取目标输入图像,采用基于感知未知RPN的自动标签模型为目标输入图像的前景和背景实例生成一组边界框,边界框包括P个边界框以及对应P个得分,每一边界框对应一个得分,P个边界框中包括具有类别标签的m个边界框和不具有类别标签的P

m个边界框,该m个边界框中每一个边界框对应一个类别标签;P为大于1的整数,m为小于或等于P的整数,选取P个得分中大于预设阈值的得分,得到Q个得分,Q为小于或等于P的正整数,确定P

m个边界框中不与具有类别标签的m个边界框中任一边界框存在重叠区域的n个边界框,n为小于或等于P

m的正整数,根据Q个得分和n个边界框确定k个目标边界框,将k个目标边界框标记为未知对象,k为正整数,不仅可以识别出已知类别的目标,还可以在排除已知类别的目标的干扰下,精准标记出未知对象,从而,有助于提升图像识别的精准度。
附图说明
[0020]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021]图1A是本申请实施例提供的一种图像识别方法的流程示意图;
[0022]图1B是本申请实施例提供的一种基于感知未知RPN的自动标签模型的标记效果演示示意图;
[0023]图1C是本申请实施例提供的一种类比聚类的演示效果示意图;
[0024]图1D是本申请实施例提供的另一种图像识别方法的流程示意图;
[0025]图2是本申请实施例提供的另一种图像识别方法的流程示意图;
[0026]图3是本申请实施例提供的一种电子设备的结构示意图;
[0027]图4是本申请实施例提供的一种图像识别装置的功能单元组成框图。
具体实施方式
[0028]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是
本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0029]本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
[0030]在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法,其特征在于,所述方法包括:获取目标输入图像;采用基于感知未知RPN的自动标签模型为所述目标输入图像的前景和背景实例生成一组边界框,所述边界框包括P个边界框以及对应P个得分,每一边界框对应一个得分,所述P个边界框中包括具有类别标签的m个边界框和不具有类别标签的P

m个边界框,该m个边界框中每一个边界框对应一个类别标签;P为大于1的整数,m为小于或等于P的整数;选取所述P个得分中大于预设阈值的得分,得到Q个得分,Q为小于或等于P的正整数;确定所述P

m个边界框中不与具有类别标签的m个边界框中任一边界框存在重叠区域的n个边界框,n为小于或等于P

m的正整数;根据所述Q个得分和所述n个边界框确定k个目标边界框,将所述k个目标边界框标记为未知对象,k为正整数。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述k个目标边界框以及所述P个边界框中的前景边界框输入到ROI head层,得到特征向量;将所述特征向量输入到对比聚类函数,得到已知标签类别和未知标签类别。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:基于预设特征空间中的特征向量构造能量基础模型,所述能量基础模型为评估观测变量和输出变量集的对应关系;根据所述能量基础模型更新所述基于感知未知RPN的自动标签模型中的至少有个分类模型。4.根据权利要求1

3任一项所述的方法,其特征在于,所述方法还包括:获取多个未标记类别标签的样本,并将其分类x个等份,得到x等份样本,x为正整数;将所述x等份样本输入到所述基于感知未知RPN的自动标签模型中进行推理,得到b类已经学习好的类别标签和x

b类未知类别标签;通过人机互动方式确定真实已经学习好的类别标签和真实未知类别标签;根据所述b类已经学习好的类别标签、所述x

b类未知类别标签、所述真实已经学习好的类别标签和所述真实未知类别标签,确定已经学习好的类别标签与未知类别标签之间的位置标签框差值;利用所述差值训练预设回归模型,所述预设回归模型用于矫正后续未知类别标签。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:通过所述预设回归模型对所述k个目标边界框进行矫正,得到矫正结...

【专利技术属性】
技术研发人员:禹世杰施欣欣吴伟华范艳叶桔
申请(专利权)人:深圳市华尊科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1