基于生成对抗网络的异常大小物体识别方法及系统技术方案

技术编号:37538788 阅读:12 留言:0更新日期:2023-05-12 16:07
本发明专利技术公开了一种基于生成对抗网络的异常大小物体识别方法及系统,通过基于所述检测图像,识别出待识别目标的类别信息,获得待识别目标在检测图像中的图像面积和图像位置信息;通过预先训练好的尺寸预估模型基于所述图像位置信息、图像面积和类别信息,预估得到待识别目标在世界坐标中的实际尺寸;基于实际尺寸和类别信息,判断待识别目标是否出现误识别状况。当物体识别模型的识别结果不满足正常状态时,即可判定其为误识别。即通过对物体检测模型的检测框大小进行分析,得到正常情况下同一摄像头所拍摄物体,其检测框大小与检测框在图像中位置的关系,若不满足此正常关系,则判定为误识别。其检测方法简单方便、巧妙、准确率高,且成本低。且成本低。且成本低。

【技术实现步骤摘要】
基于生成对抗网络的异常大小物体识别方法及系统


[0001]本专利技术涉及计算机
,具体而言,涉及一种基于生成对抗网络的异常大小物体识别方法及系统。

技术介绍

[0002]基于目标检测模型的方法目前最常见的物体识别方法,其主要通过大量图像样本的训练,使得模型能对相关物体在图像中定位和分类。该方法,首先需要通过卷积运算获取图像的特征热图,然后再通过热图的特征向量,通过回归的方式,计算出物体的坐标及类别。但是,目前的目标检测模型在对目标进行识别时,一般只考虑目标的图像特征,未使用语义、大小等信息综合推理,常常把过大或者过小的目标识别出来,例如公交车身上广告里的人脸识别成真人,或者把其他类别的物体识别成某个特定类别的物体,存在误识别的情况,其识别准确率低。

技术实现思路

[0003]本专利技术的目的在于提供了一种基于生成对抗网络的异常大小物体识别方法及系统,用以解决现有技术中存在的上述问题。
[0004]第一方面,本专利技术实施例提供了一种基于生成对抗网络的异常大小物体识别方法,包括:获得待识别目标的检测图像;所述检测图像是通过单目摄像头采集得到的;检测图像包括待识别目标;基于所述检测图像,识别出待识别目标的类别信息,所述类别信息表征所述待识别目标的属性;获得待识别目标在检测图像中的图像面积和图像位置信息;通过预先训练好的尺寸预估模型基于所述图像位置信息、图像面积和类别信息,预估得到待识别目标在世界坐标中的实际尺寸;基于所述实际尺寸和所述类别信息,判断所述待识别目标是否出现误识别状况;若出现误识别状况,发出警报信息。
[0005]可选的,所述尺寸预估模型包括单元编码器、解耦单元和解码器;尺寸预估模型的训练方法包括:获得训练集,所述训练集包括多个训练数据,每个训练数据包括训练位置信息、训练面积和类别信息;多个训练数据中至少存在两个训练数据的类别信息不同;通过编码器对训练数据进行编码,得到编码特征,每个训练数据对应获得一个编码特征,多个训练数据对应获得多个编码特征;通过解耦单元,对编码特征进行解耦操作,得到解耦特征;对解耦特征进行归一化操作,得到归一化特征;通过解码器对归一化特征进行解码操作,得到解码特征;解码特征的维度与训练
数据的纬度相同;当尺寸预估模型的损失函数收敛,确定尺寸预估模型训练结束;训练结束的尺寸预估模型的输出包括预估的实际尺寸;损失函数为解码特征与训练数据之间的欧氏距离。
[0006]可选的,所述通过解耦单元,对编码特征进行解耦操作,得到解耦特征,包括:获得解耦掩模;解耦掩模为一个维度与编码特征的维度相同的向量;对编码特征和解耦掩模进行点乘操作,得到解耦特征。
[0007]可选的,若训练数据的类别信息为第w类,则将解耦掩模中的第2w个元素和第2w+1个元素的值设置为1,其余位置的元素的值设置为0;其中,w为正整数。
[0008]可选的,所述基于所述实际尺寸和所述类别信息,判断所述待识别目标是否出现误识别状况,包括:将所述实际尺寸和所述类别信息作为混合高斯模型的输入;若混合高斯模型的输出小于设定值,确定待识别目标出现误识别状况。
[0009]第二方面,本专利技术实施例提供了一种基于生成对抗网络的异常大小物体识别系统,所述系统包括:获得模块,用于获得待识别目标的检测图像;所述检测图像是通过单目摄像头采集得到的;检测图像包括待识别目标;检测模块,用于基于所述检测图像,识别出待识别目标的类别信息,所述类别信息表征所述待识别目标的属性;获得待识别目标在检测图像中的图像面积和图像位置信息;识别模块,用于通过预先训练好的尺寸预估模型基于所述图像位置信息、图像面积和类别信息,预估得到待识别目标在世界坐标中的实际尺寸;基于所述实际尺寸和所述类别信息,判断所述待识别目标是否出现误识别状况;报警模块,用于若出现误识别状况,发出警报信息。
[0010]可选的,所述尺寸预估模型包括单元编码器、解耦单元和解码器;尺寸预估模型的训练方法包括:获得训练集,所述训练集包括多个训练数据,每个训练数据包括训练位置信息、训练面积和类别信息;多个训练数据中至少存在两个训练数据的类别信息不同;通过编码器对训练数据进行编码,得到编码特征,每个训练数据对应获得一个编码特征,多个训练数据对应获得多个编码特征;通过解耦单元,对编码特征进行解耦操作,得到解耦特征;对解耦特征进行归一化操作,得到归一化特征;通过解码器对归一化特征进行解码操作,得到解码特征;解码特征的维度与训练数据的纬度相同;当尺寸预估模型的损失函数收敛,确定尺寸预估模型训练结束;训练结束的尺寸预估模型的输出包括预估的实际尺寸;损失函数为解码特征与训练数据之间的欧氏距离。
[0011]可选的,所述通过解耦单元,对编码特征进行解耦操作,得到解耦特征,包括:获得解耦掩模;解耦掩模为一个维度与编码特征的维度相同的向量;对编码特征和解耦掩模进行点乘操作,得到解耦特征。
[0012]可选的,若训练数据的类别信息为第w类,则将解耦掩模中的第2w个元素和第2w+1个元素的值设置为1,其余位置的元素的值设置为0;其中,w为正整数。
[0013]可选的,所述基于所述实际尺寸和所述类别信息,判断所述待识别目标是否出现误识别状况,包括:将所述实际尺寸和所述类别信息作为混合高斯模型的输入;若混合高斯模型的输出小于设定值,确定待识别目标出现误识别状况。
[0014]相较于现有技术,本专利技术实施例达到了以下有益效果:本专利技术实施例还提供了一种基于生成对抗网络的异常大小物体识别方法及系统,通过获得待识别目标的检测图像;所述检测图像是通过单目摄像头采集得到的;检测图像包括待识别目标;基于所述检测图像,识别出待识别目标的类别信息,所述类别信息表征所述待识别目标的属性;获得待识别目标在检测图像中的图像面积和图像位置信息;通过预先训练好的尺寸预估模型基于所述图像位置信息、图像面积和类别信息,预估得到待识别目标在世界坐标中的实际尺寸;基于所述实际尺寸和所述类别信息,判断所述待识别目标是否出现误识别状况;若出现误识别状况,发出警报信息。
[0015]可以通过自编码器通过自监督学习,可以有效学习到这些变量的非线性关系以及它们的正常状态。当物体识别模型的识别结果不满足正常状态时,即可判定其为误识别。即通过对物体检测模型的检测框大小进行分析,得到正常情况下同一摄像头所拍摄物体,其检测框大小与检测框在图像中位置的关系,若不满足此正常关系,则判定为误识别。其检测方法简单方便、巧妙、准确率高,且成本低。
附图说明
[0016]图1是本专利技术实施例提供的一种基于生成对抗网络的异常大小物体识别方法的流程图。
[0017]图2是本专利技术实施例提供的一种尺寸预估模型的结构示意图。
[0018]图3是本专利技术实施例提供的一种混合高斯模型识别不同类的物体的结果分布图。
[0019]图4是本专利技术实施例提供的一种电子设备的方框结构示意图。
[0020]图中标记:总线500;接收器501;处理器502;发送器503;存储器504;总线接口505。
实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于生成对抗网络的异常大小物体识别方法,其特征在于,包括:获得待识别目标的检测图像;所述检测图像是通过单目摄像头采集得到的;检测图像包括待识别目标;基于所述检测图像,识别出待识别目标的类别信息,所述类别信息表征所述待识别目标的属性;获得待识别目标在检测图像中的图像面积和图像位置信息;通过预先训练好的尺寸预估模型基于所述图像位置信息、图像面积和类别信息,预估得到待识别目标在世界坐标中的实际尺寸;基于所述实际尺寸和所述类别信息,判断所述待识别目标是否出现误识别状况;若出现误识别状况,发出警报信息。2.根据权利要求1所述的方法,其特征在于,所述尺寸预估模型包括单元编码器、解耦单元和解码器;尺寸预估模型的训练方法包括:获得训练集,所述训练集包括多个训练数据,每个训练数据包括训练位置信息、训练面积和类别信息;多个训练数据中至少存在两个训练数据的类别信息不同;通过编码器对训练数据进行编码,得到编码特征,每个训练数据对应获得一个编码特征,多个训练数据对应获得多个编码特征;通过解耦单元,对编码特征进行解耦操作,得到解耦特征;对解耦特征进行归一化操作,得到归一化特征;通过解码器对归一化特征进行解码操作,得到解码特征;解码特征的维度与训练数据的纬度相同;当尺寸预估模型的损失函数收敛,确定尺寸预估模型训练结束;训练结束的尺寸预估模型的输出包括预估的实际尺寸;损失函数为解码特征与训练数据之间的欧氏距离。3.根据权利要求2所述的方法,其特征在于,所述通过解耦单元,对编码特征进行解耦操作,得到解耦特征,包括:获得解耦掩模;解耦掩模为一个维度与编码特征的维度相同的向量;对编码特征和解耦掩模进行点乘操作,得到解耦特征。4.根据权利要求3所述的方法,其特征在于,若训练数据的类别信息为第w类,则将解耦掩模中的第2w个元素和第2w+1个元素的值设置为1,其余位置的元素的值设置为0;其中,w为正整数。5.根据权利要求2所述的方法,其特征在于,所述基于所述实际尺寸和所述类别信息,判断所述待识别目标是否出现误识别状况,包括:将所述实际尺寸和所述类别信息作为混合高斯模型的输入;若混合高斯模型的输出小于设定值,确定待识别目标出现误识别状况。6.一种基于生成对抗网络的异常大小物体识别系统...

【专利技术属性】
技术研发人员:姜帝兆鲜斌张结斌
申请(专利权)人:成都合能创越软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1