当前位置: 首页 > 专利查询>清华大学专利>正文

基于物体真实大小和物体特征的图像识别方法和装置制造方法及图纸

技术编号:29461868 阅读:68 留言:0更新日期:2021-07-27 17:32
本申请提出了一种基于物体真实大小和物体特征的图像识别方法,涉及计算机图像识别技术领域,其中,该方法包括:获取测试集和标签集,测试集包括待识别图像,标签集中包括预存的各物体类别标签,与拍摄距离范围和物体在图像中大小范围之间的对应关系;根据对待识别图像进行图像识别后生成的多个类别标签和标签集,从多个类别标签中确定待识别图像的真实类别标签;根据真实匹配类别标签生成待识别图像的识别结果,并输出识别结果。本发明专利技术可以排除匹配类别标签集中物体大小不相符的物体类别,大大缩小匹配类别的范围,提高图像识别的准确率;解决在一张多类别共存的图片或者场景中将图像识别算法的注意力集中在要求识别的物体类别上的技术问题。

【技术实现步骤摘要】
基于物体真实大小和物体特征的图像识别方法和装置
本申请涉及计算机图像识别
,尤其涉及一种基于物体真实大小和物体特征的图像识别方法和计算机设备。
技术介绍
目前,人工智能领域的图像识别方法主要基于物体的形状和纹理等外观特征,比如目前经典的AlexNet、VGG、GoogleNet、ResNet、DenseNet等图像分类算法;有些基于物体所处的背景、场景等一些上下文语义信息,比如DeepLab系列模型、RefineNet、金字塔场景稀疏网络语义分割模型(PSPNet)、生成对抗网络模型(GAN)等。现有的图像识别算法无法区分汽机和汽机模型、老虎和老虎玩具等这类物体特征高度相似但物体真实大小有明显区别的图像,无法在一张多类别共存的图片或者场景中将图像识别算法的注意力集中在我们要求识别的物体类别上。根据眼睛进化史、人类视觉识别常识和视觉系统神经网络的研究可知,物体在真实物理世界中的大小(物体真实大小)是人类识别物体的重要依据。物体真实大小的识别是一个由背侧视觉通路、腹侧视觉通路、顶叶皮质区域等脑区参与的自动识别的过程。目前人工智能领域还没有报道基于物体真实大小的图像识别方法。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请的第一个目的在于提出一种基于物体真实大小和物体特征的图像识别方法,解决了现有方法无法区分物体特征高度相似但物体真实大小有明显区别的图像的技术问题,同时解决了在识别一张多类别共存的图片或者场景时将图像识别算法的注意力集中在要求识别的物体类别上的技术问题,实现了根据物体真实大小排除匹配类别标签集中物体大小不相符的物体类别,大大缩小匹配类别的范围,提高图像识别的准确率的目的。本申请的第二个目的在于提出一种计算机设备。本申请的第三个目的在于提出一种非临时性计算机可读存储介质。为达上述目的,本申请第一方面实施例提出了一种基于物体真实大小和物体特征的图像识别方法,包括:S1、获取测试集和标签集,测试集包括待识别图像,标签集中包括预存的各物体类别标签,与拍摄距离范围和物体在图像中大小范围之间的对应关系;S2、根据对待识别图像进行图像识别后生成的多个类别标签和标签集,从多个类别标签中确定待识别图像的真实类别标签;S3、根据真实匹配类别标签生成待识别图像的识别结果,并输出识别结果。可选地,在本申请的一个实施例中,步骤S2包括:S211、对待识别图像中的物体进行识别,根据物体类别获取待识别图像对应的多个类别标签,并获取多个类别标签中每个类别标签对应的匹配概率;S212、按照匹配概率从大到小的顺序从多个类别标签中提取第一个类别标签;S213、根据提取的类别标签从标签集中确定与提取的类别标签对应的物体类别标签,并将待识别图像的拍摄距离与确定的物体类别标签对应的拍摄距离范围进行比较,判断待识别图像的拍摄距离是否在拍摄距离范围内;S214、如果待识别图像的拍摄距离在拍摄距离范围内,则进一步将待识别图像的物体在图像中大小与确定的物体类别标签对应的物体在图像中大小范围进行比较,判断待识别图像的物体在图像中大小是否在物体在图像中大小范围内;S215、如果待识别图像的物体在图像中大小在物体在图像中大小范围内,则将确定的物体类别标签作为待识别图像的真实类别标签。可选地,在本申请的一个实施例中,在步骤S213之后,识别方法还包括:如果待识别图像的拍摄距离不在拍摄距离范围内,则从多个类别标签中提取第二个类别标签,并根据提取的第二个类别标签重复进行上述步骤S213-215;在步骤S214之后,识别方法还包括:如果待识别图像的物体在图像中大小不在物体在图像中大小范围内,则从多个类别标签中提取第二个类别标签,并根据提取的第二个类别标签重复进行上述步骤S213-215。可选地,在本申请的一个实施例中,步骤S2包括:S221、将待识别图像的拍摄距离和物体在图像中大小与标签集中的拍摄距离范围和物体在图像中大小范围进行比较,判断待识别图像的拍摄距离和物体在图像中大小所属的拍摄距离范围和物体在图像中大小范围;S222、获取所属的拍摄距离范围和物体在图像中大小范围对应的物体类别标签,根据物体类别标签和拍摄距离范围和物体在图像中大小范围对应的物体类别标签生成子标签集;S223、对待识别图像中的物体进行识别,根据物体类别获取待识别图像对应的多个类别标签,并获取多个类别标签中每个类别标签对应的匹配概率;S224、按照匹配概率从大到小的顺序从多个类别标签中提取第一个类别标签;S225、判断提取的类别标签是否与子标签集中的物体类别标签匹配;S226、如果提取的类别标签与子标签集中的物体类别标签匹配,则将匹配的物体类别标签确定为待识别图像的真实类别标签。可选地,在本申请的一个实施例中,在步骤S224之后,识别方法还包括:如果提取的类别标签与子标签集中的物体类别标签不匹配,则从多个类别标签中提取第二个类别标签,并根据提取的第二个类别标签重复进行上述步骤S225-226。可选地,在本申请的一个实施例中,标签集中各物体类别标签与拍摄距离范围和物体在图像中大小范围之间的对应关系,是预先由人工计算并标注的,或者,通过各物体的拍摄距离和图像中大小实时测量得到的。可选地,在本申请的一个实施例中,物体在图像中大小通过物体在图像中的高度和宽度表示。可选地,在本申请的一个实施例中,物体在图像中的高度通过物体在图像中的高度与图像高度的比值表示,物体在图像中的宽度通过物体在图像中的宽度与图像宽度的比值表示。为达上述目的,本专利技术第二方面实施例提出了一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述基于物体真实大小和物体特征的图像识别方法。为了实现上述目的,本专利技术第三方面实施例提出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器被执行时,能够执行基于物体真实大小和物体特征的图像识别方法。本申请实施例的基于物体真实大小和物体特征的图像识别方法、计算机设备和非临时性计算机可读存储介质,解决了区分物体特征高度相似但物体真实大小有明显区别的图像的技术问题,同时解决了在识别一张多类别共存的图片或者场景时将图像识别算法的注意力集中在要求识别的物体类别上的技术问题,并且根据物体真实大小排除匹配类别标签集中物体大小不相符的物体类别,从而大大缩小了匹配类别的范围,提高了图像识别的准确率。本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本申请实施例一所提供的一种基于物体真实大小和物体特征的图像识别方法的流程图;图2a为本申请实施例的基于物体真实大小和物体特征的图像识别方法一本文档来自技高网...

【技术保护点】
1.一种基于物体真实大小和物体特征的图像识别方法,其特征在于,包括以下步骤:/nS1、获取测试集和标签集,所述测试集包括待识别图像,所述标签集中包括预存的各物体类别标签,与拍摄距离范围和物体在图像中大小范围之间的对应关系;/nS2、根据对所述待识别图像进行图像识别后生成的多个类别标签和所述标签集,从多个类别标签中确定所述待识别图像的真实类别标签;/nS3、根据所述真实匹配类别标签生成所述待识别图像的识别结果,并输出所述识别结果。/n

【技术特征摘要】
1.一种基于物体真实大小和物体特征的图像识别方法,其特征在于,包括以下步骤:
S1、获取测试集和标签集,所述测试集包括待识别图像,所述标签集中包括预存的各物体类别标签,与拍摄距离范围和物体在图像中大小范围之间的对应关系;
S2、根据对所述待识别图像进行图像识别后生成的多个类别标签和所述标签集,从多个类别标签中确定所述待识别图像的真实类别标签;
S3、根据所述真实匹配类别标签生成所述待识别图像的识别结果,并输出所述识别结果。


2.如权利要求1所述的识别方法,其特征在于,所述步骤S2包括:
S211、对所述待识别图像中的物体进行识别,根据物体类别获取所述待识别图像对应的多个类别标签,并获取所述多个类别标签中每个类别标签对应的匹配概率;
S212、按照所述匹配概率从大到小的顺序从所述多个类别标签中提取第一个类别标签;
S213、根据提取的类别标签从所述标签集中确定与提取的类别标签对应的物体类别标签,并将所述待识别图像的拍摄距离与确定的物体类别标签对应的拍摄距离范围进行比较,判断所述待识别图像的拍摄距离是否在拍摄距离范围内;
S214、如果所述待识别图像的拍摄距离在拍摄距离范围内,则进一步将所述待识别图像的物体在图像中大小与确定的物体类别标签对应的物体在图像中大小范围进行比较,判断所述待识别图像的物体在图像中大小是否在物体在图像中大小范围内;
S215、如果所述待识别图像的物体在图像中大小在物体在图像中大小范围内,则将确定的物体类别标签作为所述待识别图像的真实类别标签。


3.如权利要求2所述的识别方法,其特征在于,在所述步骤S213之后,所述识别方法还包括:
如果所述待识别图像的拍摄距离不在拍摄距离范围内,则从所述多个类别标签中提取第二个类别标签,并根据提取的第二个类别标签重复进行上述步骤S213-215;
在所述步骤S214之后,所述识别方法还包括:
如果所述待识别图像的物体在图像中大小不在物体在图像中大小范围内,则从所述多个类别标签中提取第二个类别标签,并根据提取的第二个类别标签重复进行上述步骤S213-215。


4.如权利要求1所述的识别方法,其特征在于,所述步骤S2包括:
S221、将所述待识别图像的拍摄距离和物体在图像中大小与所述标签集中的拍摄距离范围...

【专利技术属性】
技术研发人员:戴琼海李晓飞
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1