基于物体真实大小和物体特征的图像识别方法和装置制造方法及图纸

技术编号：29461868 阅读：68 留言：0更新日期：2021-07-27 17:32

本申请提出了一种基于物体真实大小和物体特征的图像识别方法，涉及计算机图像识别技术领域，其中，该方法包括：获取测试集和标签集，测试集包括待识别图像，标签集中包括预存的各物体类别标签，与拍摄距离范围和物体在图像中大小范围之间的对应关系；根据对待识别图像进行图像识别后生成的多个类别标签和标签集，从多个类别标签中确定待识别图像的真实类别标签；根据真实匹配类别标签生成待识别图像的识别结果，并输出识别结果。本发明专利技术可以排除匹配类别标签集中物体大小不相符的物体类别，大大缩小匹配类别的范围，提高图像识别的准确率；解决在一张多类别共存的图片或者场景中将图像识别算法的注意力集中在要求识别的物体类别上的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于物体真实大小和物体特征的图像识别方法和装置
本申请涉及计算机图像识别
，尤其涉及一种基于物体真实大小和物体特征的图像识别方法和计算机设备。
技术介绍
目前，人工智能领域的图像识别方法主要基于物体的形状和纹理等外观特征，比如目前经典的AlexNet、VGG、GoogleNet、ResNet、DenseNet等图像分类算法；有些基于物体所处的背景、场景等一些上下文语义信息，比如DeepLab系列模型、RefineNet、金字塔场景稀疏网络语义分割模型(PSPNet)、生成对抗网络模型(GAN)等。现有的图像识别算法无法区分汽机和汽机模型、老虎和老虎玩具等这类物体特征高度相似但物体真实大小有明显区别的图像，无法在一张多类别共存的图片或者场景中将图像识别算法的注意力集中在我们要求识别的物体类别上。根据眼睛进化史、人类视觉识别常识和视觉系统神经网络的研究可知，物体在真实物理世界中的大小(物体真实大小)是人类识别物体的重要依据。物体真实大小的识别是一个由背侧视觉通路、腹侧视觉通路、顶叶皮质区域等脑区参与的自动识别的过程。目前人工智能领域还没有报道基于物体真实大小的图像识别方法。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本申请的第一个目的在于提出一种基于物体真实大小和物体特征的图像识别方法，解决了现有方法无法区分物体特征高度相似但物体真实大小有明显区别的图像的技术问题，同时解决了在识别一张多类别共存的图片或者场景时将图像识别算法的注意力集中在要求识别...

【技术保护点】
1.一种基于物体真实大小和物体特征的图像识别方法，其特征在于，包括以下步骤：/nS1、获取测试集和标签集，所述测试集包括待识别图像，所述标签集中包括预存的各物体类别标签，与拍摄距离范围和物体在图像中大小范围之间的对应关系；/nS2、根据对所述待识别图像进行图像识别后生成的多个类别标签和所述标签集，从多个类别标签中确定所述待识别图像的真实类别标签；/nS3、根据所述真实匹配类别标签生成所述待识别图像的识别结果，并输出所述识别结果。/n

【技术特征摘要】
1.一种基于物体真实大小和物体特征的图像识别方法，其特征在于，包括以下步骤：
S1、获取测试集和标签集，所述测试集包括待识别图像，所述标签集中包括预存的各物体类别标签，与拍摄距离范围和物体在图像中大小范围之间的对应关系；
S2、根据对所述待识别图像进行图像识别后生成的多个类别标签和所述标签集，从多个类别标签中确定所述待识别图像的真实类别标签；
S3、根据所述真实匹配类别标签生成所述待识别图像的识别结果，并输出所述识别结果。

2.如权利要求1所述的识别方法，其特征在于，所述步骤S2包括：
S211、对所述待识别图像中的物体进行识别，根据物体类别获取所述待识别图像对应的多个类别标签，并获取所述多个类别标签中每个类别标签对应的匹配概率；
S212、按照所述匹配概率从大到小的顺序从所述多个类别标签中提取第一个类别标签；
S213、根据提取的类别标签从所述标签集中确定与提取的类别标签对应的物体类别标签，并将所述待识别图像的拍摄距离与确定的物体类别标签对应的拍摄距离范围进行比较，判断所述待识别图像的拍摄距离是否在拍摄距离范围内；
S214、如果所述待识别图像的拍摄距离在拍摄距离范围内，则进一步将所述待识别图像的物体在图像中大小与确定的物体类别标签对应的物体在图像中大小范围进行比较，判断所述待识别图像的物体在图像中大小是否在物体在图像中大小范围内；
S215、如果所述待识别图像的物体在图像中大小在物体在图像中大小范围内，则将确定的物体类别标签作为所述待识别图像的真实类别标签。

3.如权利要求2所述的识别方法，其特征在于，在所述步骤S213之后，所述识别方法还包括：
如果所述待识别图像的拍摄距离不在拍摄距离范围内，则从所述多个类别标签中提取第二个类别标签，并根据提取的第二个类别标签重复进行上述步骤S213-215；
在所述步骤S214之后，所述识别方法还包括：
如果所述待识别图像的物体在图像中大小不在物体在图像中大小范围内，则从所述多个类别标签中提取第二个类别标签，并根据提取的第二个类别标签重复进行上述步骤S213-215。

4.如权利要求1所述的识别方法，其特征在于，所述步骤S2包括：
S221、将所述待识别图像的拍摄距离和物体在图像中大小与所述标签集中的拍摄距离范围...

【专利技术属性】
技术研发人员：戴琼海，李晓飞，
申请(专利权)人：清华大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人