图像识别方法、装置、可读存储介质及电子设备制造方法及图纸

技术编号：27030697 阅读：17 留言：0更新日期：2021-01-12 11:13

本公开实施例公开了一种图像识别方法和装置，其中，该方法包括：获取待检索图像；将待检索图像输入预先训练的第一识别模型，生成待检索图像的语言描述信息；将待检索图像和语言描述信息输入预先训练的第二识别模型，得到待检索图像中的物体特征数据；在数据库中检索与物体特征数据相对应的物体信息。本公开实施例实现了在图像中生成相应的语言描述信息，以及将图像和语言描述信息相结合进行物体图像识别的新方法，使得到的物体特征数据更加丰富，提高了图像识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
图像识别方法、装置、可读存储介质及电子设备
本公开涉及计算机
，尤其是一种图像识别方法、装置、计算机可读存储介质及电子设备。
技术介绍
物体识别技术是一种对图像进行识别，从中提取目标物体图像，并对目标物体图像进行检索、匹配等操作的技术。物体识别技术可以应用在领域。例如，行人重识别领域。行人重识别是一种在不同摄像头拍摄的图像中找到目标行人的技术，在计算机视觉、智能监控中有着广泛地应用场景。行人重识别的难点在于如何精确地匹配表观变化巨大的行人，例如姿态、摄像头视角、光照条件等造成的差异。随着深度学习的发展以及大样本数据集的出现，深度神经网路也被引入行人重识别领域，大大提高了识别性能。
技术实现思路
本公开的实施例提供了一种图像识别方法、装置、计算机可读存储介质及电子设备。根据本公开实施例的一个方面，提供了一种图像识别方法，该方法包括：获取待检索图像；将待检索图像输入预先训练的第一识别模型，生成待检索图像的语言描述信息；将待检索图像和语言描述信息输入预先训练的第二识别模型，得到待检索图像中的物体特征数据；在数据库中检索与物体特征数据相对应的物体信息。根据本公开实施例的另一个方面，提供了一种图像识别装置，该装置包括：获取模块，用于获取待检索图像；第一识别模块，用于将待检索图像输入预先训练的第一识别模型，生成待检索图像的语言描述信息；第二识别模块，用于将待检索图像和语言描述信息输入预先训练的第二识别模型，得到待检索图像中的物体特征数据；检索模块，用于在数据库中检索与物体特征数据相对应的物体信息...

【技术保护点】
1.一种图像识别方法，包括：/n获取待检索图像；/n将所述待检索图像输入预先训练的第一识别模型，生成所述待检索图像的语言描述信息；/n将所述待检索图像和所述语言描述信息输入预先训练的第二识别模型，得到所述待检索图像中的物体特征数据；/n在数据库中检索与所述物体特征数据相对应的物体信息。/n

【技术特征摘要】
1.一种图像识别方法，包括：
获取待检索图像；
将所述待检索图像输入预先训练的第一识别模型，生成所述待检索图像的语言描述信息；
将所述待检索图像和所述语言描述信息输入预先训练的第二识别模型，得到所述待检索图像中的物体特征数据；
在数据库中检索与所述物体特征数据相对应的物体信息。

2.根据权利要求1所述的方法，其中，所述第二识别模型包括视觉特征提取模型和语言特征提取模型；所述将所述待检索图像和所述语言描述信息输入预先训练的第二识别模型，得到所述待检索图像中的物体特征数据，包括：
将所述待检索图像输入所述视觉特征提取模型，通过所述视觉特征提取模型得到视觉特征数据；
将所述语言描述信息输入所述语言特征提取模型，通过所述语言特征提取模型得到语言特征数据；
基于所述视觉特征数据和所述语言特征数据，生成所述待检索图像中的物体特征数据。

3.根据权利要求2所述的方法，其中，所述将所述语言描述信息输入所述语言特征提取模型，通过所述语言特征提取模型得到语言特征数据，包括：
将所述语言描述信息输入所述语言特征提取模型包括的第一层网络，得到所述语言描述信息包括的每个词语的词语特征数据；
基于所述语言特征提取模型包括的门控制单元，对所得到的词语特征数据进行筛选，得到筛选后词语特征数据；
将所述筛选后词语特征数据输入所述语言特征提取模型包括的第二层网络，得到语言特征数据。

4.根据权利要求1所述的方法，其中，所述获取待检索图像，包括：
获取待转换图像；
确定所述待转换图像的图像风格是否为预设风格；
如果是，将所述待转换图像确定为待检索图像；
如果否，将所述待转换图像输入预先训练的生成对抗网络，得到符合所述预设风格的图像作为待检索图像。

5.根据权利要求1-4之一所述的方法，其中，所述数据库包括物体特征数据和与物体特征数据对应的物体信息；以及
所述在数据库中检索与所述物体特征数据相对应的物体信息，包括：
确定所述物体特征数据与所述数据库中的物体特征数据的距离；
将符合预设条件的距离对应的物体信息确定为与所述待检索图像对应的物体信息。

6.一种图像识别装置，包括：
获取模块，用于获取待检索图像；
第一识别模块，用于将所述待检索图像输入预先训练的第一识别模型，生成所述待检索图像的语言描述信息；
第二识别模块，用于将所述待检...

【专利技术属性】
技术研发人员：徐麟，徐军，
申请(专利权)人：北京地平线机器人技术研发有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人