图像识别方法、装置、可读存储介质及电子设备制造方法及图纸

技术编号:27030697 阅读:17 留言:0更新日期:2021-01-12 11:13
本公开实施例公开了一种图像识别方法和装置,其中,该方法包括:获取待检索图像;将待检索图像输入预先训练的第一识别模型,生成待检索图像的语言描述信息;将待检索图像和语言描述信息输入预先训练的第二识别模型,得到待检索图像中的物体特征数据;在数据库中检索与物体特征数据相对应的物体信息。本公开实施例实现了在图像中生成相应的语言描述信息,以及将图像和语言描述信息相结合进行物体图像识别的新方法,使得到的物体特征数据更加丰富,提高了图像识别的准确性。

【技术实现步骤摘要】
图像识别方法、装置、可读存储介质及电子设备
本公开涉及计算机
,尤其是一种图像识别方法、装置、计算机可读存储介质及电子设备。
技术介绍
物体识别技术是一种对图像进行识别,从中提取目标物体图像,并对目标物体图像进行检索、匹配等操作的技术。物体识别技术可以应用在领域。例如,行人重识别领域。行人重识别是一种在不同摄像头拍摄的图像中找到目标行人的技术,在计算机视觉、智能监控中有着广泛地应用场景。行人重识别的难点在于如何精确地匹配表观变化巨大的行人,例如姿态、摄像头视角、光照条件等造成的差异。随着深度学习的发展以及大样本数据集的出现,深度神经网路也被引入行人重识别领域,大大提高了识别性能。
技术实现思路
本公开的实施例提供了一种图像识别方法、装置、计算机可读存储介质及电子设备。根据本公开实施例的一个方面,提供了一种图像识别方法,该方法包括:获取待检索图像;将待检索图像输入预先训练的第一识别模型,生成待检索图像的语言描述信息;将待检索图像和语言描述信息输入预先训练的第二识别模型,得到待检索图像中的物体特征数据;在数据库中检索与物体特征数据相对应的物体信息。根据本公开实施例的另一个方面,提供了一种图像识别装置,该装置包括:获取模块,用于获取待检索图像;第一识别模块,用于将待检索图像输入预先训练的第一识别模型,生成待检索图像的语言描述信息;第二识别模块,用于将待检索图像和语言描述信息输入预先训练的第二识别模型,得到待检索图像中的物体特征数据;检索模块,用于在数据库中检索与物体特征数据相对应的物体信息。根据本公开实施例的另一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序用于执行上述图像识别方法。根据本公开实施例的另一个方面,提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述图像识别方法。基于本公开上述实施例提供的图像识别方法、装置、计算机可读存储介质及电子设备,通过使用第一识别模型,得到待检索图像的语言描述信息,将语言描述信息和待检索图像输入第二识别模型,得到待检索图像中的物体特征数据,最后在数据库中检索与物体特征数据对应的物体信息。从而实现了在图像中生成相应的语言描述信息,以及将图像和语言描述信息相结合进行物体图像识别的新方法,使得到的物体特征数据更加丰富,提高了图像识别的准确性。下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。附图说明通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。图1是本公开所适用的系统图。图2是本公开一示例性实施例提供的图像识别方法的流程示意图。图3是本公开一示例性实施例提供的第二识别模型的结构示意图。图4是本公开的实施例的图像识别方法的一个应用场景的示意图。图5是本公开另一示例性实施例提供的图像识别方法的流程示意图。图6是本公开一示例性实施例提供的图像识别装置的结构示意图。图7是本公开另一示例性实施例提供的图像识别装置的结构示意图。图8是本公开一示例性实施例提供的电子设备的结构图。具体实施方式下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。另外,本公开中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。本公开实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端设备、计算机系统、服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。申请概述物体识别技术(例如行人重识别)是一种对图像进行识别,从中提取目标物体图像,并对目标物体图像进行匹配、检索等操作的技术。目前,对物体图像进行检索主要依赖于深度神经网络提取图片的视觉特征,根据计算两张图片之间的相似度,从而搜索出与目标物体图像最相似物体图像。图片的视觉特征容易受到物体姿态、拍摄角度和光线变化等原因影响。为了提升性能,可以在进行物体识别时加入各种图像附属信息,例如物体图片的语言描述信息。图像语言描述在语义上比视觉特征更加丰富、一致,可以显著减轻视觉差异。但是,物体语言描述信息往往较难本文档来自技高网...

【技术保护点】
1.一种图像识别方法,包括:/n获取待检索图像;/n将所述待检索图像输入预先训练的第一识别模型,生成所述待检索图像的语言描述信息;/n将所述待检索图像和所述语言描述信息输入预先训练的第二识别模型,得到所述待检索图像中的物体特征数据;/n在数据库中检索与所述物体特征数据相对应的物体信息。/n

【技术特征摘要】
1.一种图像识别方法,包括:
获取待检索图像;
将所述待检索图像输入预先训练的第一识别模型,生成所述待检索图像的语言描述信息;
将所述待检索图像和所述语言描述信息输入预先训练的第二识别模型,得到所述待检索图像中的物体特征数据;
在数据库中检索与所述物体特征数据相对应的物体信息。


2.根据权利要求1所述的方法,其中,所述第二识别模型包括视觉特征提取模型和语言特征提取模型;所述将所述待检索图像和所述语言描述信息输入预先训练的第二识别模型,得到所述待检索图像中的物体特征数据,包括:
将所述待检索图像输入所述视觉特征提取模型,通过所述视觉特征提取模型得到视觉特征数据;
将所述语言描述信息输入所述语言特征提取模型,通过所述语言特征提取模型得到语言特征数据;
基于所述视觉特征数据和所述语言特征数据,生成所述待检索图像中的物体特征数据。


3.根据权利要求2所述的方法,其中,所述将所述语言描述信息输入所述语言特征提取模型,通过所述语言特征提取模型得到语言特征数据,包括:
将所述语言描述信息输入所述语言特征提取模型包括的第一层网络,得到所述语言描述信息包括的每个词语的词语特征数据;
基于所述语言特征提取模型包括的门控制单元,对所得到的词语特征数据进行筛选,得到筛选后词语特征数据;
将所述筛选后词语特征数据输入所述语言特征提取模型包括的第二层网络,得到语言特征数据。


4.根据权利要求1所述的方法,其中,所述获取待检索图像,包括:
获取待转换图像;
确定所述待转换图像的图像风格是否为预设风格;
如果是,将所述待转换图像确定为待检索图像;
如果否,将所述待转换图像输入预先训练的生成对抗网络,得到符合所述预设风格的图像作为待检索图像。


5.根据权利要求1-4之一所述的方法,其中,所述数据库包括物体特征数据和与物体特征数据对应的物体信息;以及
所述在数据库中检索与所述物体特征数据相对应的物体信息,包括:
确定所述物体特征数据与所述数据库中的物体特征数据的距离;
将符合预设条件的距离对应的物体信息确定为与所述待检索图像对应的物体信息。


6.一种图像识别装置,包括:
获取模块,用于获取待检索图像;
第一识别模块,用于将所述待检索图像输入预先训练的第一识别模型,生成所述待检索图像的语言描述信息;
第二识别模块,用于将所述待检...

【专利技术属性】
技术研发人员:徐麟徐军
申请(专利权)人:北京地平线机器人技术研发有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1