图像识别方法、装置、电子设备和介质制造方法及图纸

技术编号:29929857 阅读:16 留言:0更新日期:2021-09-04 18:56
本公开披露了一种图像识别方法、装置、设备、介质和产品,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于图像识别场景下。图像识别方法包括:对待识别图像进行识别,得到目标对象在待识别图像中的位置信息和针对目标对象的第一标签;基于位置信息,将待识别图像中目标对象所在的区域图像和多个参考图像分别进行相似度比较得到比较结果,其中,每个参考图像包括参考对象和针对参考对象的第二标签;基于比较结果,从多个参考图像中确定目标图像;基于第一标签和目标图像的第二标签,确定针对目标对象的目标标签。确定针对目标对象的目标标签。确定针对目标对象的目标标签。

【技术实现步骤摘要】
图像识别方法、装置、电子设备和介质


[0001]本公开涉及人工智能
,具体为计算机视觉和深度学习
,可应用于图像识别场景下。

技术介绍

[0002]相关技术通常通过图像识别技术对待识别图像进行识别,以识别出待识别图像中的对象。但是,在一些场景下,当针对堆叠放置的多个对象进行图像采集得到待识别图像时,待识别图像中多个对象较为密集,从而导致相关技术的图像识别技术难以准确识别出待识别图像中的对象。

技术实现思路

[0003]本公开提供了一种图像识别方法、装置、电子设备、存储介质以及程序产品。
[0004]根据本公开的一方面,提供了一种图像识别方法,包括:对待识别图像进行识别,得到目标对象在待识别图像中的位置信息和针对所述目标对象的第一标签;基于所述位置信息,将所述待识别图像中目标对象所在的区域图像和多个参考图像分别进行相似度比较得到比较结果,其中,每个参考图像包括参考对象和针对参考对象的第二标签;基于所述比较结果,从所述多个参考图像中确定目标图像;基于所述第一标签和所述目标图像的第二标签,确定针对所述目标对象的目标标签。
[0005]根据本公开的另一方面,提供了一种图像识别装置,包括:识别模块、比较模块第一确定模块以及第二确定模块。识别模块,用于对待识别图像进行识别,得到目标对象在待识别图像中的位置信息和针对所述目标对象的第一标签;比较模块,用于基于所述位置信息,将所述待识别图像中目标对象所在的区域图像和多个参考图像分别进行相似度比较得到比较结果,其中,每个参考图像包括参考对象和针对参考对象的第二标签;第一确定模块,用于基于所述比较结果,从所述多个参考图像中确定目标图像;第二确定模块,用于基于所述第一标签和所述目标图像的第二标签,确定针对所述目标对象的目标标签。
[0006]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器和与所述至少一个处理器通信连接的存储器。其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的图像识别方法。
[0007]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行上述的图像识别方法。
[0008]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述的图像识别方法。
[0009]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0010]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0011]图1示意性示出了根据本公开一实施例的图像识别和装置的系统架构;
[0012]图2示意性示出了根据本公开一实施例的图像识别方法的流程图;
[0013]图3示意性示出了根据本公开一实施例的图像识别方法的示意图;
[0014]图4示意性示出了根据本公开一实施例的面积计算的示意图;
[0015]图5示意性示出了根据本公开另一实施例的图像识别的示意图;
[0016]图6示意性示出了根据本公开一实施例的数量计算的示意图;
[0017]图7示意性示出了根据本公开一实施例的图像识别装置的框图;以及
[0018]图8是用来实现本公开实施例的用于执行图像识别的电子设备的框图。
具体实施方式
[0019]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0020]在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
[0021]在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
[0022]在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
[0023]本公开的实施例提供了一种图像识别方法。图像识别方法包括:对待识别图像进行识别,得到目标对象在待识别图像中的位置信息和针对目标对象的第一标签。然后,基于位置信息,将待识别图像中目标对象所在的区域图像和多个参考图像分别进行相似度比较得到比较结果,每个参考图像包括参考对象和针对参考对象的第二标签,基于比较结果,从多个参考图像中确定目标图像,接下来,基于第一标签和目标图像的第二标签,确定针对目标对象的目标标签。
[0024]图1示意性示出了根据本公开一实施例的图像识别和装置的系统架构。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的
技术实现思路
,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
[0025]如图1所示,根据该实施例的系统架构100可以包括客户端101、102、103,网络104和服务器105。网络104用以在客户端101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0026]用户可以使用客户端101、102、103通过网络104与服务器105交互,以接收或发送
消息等。客户端101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
[0027]客户端101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。本公开实施例的客户端101、102、103例如可以运行应用程序。
[0028]服务器105可以是提供各种服务的服务器,例如对用户利用客户端101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给客户端。另外,服务器105还可以是云服务器,即服务器105具有云计算功能。
[0029]需要说明的是,本公开实施例所提供的图像识别方法可以由服务本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法,包括:对待识别图像进行识别,得到目标对象在待识别图像中的位置信息和针对所述目标对象的第一标签;基于所述位置信息,将所述待识别图像中目标对象所在的区域图像和多个参考图像分别进行相似度比较得到比较结果,其中,每个参考图像包括参考对象和针对参考对象的第二标签;基于所述比较结果,从所述多个参考图像中确定目标图像;以及基于所述第一标签和所述目标图像的第二标签,确定针对所述目标对象的目标标签。2.根据权利要求1所述的方法,其中,所述基于所述比较结果,从所述多个参考图像中确定目标图像包括:将所述多个参考图像中,与所述区域图像之间的相似度排在前N个的参考图像确定为N个候选图像,其中,N为大于1的整数;以及基于所述区域图像和所述N个候选图像中每个候选图像之间的相似度,从所述N个候选图像中确定目标图像。3.根据权利要求2所述的方法,其中,所述基于所述区域图像和所述N个候选图像中每个候选图像之间的相似度,从所述N个候选图像中确定目标图像包括以下至少一项:将所述N个候选图像中与所述区域图像之间的相似度大于第一阈值的候选图像确定为目标图像;响应于所述N个候选图像中每个候选图像与所述区域图像之间的相似度均小于第二阈值,从所述N个候选图像中确定与所述区域图像之间的相似度排在前n个的候选图像,并基于n个候选图像中每个候选图像的第二标签的出现次数,从n个候选图像中确定目标图像,其中,n小于N,所述出现次数表示所述多个参考图像中具有第二标签的参考图像的数量;以及响应于所述N个候选图像中每个候选图像与所述区域图像之间的相似度均小于第三阈值,从所述N个候选图像中选择与所述区域图像之间的相似度最大的一个候选图像作为目标图像,其中,所述第二阈值小于或等于所述第一阈值,所述第三阈值小于所述第二阈值。4.根据权利要求3所述的方法,其中,所述基于所述第一标签和所述目标图像的第二标签,确定针对所述目标对象的目标标签包括以下至少一项:响应于所述第一标签和所述第二标签满足第一条件,从所述第一标签和所述第二标签中选择一个作为目标标签;以及响应于所述第一标签和所述第二标签满足第二条件,确定第一标签的置信度和第二标签的相似度之间的差值,并基于所述差值从所述第一标签、所述第二标签和相邻标签中确定目标标签,其中,所述相邻标签为所述待识别图像中与目标对象相邻的其他对象的标签。5.根据权利要求1

4中任意一项所述的方法,其中,所述待识别图像包括多个目标对象,所述多个目标对象中相邻目标对象之间的距离小于预设距离;其中,所述对待识别图像进行识别,得到目标对象在待识别图像中的位置信息包括:基于预设尺寸生成多个初始检测框,其中,所述预设尺寸与所述预设距离相关联;以及更新所述多个初始检测框,得到多个目标检测框;以及
基于所述多个目标检测框在所述待识别图像中的位置,确定所述目标对象的位置信息。6.根据权利要求5中任意一项所述的方法,其中,所述更新所述多个初始检测框,得到多个目标检测框包括:基于所述待识别图像的图像特征,调整所述多个初始检测框,得到多个经调整检测框,其中,每个经调整检测框具有对应标签和所述对应标签的置信度;针对所述多个经调整检测框中具有不同标签的相邻两个检测框,基于所述相邻两个检测框之间的重合度,调整所述相邻两个检测框中至少一个检测框的置信度;以及基于预设置信度条件,从调整置信度后得到的多个经调整检测框中选择多个目标检测框。7.根据权利要求1所述的方法,其中,所述待识别图像包括多个目标对象;所述方法还包括:基于所述每个目标对象的目标标签,从所述多个目标对象中确定目标类型对象;以及基于所述目标类型对象在所述待识别图像中的位置信息和所述目标类型对象的尺寸信息,确定由目标类型对象指示的目标区域的面积。8.根据权利要求7所述的方法,其中,所述基于所述目标类型对象在所述待识别图像中的位置信息和所述目标类型对象的尺寸信息,确定由所述目标类型对象指示的目标区域的面积包括:基于所述目标类型对象在所述待识别图像中的位置信息,从所述目标类型对象中确定多个基准对象;从所述多个基准对象中确定第一基准对象、第二基准对象和第三基准对象,其中,所述第二基准对象和所述第三基准对象处于所述第一基准对象的两侧;确定由所述第一基准对象指向所述第二基准对象的方向为第一方向;确定由所述第一基准对象指向所述第三基准对象的方向为第二方向;以及响应于所述第一方向和所述第二方向之间的夹角属于预设夹角,基于所述目标类型对象在所述待识别图像中的位置信息和所述目标类型对象的尺寸信息,确定由所述目标类型对象指示的目标区域的面积。9.根据权利要求7所述的方法,还包括:利用分类模型对所述待识别图像进行分类处理;其中,所述基于所述目标类型对象在所述待识别图像中的位置信息和所述目标类型对象的尺寸信息,确定由所述目标类型对象指示的目标区域的面积包括:响应于所述待识别图像的类别为第一类别,基于所述目标类型对象在所述待识别图像中的位置信息和所述目标类型对象的尺寸信息,确定由所述目标类型对象指示的目标区域的面积。10.根据权利要求9所述的方法,其中,所述待识别图像是针对多个对象获得的图像,所述目标类型对象包括所述多个对象中的至少部分对象;所述方法还包括:响应于所述待识别图像的类别为第二类别,基于目标类型对象在所述待识别图像中的位置信息和目标类型对象的图像特征,确定所述多个对象的数量。11.一种图像识别装置,包括:
识别模块,用于对待识别图像进行识别,得到目标对象在待识别图像中的位置信息和针对所述目标对象的第一标签;比较模块,用于基于所述位置信息,将所述待识别图像中目标对象所在的区域图像和多个参考图像分别进行相似度比较得到比较结果,其中,每个参考图像包括参考对象和针对参考对象的第二标签;第...

【专利技术属性】
技术研发人员:安容巧
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1