图像识别方法、装置、电子设备和介质制造方法及图纸

技术编号：29929857 阅读：16 留言：0更新日期：2021-09-04 18:56

本公开披露了一种图像识别方法、装置、设备、介质和产品，涉及人工智能技术领域，具体为计算机视觉和深度学习技术领域，可应用于图像识别场景下。图像识别方法包括：对待识别图像进行识别，得到目标对象在待识别图像中的位置信息和针对目标对象的第一标签；基于位置信息，将待识别图像中目标对象所在的区域图像和多个参考图像分别进行相似度比较得到比较结果，其中，每个参考图像包括参考对象和针对参考对象的第二标签；基于比较结果，从多个参考图像中确定目标图像；基于第一标签和目标图像的第二标签，确定针对目标对象的目标标签。确定针对目标对象的目标标签。确定针对目标对象的目标标签。

全部详细技术资料下载

【技术实现步骤摘要】
图像识别方法、装置、电子设备和介质

[0001]本公开涉及人工智能
，具体为计算机视觉和深度学习
，可应用于图像识别场景下。

技术介绍

[0002]相关技术通常通过图像识别技术对待识别图像进行识别，以识别出待识别图像中的对象。但是，在一些场景下，当针对堆叠放置的多个对象进行图像采集得到待识别图像时，待识别图像中多个对象较为密集，从而导致相关技术的图像识别技术难以准确识别出待识别图像中的对象。

技术实现思路

[0003]本公开提供了一种图像识别方法、装置、电子设备、存储介质以及程序产品。
[0004]根据本公开的一方面，提供了一种图像识别方法，包括：对待识别图像进行识别，得到目标对象在待识别图像中的位置信息和针对所述目标对象的第一标签；基于所述位置信息，将所述待识别图像中目标对象所在的区域图像和多个参考图像分别进行相似度比较得到比较结果，其中，每个参考图像包括参考对象和针对参考对象的第二标签；基于所述比较结果，从所述多个参考图像中确定目标图像；基于所述第一标签和所述目标图像的第二标签，确定针对所述目标对象的目标标签。
[0005]根据本公开的另一方面，提供了一种图像识别装置，包括：识别模块、比较模块第一确定模块以及第二确定模块。识别模块，用于对待识别图像进行识别，得到目标对象在待识别图像中的位置信息和针对所述目标对象的第一标签；比较模块，用于基于所述位置信息，将所述待识别图像中目标对象所在的区域图像和多个参考图像分别进行相似度比较得到比较结果，其中，每个参考图像包括参考对象和...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法，包括：对待识别图像进行识别，得到目标对象在待识别图像中的位置信息和针对所述目标对象的第一标签；基于所述位置信息，将所述待识别图像中目标对象所在的区域图像和多个参考图像分别进行相似度比较得到比较结果，其中，每个参考图像包括参考对象和针对参考对象的第二标签；基于所述比较结果，从所述多个参考图像中确定目标图像；以及基于所述第一标签和所述目标图像的第二标签，确定针对所述目标对象的目标标签。2.根据权利要求1所述的方法，其中，所述基于所述比较结果，从所述多个参考图像中确定目标图像包括：将所述多个参考图像中，与所述区域图像之间的相似度排在前N个的参考图像确定为N个候选图像，其中，N为大于1的整数；以及基于所述区域图像和所述N个候选图像中每个候选图像之间的相似度，从所述N个候选图像中确定目标图像。3.根据权利要求2所述的方法，其中，所述基于所述区域图像和所述N个候选图像中每个候选图像之间的相似度，从所述N个候选图像中确定目标图像包括以下至少一项：将所述N个候选图像中与所述区域图像之间的相似度大于第一阈值的候选图像确定为目标图像；响应于所述N个候选图像中每个候选图像与所述区域图像之间的相似度均小于第二阈值，从所述N个候选图像中确定与所述区域图像之间的相似度排在前n个的候选图像，并基于n个候选图像中每个候选图像的第二标签的出现次数，从n个候选图像中确定目标图像，其中，n小于N，所述出现次数表示所述多个参考图像中具有第二标签的参考图像的数量；以及响应于所述N个候选图像中每个候选图像与所述区域图像之间的相似度均小于第三阈值，从所述N个候选图像中选择与所述区域图像之间的相似度最大的一个候选图像作为目标图像，其中，所述第二阈值小于或等于所述第一阈值，所述第三阈值小于所述第二阈值。4.根据权利要求3所述的方法，其中，所述基于所述第一标签和所述目标图像的第二标签，确定针对所述目标对象的目标标签包括以下至少一项：响应于所述第一标签和所述第二标签满足第一条件，从所述第一标签和所述第二标签中选择一个作为目标标签；以及响应于所述第一标签和所述第二标签满足第二条件，确定第一标签的置信度和第二标签的相似度之间的差值，并基于所述差值从所述第一标签、所述第二标签和相邻标签中确定目标标签，其中，所述相邻标签为所述待识别图像中与目标对象相邻的其他对象的标签。5.根据权利要求1
‑
4中任意一项所述的方法，其中，所述待识别图像包括多个目标对象，所述多个目标对象中相邻目标对象之间的距离小于预设距离；其中，所述对待识别图像进行识别，得到目标对象在待识别图像中的位置信息包括：基于预设尺寸生成多个初始检测框，其中，所述预设尺寸与所述预设距离相关联；以及更新所述多个初始检测框，得到多个目标检测框；以及
基于所述多个目标检测框在所述待识别图像中的位置，确定所述目标对象的位置信息。6.根据权利要求5中任意一项所述的方法，其中，所述更新所述多个初始检测框，得到多个目标检测框包括：基于所述待识别图像的图像特征，调整所述多个初始检测框，得到多个经调整检测框，其中，每个经调整检测框具有对应标签和所述对应标签的置信度；针对所述多个经调整检测框中具有不同标签的相邻两个检测框，基于所述相邻两个检测框之间的重合度，调整所述相邻两个检测框中至少一个检测框的置信度；以及基于预设置信度条件，从调整置信度后得到的多个经调整检测框中选择多个目标检测框。7.根据权利要求1所述的方法，其中，所述待识别图像包括多个目标对象；所述方法还包括：基于所述每个目标对象的目标标签，从所述多个目标对象中确定目标类型对象；以及基于所述目标类型对象在所述待识别图像中的位置信息和所述目标类型对象的尺寸信息，确定由目标类型对象指示的目标区域的面积。8.根据权利要求7所述的方法，其中，所述基于所述目标类型对象在所述待识别图像中的位置信息和所述目标类型对象的尺寸信息，确定由所述目标类型对象指示的目标区域的面积包括：基于所述目标类型对象在所述待识别图像中的位置信息，从所述目标类型对象中确定多个基准对象；从所述多个基准对象中确定第一基准对象、第二基准对象和第三基准对象，其中，所述第二基准对象和所述第三基准对象处于所述第一基准对象的两侧；确定由所述第一基准对象指向所述第二基准对象的方向为第一方向；确定由所述第一基准对象指向所述第三基准对象的方向为第二方向；以及响应于所述第一方向和所述第二方向之间的夹角属于预设夹角，基于所述目标类型对象在所述待识别图像中的位置信息和所述目标类型对象的尺寸信息，确定由所述目标类型对象指示的目标区域的面积。9.根据权利要求7所述的方法，还包括：利用分类模型对所述待识别图像进行分类处理；其中，所述基于所述目标类型对象在所述待识别图像中的位置信息和所述目标类型对象的尺寸信息，确定由所述目标类型对象指示的目标区域的面积包括：响应于所述待识别图像的类别为第一类别，基于所述目标类型对象在所述待识别图像中的位置信息和所述目标类型对象的尺寸信息，确定由所述目标类型对象指示的目标区域的面积。10.根据权利要求9所述的方法，其中，所述待识别图像是针对多个对象获得的图像，所述目标类型对象包括所述多个对象中的至少部分对象；所述方法还包括：响应于所述待识别图像的类别为第二类别，基于目标类型对象在所述待识别图像中的位置信息和目标类型对象的图像特征，确定所述多个对象的数量。11.一种图像识别装置，包括：
识别模块，用于对待识别图像进行识别，得到目标对象在待识别图像中的位置信息和针对所述目标对象的第一标签；比较模块，用于基于所述位置信息，将所述待识别图像中目标对象所在的区域图像和多个参考图像分别进行相似度比较得到比较结果，其中，每个参考图像包括参考对象和针对参考对象的第二标签；第...

【专利技术属性】
技术研发人员：安容巧，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人