图像识别方法、装置以及电子设备制造方法及图纸

技术编号:35819076 阅读:25 留言:0更新日期:2022-12-03 13:43
本申请实施例公开了一种图像识别方法、装置以及电子设备。方法包括:获取待识别图像的特征信息;基于注意力机制模型获取与特征信息对应的分类向量,注意力机制模型用于根据特征信息得到对应的分类向量;基于分类向量,得到待识别图像所包括的物体对应的热度图;根据热度图获取热度图对应的物体在待识别图像中的位置信息,位置信息用于在待识别图像中对物体进行标注。从而通过上述方式使得用于对图像进行识别的模型可以不再需要使用标注了物体位置的训练图像进行训练,以便可以省略训练图像对应的物体位置标注的过程,以降低模型的训练成本。并且,在本申请提供的方法中可以直接通过热度图来确定物体的位置,进而提升了识别效率。率。率。

【技术实现步骤摘要】
图像识别方法、装置以及电子设备


[0001]本申请涉及计算机
,更具体地,涉及一种图像识别方法、装置以及电子设备。

技术介绍

[0002]随着技术的发展,可以通过神经网络模型来对图像中的内容进行分类识别。例如,可以通过神经网络模型识别出图像中的人物以及动物等物体,并且,还可以标注出所识别物体的位置。其中,能够用于进行分类识别的神经网络模型需要先通过训练数据进行训练。但是,相关的神经网络模型的训练成本和识别效率都有待优化。

技术实现思路

[0003]鉴于上述问题,本申请提出了一种图像识别方法、装置以及电子设备,以改善上述问题。
[0004]第一方面,本申请提供了一种图像识别方法,所述方法包括:获取待识别图像的特征信息;基于注意力机制模型获取与所述特征信息对应的分类向量,所述注意力机制模型用于根据特征信息得到对应的分类向量;基于所述分类向量,得到所述待识别图像所包括的物体对应的热度图;根据所述热度图获取所述热度图对应的物体在所述待识别图像中的位置信息,所述位置信息用于在所述待识别图像中对所述物体进行标注。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法,其特征在于,所述方法包括:获取待识别图像的特征信息;基于注意力机制模型获取与所述特征信息对应的分类向量,所述注意力机制模型用于根据特征信息得到对应的分类向量;基于所述分类向量,得到所述待识别图像所包括的物体对应的热度图;根据所述热度图获取所述热度图对应的物体在所述待识别图像中的位置信息,所述位置信息用于在所述待识别图像中对所述物体进行标注。2.根据权利要求1所述的方法,其特征在于,所述注意力机制模型包括自注意力机制模块和交叉注意力机制模块,所述特征信息包括所述待识别图像对应的特征图和标签向量,所述基于注意力机制模型获取与所述特征信息对应的分类向量,包括:基于所述自注意力机制模块对所述标签向量进行处理,得到第一处理结果;基于所述交叉注意力机制模块对第一处理结果和所述特征图进行处理,得到第二处理结果;通过全连接层对所述第二处理结果进行处理,得到分类向量。3.根据权利要求1所述的方法,其特征在于,所述基于所述分类向量,得到所述待识别图像所包括的物体对应的热度图,包括:根据所述分类向量得到对应的指定长宽比的热度图;对所述指定长宽比的热度图的尺寸进行调整,将调整后的图像作为物体对应的热度图,其中,调整后的图像的尺寸与所述待识别图像的尺寸相同。4.根据权利要求1所述的方法,其特征在于,所述根据所述热度图获取所述热度图对应的物体在所述待识别图像中的位置信息,包括:获取所述热度图所包括的目标像素,所述目标像素包括对应的像素值大于预设阈值的像素;基于所述目标像素的位置和像素值得到热度图对应物体的位置信息。5.根据权利要求4所述的方法,其特征在于,所述目标像素的位置包括目标像素所在坐标区域的横坐标以及纵坐标,所述物体的位置信息包括物体的中心位置的横坐标、中心位置的纵坐标、宽度以及高度,所述基于所述目标像素的位置和像素值得到热度图对应物体的位置信息,包括:基于目标像素的像素值以及所述横坐标得到热度图对应物体的中心位置的横坐标;基于目标像素的像素值以及所述纵坐标得到热度图对应物体的中心位置的纵坐标;基于所述目标像素的像素值、目标像素的横坐标以及所述中心位置的横坐标,得到热度图对应物体的宽度;基于所述目标像素的像素值、目标像素的纵坐标以及所述中心位置的纵坐标,得到热度图对应物体的高度。6.根据权利要求4所述的方法,其特征在于,所述获取所述热度图所包括的目标像素,所述目标像素包括对应的像素值大于预设阈值的像素包括:获取所述热度图对应物体的分类;获取所述分类对应的预设阈值,不同的分类所对应的预设阈值不同;从所述热度图所包括的像素中,获取对应的像素值大于所述分类对应的预设阈值的像
素作为目标像素。7.根据权利要求6所述的方法,其特征在于,所述获取所述热度图所包括的目标像素,所述目标像素包括对应的像素值大于预设阈值之前还包括:获取多个分类各自对应的多个参考图像;获取当前分类对应的所述多个参考图像各自对应于多个参考阈值的热度区域,所述热度区域表征对应的参考图像中物体...

【专利技术属性】
技术研发人员:张有才李亚乾郭彦东
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1