【技术实现步骤摘要】
图像识别方法、装置以及电子设备
[0001]本申请涉及计算机
,更具体地,涉及一种图像识别方法、装置以及电子设备。
技术介绍
[0002]随着技术的发展,可以通过神经网络模型来对图像中的内容进行分类识别。例如,可以通过神经网络模型识别出图像中的人物以及动物等物体,并且,还可以标注出所识别物体的位置。其中,能够用于进行分类识别的神经网络模型需要先通过训练数据进行训练。但是,相关的神经网络模型的训练成本和识别效率都有待优化。
技术实现思路
[0003]鉴于上述问题,本申请提出了一种图像识别方法、装置以及电子设备,以改善上述问题。
[0004]第一方面,本申请提供了一种图像识别方法,所述方法包括:获取待识别图像的特征信息;基于注意力机制模型获取与所述特征信息对应的分类向量,所述注意力机制模型用于根据特征信息得到对应的分类向量;基于所述分类向量,得到所述待识别图像所包括的物体对应的热度图;根据所述热度图获取所述热度图对应的物体在所述待识别图像中的位置信息,所述位置信息用于在所述待识别图像中对所述物体进行 ...
【技术保护点】
【技术特征摘要】
1.一种图像识别方法,其特征在于,所述方法包括:获取待识别图像的特征信息;基于注意力机制模型获取与所述特征信息对应的分类向量,所述注意力机制模型用于根据特征信息得到对应的分类向量;基于所述分类向量,得到所述待识别图像所包括的物体对应的热度图;根据所述热度图获取所述热度图对应的物体在所述待识别图像中的位置信息,所述位置信息用于在所述待识别图像中对所述物体进行标注。2.根据权利要求1所述的方法,其特征在于,所述注意力机制模型包括自注意力机制模块和交叉注意力机制模块,所述特征信息包括所述待识别图像对应的特征图和标签向量,所述基于注意力机制模型获取与所述特征信息对应的分类向量,包括:基于所述自注意力机制模块对所述标签向量进行处理,得到第一处理结果;基于所述交叉注意力机制模块对第一处理结果和所述特征图进行处理,得到第二处理结果;通过全连接层对所述第二处理结果进行处理,得到分类向量。3.根据权利要求1所述的方法,其特征在于,所述基于所述分类向量,得到所述待识别图像所包括的物体对应的热度图,包括:根据所述分类向量得到对应的指定长宽比的热度图;对所述指定长宽比的热度图的尺寸进行调整,将调整后的图像作为物体对应的热度图,其中,调整后的图像的尺寸与所述待识别图像的尺寸相同。4.根据权利要求1所述的方法,其特征在于,所述根据所述热度图获取所述热度图对应的物体在所述待识别图像中的位置信息,包括:获取所述热度图所包括的目标像素,所述目标像素包括对应的像素值大于预设阈值的像素;基于所述目标像素的位置和像素值得到热度图对应物体的位置信息。5.根据权利要求4所述的方法,其特征在于,所述目标像素的位置包括目标像素所在坐标区域的横坐标以及纵坐标,所述物体的位置信息包括物体的中心位置的横坐标、中心位置的纵坐标、宽度以及高度,所述基于所述目标像素的位置和像素值得到热度图对应物体的位置信息,包括:基于目标像素的像素值以及所述横坐标得到热度图对应物体的中心位置的横坐标;基于目标像素的像素值以及所述纵坐标得到热度图对应物体的中心位置的纵坐标;基于所述目标像素的像素值、目标像素的横坐标以及所述中心位置的横坐标,得到热度图对应物体的宽度;基于所述目标像素的像素值、目标像素的纵坐标以及所述中心位置的纵坐标,得到热度图对应物体的高度。6.根据权利要求4所述的方法,其特征在于,所述获取所述热度图所包括的目标像素,所述目标像素包括对应的像素值大于预设阈值的像素包括:获取所述热度图对应物体的分类;获取所述分类对应的预设阈值,不同的分类所对应的预设阈值不同;从所述热度图所包括的像素中,获取对应的像素值大于所述分类对应的预设阈值的像
素作为目标像素。7.根据权利要求6所述的方法,其特征在于,所述获取所述热度图所包括的目标像素,所述目标像素包括对应的像素值大于预设阈值之前还包括:获取多个分类各自对应的多个参考图像;获取当前分类对应的所述多个参考图像各自对应于多个参考阈值的热度区域,所述热度区域表征对应的参考图像中物体...
【专利技术属性】
技术研发人员:张有才,李亚乾,郭彦东,
申请(专利权)人:OPPO广东移动通信有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。