基于双级注意力的图像识别方法及装置制造方法及图纸

技术编号：33208187 阅读：21 留言：0更新日期：2022-04-24 00:58

本发明专利技术是关于一种基于双级注意力的图像识别方法和装置，其中，方法包括：获取原始图像和对应的二值目标定位图，并对所述原始图像进行预处理，将所述二值目标定位图缩放为预设尺寸；从预处理后的原始图像中提取抽象特征图；根据所述二值目标定位图和抽象特征，计算得到物体特征图和背景特征图；使用空间注意力机制处理所述物体特征图，以得到新的物体特征图；使用通道注意力机制处理所述新的物体特征图和背景特征图融合后的总特征图，以得到新的总特征图；使用全连接层计算所述新的总特征图的特征映射向量，并通过分类器确定分类结果。通过该技术方案，提高网络训练效率，提升预测的准确率。准确率。准确率。

全部详细技术资料下载

【技术实现步骤摘要】
基于双级注意力的图像识别方法及装置

[0001]本专利技术涉及图像识别
，尤其涉及一种基于双级注意力的图像识别方法和装置。

技术介绍

[0002]图像分类是根据图像中的目标的语义信息，判断目标所属的类别的工作，是计算机视觉领域中的重要研究方向。在实际应用的各个领域中，图像分类都有重要的作用，例如生物识别技术中的人脸识别，自动驾驶技术中的交通场景识别，临床医学领域中的医学图像识别等。
[0003]目前，深度学习方法在图像分类工作中得到了广泛的应用。卷积神经网络能高效地识别图片的语义信息，判断图片中物体所属的分类。一般来说，位于目标区域的像素点能提供较多的有利于识别语义的特征信息，而背景像素点能提供的特征信息相对较少。但目前的方法通常对图片全图进行同等的特征提取，不考虑物体与背景的差异性，降低了模型的训练效率。此外，也有通过裁剪背景等方式，只对目标进行特征提取的方法，但这些方法完全舍弃了背景信息，使模型提取到的可用特征信息减少，降低了分类器的准确率。

技术实现思路

[0004]为克服相关技术中存在的问题，本专利技术提供一种基于双级注意力的图像识别方法和装置，从而实现保留背景信息的同时，提高网络训练效率，提升预测的准确率。
[0005]根据本专利技术实施例的第一方面，提供一种基于双级注意力的图像识别方法，所述方法包括：获取原始图像和对应的二值目标定位图，并对所述原始图像进行预处理，将所述二值目标定位图缩放为预设尺寸；从预处理后的原始图像中提取抽象特征图；根据所述二值目标定位图和抽象特征...

【技术保护点】

【技术特征摘要】
1.一种基于双级注意力的图像识别方法，其特征在于，所述方法包括：获取原始图像和对应的二值目标定位图，并对所述原始图像进行预处理，将所述二值目标定位图缩放为预设尺寸；从预处理后的原始图像中提取抽象特征图；根据所述二值目标定位图和抽象特征，计算得到物体特征图和背景特征图；使用空间注意力机制处理所述物体特征图，以得到新的物体特征图；使用通道注意力机制处理所述新的物体特征图和背景特征图融合后的总特征图，以得到新的总特征图；使用全连接层计算所述新的总特征图的特征映射向量，并通过分类器确定分类结果。2.根据权利要求1所述的方法，其特征在于，根据所述二值目标定位图和抽象特征图，计算得到物体特征图和背景特征图，包括：使用所述二值目标定位图计算分别得到用于物体的掩膜和用于背景的掩膜；将用于物体的掩膜和用于背景的掩膜分别与所述抽象特征图融合后进行对应的卷积计算，以得到所述物体特征图和背景特征图。3.根据权利要求1所述的方法，其特征在于，使用空间注意力机制处理所述物体特征图，以得到新的物体特征图，包括：使用空间注意力机制计算空间像素权重分布；将所述空间像素权重分布与所述物体特征图进行逐元素相乘计算，以得到更新物体像素权重的新的物体特征图。4.根据权利要求1所述的方法，其特征在于，使用通道注意力机制处理所述新的物体特征图和背景特征图融合后的总特征图，以得到新的总特征图，包括：将所述新的物体特征图和背景特征图融合，以得到所述总特征图；使用通道注意力机制计算通道权重向量；将所述通道权重向量与所述总特征图进行逐元素相乘计算，以得到所述新的总特征图。5.根据权利要求1所述的方法，其特征在于，使用全连接层计算所述新的总特征图的特征映射向量，并通过分类器确定分类结果，包括：使用全连接层计算所述新的总特征图的特征映射向量；通过所述分类器确定所述特征映射向量对应的概率分布；将最大概率对应的类别确定为所述原始图像所属的图像类别。6.一种基于双级注意力的图像识别...

【专利技术属性】
技术研发人员：张凯，徐卿，袭肖明，杨光远，
申请(专利权)人：山东力聚机器人科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人