图像识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号：38814194 阅读：13 留言：0更新日期：2023-09-15 19:53

本发明专利技术提供一种图像识别方法、装置、电子设备和存储介质，涉及图像识别技术领域，该方法包括：获取待识别图像；将待识别图像输入改进的Transformer网络，得到改进的Transformer网络输出的图像识别结果；改进的Transformer网络是基于带有图像识别结果标签的样本图像训练得到的；改进的Transformer网络用于对输入图像的原始特征图进行空间重组，得到至少三个重组特征图，并基于至少三个重组特征图进行自注意力计算；其中，每个重组特征图内都划分多个小组，自注意力计算在每个小组内进行。从而可以显著降低网络的计算量，提高图像识别的效率，降低图像识别的显存占用。降低图像识别的显存占用。降低图像识别的显存占用。

全部详细技术资料下载

【技术实现步骤摘要】
图像识别方法、装置、电子设备和存储介质

[0001]本专利技术涉及图像识别
，尤其涉及一种图像识别方法、装置、电子设备和存储介质。

技术介绍

[0002]图像识别旨在识别图像中所包含物体的类别。其难点在于如何设计高效的神经网络，在降低计算量的同时，获得更好的分类效果。
[0003]由于Transformer网络结构具有全局视野的优势，逐渐成为了图像识别领域的主流网络结构。但是，现有的Transformer网络包含大量自注意力操作，存在计算量大、速度慢、显存占用高等问题。

技术实现思路

[0004]针对现有技术存在的问题，本专利技术提供一种图像识别方法、装置、电子设备和存储介质。
[0005]第一方面，本专利技术提供一种图像识别方法，包括：
[0006]获取待识别图像；
[0007]将所述待识别图像输入改进的Transformer网络，得到所述改进的Transformer网络输出的图像识别结果；
[0008]所述改进的Transformer网络是基于带有图像识别结果标签的样本图像训练得到的；
[0009]所述改进的Transformer网络用于对输入图像的原始特征图进行空间重组，得到至少三个重组特征图，并基于所述至少三个重组特征图进行自注意力计算；其中，每个所述重组特征图内都划分多个小组，自注意力计算在每个所述小组内进行。
[0010]可选地，所述改进的Transformer网络包括空间重组模块、自注意力模块和分类模块；
[0011]...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法，其特征在于，包括：获取待识别图像；将所述待识别图像输入改进的Transformer网络，得到所述改进的Transformer网络输出的图像识别结果；所述改进的Transformer网络是基于带有图像识别结果标签的样本图像训练得到的；所述改进的Transformer网络用于对输入图像的原始特征图进行空间重组，得到至少三个重组特征图，并基于所述至少三个重组特征图进行自注意力计算；其中，每个所述重组特征图内都划分多个小组，自注意力计算在每个所述小组内进行。2.根据权利要求1所述的图像识别方法，其特征在于，所述改进的Transformer网络包括空间重组模块、自注意力模块和分类模块；所述空间重组模块用于对输入图像的原始特征图进行空间重组，得到至少三个重组特征图；所述自注意力模块包括多个串联的Transformer层，每个所述Transformer层用于对一个所述重组特征图进行自注意力计算；所述分类模块用于基于最后一个所述Transformer层输出的特征图，输出图像识别结果。3.根据权利要求1或2所述的图像识别方法，其特征在于，所述对输入图像的原始特征图进行空间重组，得到至少三个重组特征图，包括：对所述原始特征图进行空间重组，得到第一特征图和第二特征图，所述第一特征图内划分多个组分辨率为K*K的小组，所述第二特征图内划分多个组分辨率为S*S的小组；其中，所述K为大于或等于2的整数，所述S等于所述原始特征图的宽或高与所述K的比值；在所述第二特征图的每个小组内进行空间重组，得到第三特征图和第四特征图，所述第三特征图内划分多个组分辨率为L*L的小组，所述第四特征图内划分多个组分辨率为T*T的小组；其中，所述L为大于或等于2、且小于S的整数，所述T等于S/L；将所述第一特征图、所述第三特征图和所述第四特征图确定为所述重组特征图。4.根据权利要求3所述的图像识别方法，其特征在于，所述对所述原始特征图进行空间重组，得到第一特征图和第二特征图，包括：在所述原始特征图内划分多个组分辨率为K*K的小组，得到第一特征图，并从所述原始特征图中，每间隔K
‑
1个位置取一个特征，S*S个特征组成一个小组，多个组分辨率为S*S的小组构成第二特征图。5.根据权利要求3所述的图像识别方法，其特征在于，...

【专利技术属性】
技术研发人员：朱宽，郭海云，王金桥，唐明，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人