图像分类方法、装置、电子设备、介质和产品制造方法及图纸

技术编号：37714194 阅读：9 留言：0更新日期：2023-06-02 00:09

本公开提供了一种图像分类方法、装置、电子设备、介质和产品，涉及人工智能技术领域，具体涉及计算机视觉、图像处理和深度学习等技术领域。具体实现方案为：获取待分类图像；对所述待分类图像进行特征提取，得到目标特征信息，目标特征信息包括第一特征向量和第二特征向量，所述第一特征向量为基于待分类图像的特征图生成的特征向量；所述第二特征向量为基于所述特征图对应的健值特征、所述特征图对应的值特征、以及预先获取的初始查询特征，生成的特征向量；基于所述第一特征向量生成第一分类信息，以及，基于所述第二特征向量生成第二分类信息；基于所述第一分类信息和第二分类信息，确定目标分类类别。本公开可以提高图像分类结果的准确性。果的准确性。果的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
图像分类方法、装置、电子设备、介质和产品

[0001]本公开涉及人工智能
，具体涉及计算机视觉、图像处理和深度学习等
具体涉及一种图像分类方法、装置、电子设备、介质和产品。

技术介绍

[0002]在计算机视觉领域，卷积神经网络(Convolutional Neural Networks，CNN)是主流的模型结构，CNN主要应用于图像分类、检测和分割等任务中。为了提高CNN的图像处理效果，相关技术中主要采用的手段是增加CNN的宽度、深度或者输入图像分辨率。

技术实现思路

[0003]本公开提供了一种图像分类方法、装置、电子设备、介质和产品。
[0004]根据本公开的第一方面，提供了一种图像分类方法，包括：
[0005]获取待分类图像；
[0006]对所述待分类图像进行特征提取，得到目标特征信息，其中，所述目标特征信息包括第一特征向量和第二特征向量，所述第一特征向量为基于所述待分类图像的特征图生成的特征向量；所述第二特征向量为基于所述特征图对应的健值特征、所述特征图对应的值特征、以及预先获取的初始查询特征，生成的特征向量；
[0007]基于所述第一特征向量生成第一分类信息，以及，基于所述第二特征向量生成第二分类信息，其中，所述第一分类信息用于表征所述待分类图像的分类类别，所述第二分类信息用于表征所述待分类图像的分类类别；
[0008]基于所述第一分类信息和所述第二分类信息，确定目标分类类别。
[0009]根据本公开的第二方面，提供了一种图像分类...

【技术保护点】

【技术特征摘要】
1.一种图像分类方法，包括：获取待分类图像；对所述待分类图像进行特征提取，得到目标特征信息，其中，所述目标特征信息包括第一特征向量和第二特征向量，所述第一特征向量为基于所述待分类图像的特征图生成的特征向量；所述第二特征向量为基于所述特征图对应的健值特征、所述特征图对应的值特征、以及预先获取的初始查询特征，生成的特征向量；基于所述第一特征向量生成第一分类信息，以及，基于所述第二特征向量生成第二分类信息，其中，所述第一分类信息用于表征所述待分类图像的分类类别，所述第二分类信息用于表征所述待分类图像的分类类别；基于所述第一分类信息和所述第二分类信息，确定目标分类类别。2.根据权利要求1所述的方法，其中，所述对所述待分类图像进行特征提取，得到目标特征信息，包括：基于图像分类模型对所述待分类图像进行s次迭代特征处理，得到所述目标特征信息，所述图像分类模型包括s个依次连接的特征处理层，一个特征处理层包括一个特征提取模块和一个特征处理模块，所述特征提取模块用于提取所接收到的图像中的特征，以输出所述特征图，所述特征处理模块用于基于所述特征图对应的健值特征、所述特征图对应的值特征和所述初始查询特征，对所述初始查询特征进行更新，所述s个依次连接的特征处理层与所述s次迭代特征处理一一对应，所述s为大于1的整数。3.根据权利要求2所述的方法，其中，所述基于图像分类模型对所述待分类图像进行s次迭代特征处理，得到所述目标特征信息，包括：将第i个图像输入第i个特征处理层的特征提取模块进行特征提取，得到第i个特征图，其中，所述i为大于0且小于或等于所述s的整数；基于所述第i个特征处理层的特征处理模块利用所述第i个特征图，生成第i个健值特征和第i个值特征；基于所述第i个特征处理层的特征处理模块利用所述第i个健值特征、所述第i个值特征和第i个查询特征、对所述第i个查询特征进行更新，得到第i+1个查询特征；其中，在所述i等于1的情况下，所述第i个图像为所述待分类图像，所述第i个查询特征为所述初始查询特征；在所述i大于1的情况下，所述第i个图像为第i
‑
1个特征图；所述第一特征向量为基于第s个特征图生成的特征向量，所述第二特征向量包括所述第s个特征处理层的特征处理模块输出的第s+1个查询特征。4.根据权利要求3所述的方法，其中，所述基于所述第i个特征处理层的特征处理模块利用所述第i个健值特征、所述第i个值特征和第i个查询特征、对所述第i个查询特征进行更新，得到第i+1个查询特征，包括：基于所述第i个特征处理层的特征处理模块利用注意力机制对所述第i个健值特征和所述第i个查询特征进行处理，得到第i个注意力矩阵；基于所述第i个特征处理层的特征处理模块对所述第i个值特征和所述第i个注意力矩阵进行聚合处理，得到所述第i+1个查询特征。5.根据权利要求3所述的方法，其中，所述基于所述第i个特征处理层的特征处理模块
利用所述第i个特征图，生成第i个健值特征和第i个值特征，包括：基于所述第i个特征处理层的特征处理模块利用第一投影矩阵对所述第i个特征图进行线性投影，得到所述第i个健值特征，以及，基于所述第i个特征处理层的特征处理模块利用第二投影矩阵对所述第i个特征图进行线性投影，得到所述第i个值特征，所述第一投影矩阵和所述第二投影矩阵为不同的矩阵。6.根据权利要求1所述的方法，其中，所述第一特征向量包括m个维度的特征，所述第二特征向量包括d个维度的特征，所述基于所述第一特征向量生成第一分类信息，以及，基于所述第二特征向量生成第二分类信息，包括：确定第一分类矩阵和第二分类矩阵，其中，所述第一分类矩阵为n
×
m的分类矩阵，所述第二分类矩阵为n
×
d的分类矩阵；基于所述第一分类矩阵和所述第一特征向量生成所述第一分类信息，以及，基于所述第二分类矩阵和所述第二特征向量生成所述第二分类信息。7.根据权利要求1所述的方法，其中，所述基于所述第一分类信息和所述第二分类信息，确定目标分类类别，包括：对所述第一分类信息和所述第二分类信息进行加权求和，得到目标分类信息，所述目标分类信息包括n个概率值，所述n个概率值与预设的n个分类类别一一对应；将所述n个概率值中，最大的概率值所对应的分类类别确定为所述目标分类类别。8.一种图像分类装置，包括：获取模块，用于获取待分类图像；特征提取模块，用于对所述待分类图像进行特征提取，得到目标特征信息，其中，所述目标特征信息包括第一特征向量和第二特征向量，所述第一特征向量为基于所述待分类图像的特征图...

【专利技术属性】
技术研发人员：尉德利，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人