【技术实现步骤摘要】
图像分类方法、装置、电子设备、介质和产品
[0001]本公开涉及人工智能
,具体涉及计算机视觉、图像处理和深度学习等
具体涉及一种图像分类方法、装置、电子设备、介质和产品。
技术介绍
[0002]在计算机视觉领域,卷积神经网络(Convolutional Neural Networks,CNN)是主流的模型结构,CNN主要应用于图像分类、检测和分割等任务中。为了提高CNN的图像处理效果,相关技术中主要采用的手段是增加CNN的宽度、深度或者输入图像分辨率。
技术实现思路
[0003]本公开提供了一种图像分类方法、装置、电子设备、介质和产品。
[0004]根据本公开的第一方面,提供了一种图像分类方法,包括:
[0005]获取待分类图像;
[0006]对所述待分类图像进行特征提取,得到目标特征信息,其中,所述目标特征信息包括第一特征向量和第二特征向量,所述第一特征向量为基于所述待分类图像的特征图生成的特征向量;所述第二特征向量为基于所述特征图对应的健值特征、所述特征图对应的值特征、以及预先获取的初始查询特征,生成的特征向量;
[0007]基于所述第一特征向量生成第一分类信息,以及,基于所述第二特征向量生成第二分类信息,其中,所述第一分类信息用于表征所述待分类图像的分类类别,所述第二分类信息用于表征所述待分类图像的分类类别;
[0008]基于所述第一分类信息和所述第二分类信息,确定目标分类类别。
[0009]根据本公开的第二方面,提供了一种图像分类 ...
【技术保护点】
【技术特征摘要】
1.一种图像分类方法,包括:获取待分类图像;对所述待分类图像进行特征提取,得到目标特征信息,其中,所述目标特征信息包括第一特征向量和第二特征向量,所述第一特征向量为基于所述待分类图像的特征图生成的特征向量;所述第二特征向量为基于所述特征图对应的健值特征、所述特征图对应的值特征、以及预先获取的初始查询特征,生成的特征向量;基于所述第一特征向量生成第一分类信息,以及,基于所述第二特征向量生成第二分类信息,其中,所述第一分类信息用于表征所述待分类图像的分类类别,所述第二分类信息用于表征所述待分类图像的分类类别;基于所述第一分类信息和所述第二分类信息,确定目标分类类别。2.根据权利要求1所述的方法,其中,所述对所述待分类图像进行特征提取,得到目标特征信息,包括:基于图像分类模型对所述待分类图像进行s次迭代特征处理,得到所述目标特征信息,所述图像分类模型包括s个依次连接的特征处理层,一个特征处理层包括一个特征提取模块和一个特征处理模块,所述特征提取模块用于提取所接收到的图像中的特征,以输出所述特征图,所述特征处理模块用于基于所述特征图对应的健值特征、所述特征图对应的值特征和所述初始查询特征,对所述初始查询特征进行更新,所述s个依次连接的特征处理层与所述s次迭代特征处理一一对应,所述s为大于1的整数。3.根据权利要求2所述的方法,其中,所述基于图像分类模型对所述待分类图像进行s次迭代特征处理,得到所述目标特征信息,包括:将第i个图像输入第i个特征处理层的特征提取模块进行特征提取,得到第i个特征图,其中,所述i为大于0且小于或等于所述s的整数;基于所述第i个特征处理层的特征处理模块利用所述第i个特征图,生成第i个健值特征和第i个值特征;基于所述第i个特征处理层的特征处理模块利用所述第i个健值特征、所述第i个值特征和第i个查询特征、对所述第i个查询特征进行更新,得到第i+1个查询特征;其中,在所述i等于1的情况下,所述第i个图像为所述待分类图像,所述第i个查询特征为所述初始查询特征;在所述i大于1的情况下,所述第i个图像为第i
‑
1个特征图;所述第一特征向量为基于第s个特征图生成的特征向量,所述第二特征向量包括所述第s个特征处理层的特征处理模块输出的第s+1个查询特征。4.根据权利要求3所述的方法,其中,所述基于所述第i个特征处理层的特征处理模块利用所述第i个健值特征、所述第i个值特征和第i个查询特征、对所述第i个查询特征进行更新,得到第i+1个查询特征,包括:基于所述第i个特征处理层的特征处理模块利用注意力机制对所述第i个健值特征和所述第i个查询特征进行处理,得到第i个注意力矩阵;基于所述第i个特征处理层的特征处理模块对所述第i个值特征和所述第i个注意力矩阵进行聚合处理,得到所述第i+1个查询特征。5.根据权利要求3所述的方法,其中,所述基于所述第i个特征处理层的特征处理模块
利用所述第i个特征图,生成第i个健值特征和第i个值特征,包括:基于所述第i个特征处理层的特征处理模块利用第一投影矩阵对所述第i个特征图进行线性投影,得到所述第i个健值特征,以及,基于所述第i个特征处理层的特征处理模块利用第二投影矩阵对所述第i个特征图进行线性投影,得到所述第i个值特征,所述第一投影矩阵和所述第二投影矩阵为不同的矩阵。6.根据权利要求1所述的方法,其中,所述第一特征向量包括m个维度的特征,所述第二特征向量包括d个维度的特征,所述基于所述第一特征向量生成第一分类信息,以及,基于所述第二特征向量生成第二分类信息,包括:确定第一分类矩阵和第二分类矩阵,其中,所述第一分类矩阵为n
×
m的分类矩阵,所述第二分类矩阵为n
×
d的分类矩阵;基于所述第一分类矩阵和所述第一特征向量生成所述第一分类信息,以及,基于所述第二分类矩阵和所述第二特征向量生成所述第二分类信息。7.根据权利要求1所述的方法,其中,所述基于所述第一分类信息和所述第二分类信息,确定目标分类类别,包括:对所述第一分类信息和所述第二分类信息进行加权求和,得到目标分类信息,所述目标分类信息包括n个概率值,所述n个概率值与预设的n个分类类别一一对应;将所述n个概率值中,最大的概率值所对应的分类类别确定为所述目标分类类别。8.一种图像分类装置,包括:获取模块,用于获取待分类图像;特征提取模块,用于对所述待分类图像进行特征提取,得到目标特征信息,其中,所述目标特征信息包括第一特征向量和第二特征向量,所述第一特征向量为基于所述待分类图像的特征图...
【专利技术属性】
技术研发人员:尉德利,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。