【技术实现步骤摘要】
一种图像分类方法、装置、电子设备及介质
[0001]本申请涉及计算机
,具体而言,涉及一种图像分类方法、装置、电子设备及介质。
技术介绍
[0002]基于深度学习的图像分类技术,一般采用基于卷积神经网络的多层网络提取图像特征,在输出层使用全连接网络实现图像特征到分类标签的转换。训练数据一般采用固定大小的图像(如224x224x3),标注数据为全图分类标签(一个标量或多个标量)。预测阶段,需要将输入图片的尺寸缩放至固定大小(等于训练图片的尺寸),经过图像分类模型推理后得到分类标签。对于大分辨率图片,也可以按照训练图片的尺寸作为窗口,在原始的输入图片上进行滑动采样,得到一系列固定尺寸的小图片经模型推理得到一组分类值,在后处理中根据分类结果的分布与阈值进行全图分类的综合判定。
[0003]在现有技术中,图像分类模型训练过程使用的是小分辨率图片(224x224), 而实际预测时,面对大分辨率图像,对其中的小物体的识别与分类效果较差。若对图像直接进行缩放,图中的局部特征容易丢失或尺度过小无法识别;如果对输入图像做滑动窗口 ...
【技术保护点】
【技术特征摘要】
1.一种图像分类方法,其特征在于,所述方法包括:将目标图像输入至训练好的图像分类模型,通过所述图像分类模型,将所述目标图像进行缩放,得到目标图像的多个不同尺寸的图像;将多个不同尺寸的图像拼接为一个多尺度图像,提取出所述多尺度图像的原始图像特征张量;所述多尺度图像中包括多个不同尺寸图像的图像数据;在空间维度上展平所述多尺度图像的原始图像特征张量,得到目标图像的多尺度图像特征张量;所述多尺度图像特征张量包括目标图像多个不同尺寸图像的图像特征,所述多尺度图像特征张量的空间维度为一维;根据所述多尺度图像特征张量,识别出目标图像中每个目标物体的类别,并输出目标图像中每个目标物体的类别。2.根据权利要求1所述的图像分类方法,其特征在于,在空间维度上展平所述多尺度图像的原始图像特征张量,得到目标图像的多尺度图像特征张量,包括:保持原始图像特征张量的通道维不变,按照任一空间维度分离原始图像特征张量,得到多尺度图像的特征张量分量;将多尺度图像的特征张量分量拼接为目标图像的、扁平化的多尺度图像特征张量。3.根据权利要求1所述的图像分类方法,其特征在于,根据所述多尺度图像特征张量,识别出目标图像中每个目标物体的类别,包括:通过所述图像分类模型中的多头注意力单元,提取所述多尺度图像特征张量中多个不同尺寸图像的图像特征之间的注意力关系特征;根据提取出的注意力关系特征,识别出目标图像中每个目标物体的类别。4.根据权利要求1所述的图像分类方法,其特征在于,所述图像分类模型,是通过以下训练方法训练得到的:通过样本图像中的局部图块对图像分类模型中的全卷积网络进行第一阶段训练,直至所述图像分类模型中的全卷积网络满足第一训练完成条件;所述局部图块中包括目标样本物体;通过样本图像对图像分类模型进行第二阶段训练,直至所述图像分类模型满足第二训练完成条件。5.根据权利要求4所述的图像分类方法,其特征在于,通过样本大图中的局部图块对图像分类模型中的全卷积网络进行第一阶段训练之前,所述训练方法还包括:针对样本图像上的目标样本物体,使用标注框进行区域标注;其中每个标注框携带目标样本物体的类别标签;根据所述标注框,提取出样本大图中的局部图块。6.根据权利要求5所述的图像分类方法,其特征在于,根据所述标注框,提取出样本大图中的局部图块,包括:按照多...
【专利技术属性】
技术研发人员:张博,潘霖,卞豪,李海峰,
申请(专利权)人:北京匠数科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。