System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 图像分类方法、电子设备及存储介质技术_技高网

图像分类方法、电子设备及存储介质技术

技术编号:41218323 阅读:4 留言:0更新日期:2024-05-09 23:39
本申请涉及图像处理,提供一种图像分类方法、电子设备及存储介质。所述方法包括:获取待分类图像,并获取多个分类模型,将每个分类模型的全局平均池化层替换为卷积层及平均池化层,得到多个目标模型,每个目标模型包括输入层、卷积层、平均池化层及分类层,对待分类图像进行分割,得到目标图像,将目标图像输入至每个输入层,生成多个目标特征图,根据多个目标特征图的尺寸生成多个目标数值,利用所述卷积层对每个目标特征图进行卷积操作,生成多个特征数值,基于平均池化层、多个特征数值及目标数值生成每个目标模型的目标向量,基于所述目标向量及对应的分类层生成待分类图像的分类结果。本申请能够降低图像分类过程中的算力消耗与设备功耗。

【技术实现步骤摘要】

本专利技术涉及图像处理领域,尤其涉及一种图像分类方法、电子设备及存储介质


技术介绍

1、在目前利用神经网络模型对图像进行分类的方案中,神经网络模型中的全局平均池化层的参数繁多、操作复杂,导致硬件加速器在执行图像分类的运算操作时所需内存大,造成较大的功耗。


技术实现思路

1、鉴于以上内容,有必要提供一种图像分类方法、电子设备及存储介质,能够解决图像分类过程算力消耗大且设备功耗大的问题。

2、本申请提供一种图像分类方法,所述图像分类方法包括:获取待分类图像,并获取多个分类模型,将每个分类模型的全局平均池化层替换为卷积层及平均池化层,得到多个目标模型,每个目标模型包括输入层、所述卷积层、所述平均池化层及分类层,对所述待分类图像进行图像分割,得到目标图像,将所述目标图像输入至每个输入层,生成多个目标特征图,根据每个目标特征图的尺寸生成目标数值,利用所述卷积层对所述多个目标特征图进行卷积操作,生成多个特征数值,基于所述平均池化层、所述多个特征数值及所述目标数值生成每个目标模型的目标向量,将所述目标向量输入到对应目标模型的分类层中,得到多个标注类别及相应的概率,根据所述多个标注类别及所述相应的概率确定所述待分类图像的分类结果。

3、根据本申请可选实施例,所述获取多个分类模型包括:获取训练图像,基于不同的卷积神经网络构建多个分类网络,基于所述训练图像对每个分类网络进行训练,得到所述多个分类模型。

4、根据本申请可选实施例,所述对所述待分类图像进行图像分割,得到目标图像包括:对所述待分类图像进行图像增强处理,得到增强图像,对所述增强图像进行二值化处理,得到二值化图像,根据所述二值化图像中像素点的像素值的差异确定出所述二值化图像中待分类对象的位置,基于所述待分类对象的位置,对所述二值化图像进行分割,得到目标区域,对所述目标区域的尺寸进行标准化处理,得到所述目标图像。

5、根据本申请可选实施例,每个目标特征图的长度及宽度相同,所述根据每个目标特征图的尺寸生成目标数值包括:若每个目标特征图的长度及宽度均包括因数,将每个目标特征图的长度进行因数分解,得到互不相同的多个分解长度值,并将每个目标特征图的宽度进行因数分解,得到互不相同的多个分解宽度值,对每个分解长度值与取值相同的分解宽度值进行相乘运算,得到多个所述目标数值,或者,若每个目标特征图的长度及宽度均不包括因数,将所述长度及所述宽度的相乘结果作为所述目标数值。

6、根据本申请可选实施例,所述利用所述卷积层对所述多个目标特征图进行卷积操作,生成多个特征数值包括:根据每个目标特征图的长度及宽度生成卷积核的大小,包括:若每个目标特征图的长度及宽度均包括因数,根据所述分解长度值及取值相同的分解宽度值确定所述卷积核的大小,或者,若每个目标特征图的长度及宽度均不包括因数,选取预设尺寸作为所述卷积核的大小,若所述长度及宽度与所述卷积核的大小之间不存在倍数关系,对每个目标特征图进行补零填充处理,直至填充处理后的目标特征图的长度及宽度为所述卷积核大小的倍数,从所述卷积核的大小中提取卷积步长,使用所述卷积核对每个填充处理后的目标特征图进行卷积操作,得到所述多个特征数值。

7、根据本申请可选实施例,所述基于所述平均池化层、所述多个特征数值及所述目标数值生成每个目标模型的目标向量包括:根据所述目标数值的数量生成与每个特征数值对应的像素平均值,包括:若所述目标数值的数量为单个,计算每个特征数值与所述目标数值的比值,得到每个特征数值对应的像素平均值;或者,若所述目标数值的数量为多个,计算每个特征数值与第一个目标数值的第一比值,并计算所述第一比值与第二个目标数值的第二比值,重复运算,直至获得与最后一个目标数值对应的最终比值,将所述最终比值作为所述特征数值对应的像素平均值,拼接多个所述像素平均值,得到所述目标向量。

8、根据本申请可选实施例,所述根据所述多个标注类别及所述相应的概率确定所述待分类图像的分类结果包括:计算所述多个目标模型中同一标注类别的概率平均值,将最大的概率平均值所对应的标注类别确定为所述待分类图像的分类结果。

9、根据本申请可选实施例,所述计算所述多个目标模型中同一标注类别的概率平均值包括:计算所述多个分类模型的类别数量,统计所述多个分类模型所输出的每个标注类别的概率之和,得到概率总和,计算所述概率总和与所述类别数量的比值,得到所述概率平均值。

10、本申请提供一种电子设备,所述电子设备包括:

11、存储器,存储至少一个指令;及处理器,执行所述至少一个指令以实现所述的图像分类方法。

12、本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现所述的图像分类方法。

13、由以上技术方案可以看出,将所述待分类图像进行分割后得到目标图像,将所述目标图像输入到每个分类模型中,由于所述目标图像的面积减小了,所以能够减少特征提取的范围,从而加快特征提取的速度,将所述全局平均池化层替换为卷积层及平均池化层,不仅能够减少分类模型中的参数数量,还能够减少硬件加速器中全局平均池化功能的设计,进而节约了硬件资源及减少功率损耗,根据每个第二特征图的尺寸生成多个目标数值,能够将所述尺寸分解为数值更小的多个目标数值,从而能够提高每次运算的速度,基于所述平均池化层、所述多个特征数值及所述目标数值生成目标向量,利用所述平均池化层的相除运算计算出每个目标特征图的像素平均值,并将多个所述像素平均值拼接为所述目标向量,将所述目标向量输入到对应的分类层,得到每个目标模型输出的多个标注类别的概率,能够获取所述多个目标模型对所述待分类图像的分类结果,使得所述分类结果更加全面及准确。

本文档来自技高网...

【技术保护点】

1.一种图像分类方法,其特征在于,所述图像分类方法包括:

2.如权利要求1所述的图像分类方法,其特征在于,所述获取多个分类模型包括:

3.如权利要求1所述的图像分类方法,其特征在于,所述对所述待分类图像进行图像分割,得到目标图像包括:

4.如权利要求1所述的图像分类方法,其特征在于,每个目标特征图的长度及宽度相同,所述根据每个目标特征图的尺寸生成目标数值包括:

5.如权利要求4所述的图像分类方法,其特征在于,所述利用所述卷积层对所述多个目标特征图进行卷积操作,生成多个特征数值包括:

6.如权利要求1所述的图像分类方法,其特征在于,所述基于所述平均池化层、所述多个特征数值及所述目标数值生成每个目标模型的目标向量包括:

7.如权利要求1所述的图像分类方法,其特征在于,所述根据所述多个标注类别及所述相应的概率确定所述待分类图像的分类结果包括:

8.如权利要求7所述的图像分类方法,其特征在于,所述计算所述多个目标模型中同一标注类别的概率平均值包括:

9.一种电子设备,其特征在于,所述电子设备包括:

10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现如权利要求1至8中任意一项所述的图像分类方法。

...

【技术特征摘要】

1.一种图像分类方法,其特征在于,所述图像分类方法包括:

2.如权利要求1所述的图像分类方法,其特征在于,所述获取多个分类模型包括:

3.如权利要求1所述的图像分类方法,其特征在于,所述对所述待分类图像进行图像分割,得到目标图像包括:

4.如权利要求1所述的图像分类方法,其特征在于,每个目标特征图的长度及宽度相同,所述根据每个目标特征图的尺寸生成目标数值包括:

5.如权利要求4所述的图像分类方法,其特征在于,所述利用所述卷积层对所述多个目标特征图进行卷积操作,生成多个特征数值包括:

6.如权利要求1所述的图像分类方法,其特征在于,...

【专利技术属性】
技术研发人员:颜健武
申请(专利权)人:鸿海精密工业股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1