多类别图像的分类方法、装置、终端设备和存储介质制造方法及图纸

技术编号:28059376 阅读:21 留言:0更新日期:2021-04-14 13:34
本申请提供了一种多类别图像的分类方法、装置、终端设备和存储介质,其方法包括获取待分类图像;将待分类图像输入至预先训练的图像分类模型,输出待分类图像的类别概率值;图像分类模型是采用标记有类别信息的图像样本对改进的卷积神经网络进行训练得到的,改进的卷积神经网络包括Focus结构、Efficient网络、卷积层的注意力模块、全局池化层和全连接层;根据类别概率值确定待分类图像的类别。本申请的方法采用改进的卷积神经网络模型,该模型以Efficient网络为骨架,具有较小的参数规模和快速的推理速度,且该模型采用Focus结构和卷积层的注意力模块,进一步减少了计算量和增加了准确性。了准确性。了准确性。

【技术实现步骤摘要】
多类别图像的分类方法、装置、终端设备和存储介质


[0001]本申请涉及图像分类
,具体涉及一种多类别图像的分类方法、终端设备和计算机可读存储介质。

技术介绍

[0002]在自然场景下,一个图像(例如一张图片)往往同时属于多个类别(例如一张图片上既有山也有树),而在使用时需要确定该图片到底属于山这一景物图像,还是属于树这一景物图像,即需要对多标签图片进行分类。
[0003]目前,通常采用神经网络模型来对多类别图像进行分类,但该方法模型训练过程参数规模大,训练复杂,并且抛弃了特征图中值为负数部分的图片信息,进而对分类准确度产生影响。
[0004]申请内容
[0005]有鉴于此,本申请实施例中提供了一种多类别图像的分类方法、终端设备和计算机可读存储介质,以克服现有技术中采用神经网络模型来对多类别图像进行分类,模型训练过程参数规模大,训练复杂,并且抛弃了特征图中值为负数部分的图片信息,进而对分类准确度产生影响的问题。
[0006]第一方面,本申请实施例提供了一种多类别图像的分类方法,该方法包括:
[0007本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多类别图像的分类方法,其特征在于,所述方法包括:获取待分类图像;将所述待分类图像输入至预先训练的图像分类模型,输出所述待分类图像的类别概率值;其中,所述图像分类模型是采用标记有类别信息的图像样本对改进的卷积神经网络进行训练得到的,所述改进的卷积神经网络包括Focus结构、Efficient网络、卷积层的注意力模块、全局池化层和全连接层;根据所述类别概率值确定所述待分类图像的类别。2.根据权利要求1所述的方法,其特征在于;所述图像分类模型的训练方法,包括:获取图像样本,采用类别信息对所述图像样本进行标记,得到标记有类别信息的图像样本;将所述标记有类别信息的图像样本输入所述Focus结构进行降维处理;将降维处理后的图像样本输入所述Efficient网络进行特征提取,得到初始特征图;将所述初始特征图输入所述卷积层的注意力模块进行特征提取,得到最终特征图;将所述最终特征图分别依次输入所述全局池化层和全连接层,输出实际分类结果;对所述改进的卷积神经网络的权重进行调整,直至实际分类结果与目标分类结果的偏差在容许范围内时,训练完成,得到所述图像分类模型。3.根据权利要求2所述的方法,其特征在于,所述Efficient网络为Efficient

B0网络,所述Efficient

B0网络包括多个MBConv卷积模块;在将降维处理后的图像样本输入所述Efficient网络进行特征提取,得到初始特征图的步骤中,包括:采用多个所述MBConv卷积模块对所述降维处理后的图像样本进行特征提取,得到所述初始特征图;其中,在采用所述MBConv卷积模块进行特征提取时采用Swish激活函数和Dropconnect方法。4.根据权利要求2所述的方法,其特征在于,所述卷积层的注意力模块包括通道注意力模块和空间注意力模块;在将所述初始特征图输入所述卷积层的注意力模块进行特征提取,得到最终特征图的步骤中,包括:将所述初始特征图依次输入所述通道注意力模块和空间注意力模块进行通道加权和空间像素点加权,得到所述最终特征图。5.根据权利要求1

【专利技术属性】
技术研发人员:张力文金子杰林聪佟乐肖贵宝潘浩王刚
申请(专利权)人:世纪龙信息网络有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1