多标签图像分类方法、装置、设备及存储介质制造方法及图纸

技术编号:20045839 阅读:40 留言:0更新日期:2019-01-09 04:27
本发明专利技术提供的多标签图像分类方法、装置、设备及存储介质,属于图像处理技术领域。该多标签图像分类方法包括:提取待处理图像的第一特征图像;对第一特征图像进行第一降维处理与第一分类处理生成第一标签分类预测结果;对第一特征图像进行特征提取,生成第二特征图像;对第二特征图像进行第二降维处理与第二分类处理生成第二标签分类预测结果,所述第二标签分类预测结果用于表示所述每个类别标签的第二分类结果;根据第一标签分类预测结果与第二标签分类预测结果确定待处理图像的目标预测结果,从而提高多标签图像分类的精度。

【技术实现步骤摘要】
多标签图像分类方法、装置、设备及存储介质
本专利技术涉及图像处理领域,具体而言,涉及多标签图像分类方法、装置、设备及存储介质。
技术介绍
多标签图像分类(multi-labelclassification)是计算机视觉中一项重要研究课题,特别是随着大数据时代的来临和深度学习技术的发展,图像分类获得越来越多的关注。然而普通的图像分类只需要给每个图像分类为一个标签,而多标签分类则需要对每个图像中包含的目标正确分类,不同标签的目标在图像中的大小不尽相同,每个图像标签数量也不固定,给多标签分类带来极大的困难。而目前现有研究中多采用传统的问题转换(problemtransformation)和算法改造(algorithmadaptation)方法来解决多标签图像分类问题,但是这些传统分类方法均不适合处理数据多样性高、类别数多的多标签图像分类问题,无法准确实现多标签分类。
技术实现思路
本专利技术实施例提供的多标签图像分类方法、装置、设备及存储介质,可以解决现有技术中的无法提高多标签图像分类的精度的技术问题。为了实现上述目的,本专利技术实施例采用的技术方案如下:第一方面,本专利技术实施例提供的一种多标签图像分类方法,包括:提取待处理图像的第一特征图像;对所述第一特征图像进行第一降维处理与第一分类处理生成第一标签分类预测结果,所述第一标签分类预测结果用于表示每个类别标签的第一分类结果;对所述第一特征图像进行特征提取,生成第二特征图像;对所述第二特征图像进行第二降维处理与第二分类处理生成第二标签分类预测结果,所述第二标签分类预测结果用于表示所述每个类别标签的第二分类结果;根据所述第一标签分类预测结果与所述第二标签分类预测结果确定所述待处理图像的目标预测结果。结合第一方面,本专利技术实施例提供了第一方面的第一种可能的实施方式,所述第一特征图像的维度为第一维度,所述的对所述第一特征图像进行第一降维处理与第一分类处理生成第一标签分类预测结果,包括:对所述第一特征图像进行池化处理,以得到第二维度的特征向量,所述第二维度小于所述第一维度;通过将所述第二维度的所述特征向量输入第一全连接层进行分类处理,生成所述第一标签分类预测结果。结合第一方面的第一种可能的实施方式,本专利技术实施例提供了第一方面的第二种可能的实施方式,所述的对所述第一特征图像进行池化处理,以得到第二维度的特征向量,包括:根据最大池化函数和平均池化函数确定预设池化函数;通过所述预设池化函数对所述第一特征图像做池化处理,以得到所述第二维度的所述特征向量。结合第一方面,本专利技术实施例提供了第一方面的第三种可能的实施方式,所述的对所述第一特征图像进行特征提取,生成第二特征图像,包括:基于预设分类的类别标签数对所述第一特征图像进行特征提取,生成第三维度的所述第二特征图像,所述第三维度等于所述类别标签数与预设常数的乘积,且所述第三维度小于所述第一特征图像的第一维度。结合第一方面的第三种可能的实施方式,本专利技术实施例提供了第一方面的第四种可能的实施方式,所述的对所述第二特征图像进行第二降维处理与第二分类处理生成第二标签分类预测结果,包括:对所述第二特征图像进行池化处理,以得到与所述类别标签数相同维度的特征向量;通过将与所述类别标签数相同维度的所述特征向量输入第二全连接层进行分类处理,生成所述第二标签分类预测结果。结合第一方面,本专利技术实施例提供了第一方面的第五种可能的实施方式,所述的根据所述第一标签分类预测结果与所述第二标签分类预测结果确定目标预测结果,包括:确定所述第一标签分类预测结果与所述第二标签分类预测结果的平均值作为所述目标预测结果。结合第一方面,本专利技术实施例提供了第一方面的第六种可能的实施方式,所述方法还包括:基于预设规则确定所述目标预测结果的准确率。结合第一方面的第六种可能的实施方式,本专利技术实施例提供了第一方面的第七种可能的实施方式,所述的基于预设规则确定所述目标预测结果的准确率,包括:基于sigmoid函数与交叉熵损失函数确定所述目标预测结果对应的损失值;根据所述损失值确定所述准确率。结合第一方面的第七种可能的实施方式,,本专利技术实施例提供了第一方面的第八种可能的实施方式,所述的基于sigmoid函数与交叉熵损失函数确定所述目标预测结果对应的损失值,包括:根据所述sigmoid函数计算所述目标预测结果对应的第一分类值;根据所述交叉熵损失函数计算所述第一分类值对应的所述损失值。第二方面,本专利技术实施例提供的一种多标签图像分类装置,包括:第一提取模块,用于提取待处理图像的第一特征图像;第一处理模块,用于对所述第一特征图像进行第一降维处理与第一分类处理生成第一标签分类预测结果,所述第一标签分类预测结果用于表示每个类别标签的第一分类结果;第二提取模块,用于对所述第一特征图像进行特征提取,生成第二特征图像;第二处理模块,用于对所述第二特征图像进行第二降维处理与第二分类处理生成第二标签分类预测结果,所述第二标签分类预测结果用于表示所述每个类别标签的第二分类结果;第三处理模块,用于根据所述第一标签分类预测结果与所述第二标签分类预测结果确定所述待处理图像的目标预测结果。第三方面,本专利技术实施例提供的一种终端设备,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面任一项所述多标签图像分类方法的步骤。第四方面,本专利技术实施例提供的一种存储介质,所述存储介质上存储有指令,当所述指令在计算机上运行时,使得所述计算机执行如第一方面任一项所述的多标签图像分类方法。与现有技术相比,本专利技术实施例带来了以下有益效果:本专利技术实施例提供的多标签图像分类方法、装置、设备及存储介质,通过提取待处理图像的第一特征图像,对第一特征图像进行第一降维处理与第一分类处理生成第一标签分类预测结果,并且对第一特征图像进行特征提取,生成第二特征图像;对第二特征图像进行第二降维处理与第二分类处理生成第二标签分类预测结果;根据第一标签分类预测结果与第二标签分类预测结果确定待处理图像的目标预测结果。换言之,本专利技术实施例中的多标签图像分类方法一方面是将通过第一特征图像进行分类得到第一标签分类预测结果作为目标预测结果的一部分,将从第一特征图像进一步提取第二特征图像,以及基于第二特征图像进行分类,得到第二标签分类预测结果作为目标预测结果的另外一部分,从而通过两个并行的分类处理分支得到两个分类结果,进而综合考虑两个分类结果得到目标分类结果;另一方面,因为从第一特征图像进一步提取第二特征图像,并基于第二特征图像进行分类,所以通过进一步提取图像特征以解决多标签的分类注意不到图像中多个不同目标的问题,通过以上两个方面,提高了多标签图像分类的精度。本公开的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本公开的上述技术即可得知。为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提本文档来自技高网...

【技术保护点】
1.一种多标签图像分类方法,其特征在于,包括:提取待处理图像的第一特征图像;对所述第一特征图像进行第一降维处理与第一分类处理生成第一标签分类预测结果,所述第一标签分类预测结果用于表示每个类别标签的第一分类结果;对所述第一特征图像进行特征提取,生成第二特征图像;对所述第二特征图像进行第二降维处理与第二分类处理生成第二标签分类预测结果,所述第二标签分类预测结果用于表示所述每个类别标签的第二分类结果;根据所述第一标签分类预测结果与所述第二标签分类预测结果确定所述待处理图像的目标预测结果。

【技术特征摘要】
1.一种多标签图像分类方法,其特征在于,包括:提取待处理图像的第一特征图像;对所述第一特征图像进行第一降维处理与第一分类处理生成第一标签分类预测结果,所述第一标签分类预测结果用于表示每个类别标签的第一分类结果;对所述第一特征图像进行特征提取,生成第二特征图像;对所述第二特征图像进行第二降维处理与第二分类处理生成第二标签分类预测结果,所述第二标签分类预测结果用于表示所述每个类别标签的第二分类结果;根据所述第一标签分类预测结果与所述第二标签分类预测结果确定所述待处理图像的目标预测结果。2.根据权利要求1所述的方法,其特征在于,所述第一特征图像的特征维度为第一维度,所述的对所述第一特征图像进行第一降维处理与第一分类处理生成第一标签分类预测结果,包括:对所述第一特征图像进行池化处理,以得到第二维度的特征向量,所述第二维度小于所述第一维度;通过将所述第二维度的所述特征向量输入第一全连接层进行分类处理,生成所述第一标签分类预测结果。3.根据权利要求2所述的方法,其特征在于,所述的对所述第一特征图像进行池化处理,以得到第二维度的特征向量,包括:根据最大池化函数和平均池化函数确定预设池化函数;通过所述预设池化函数对所述第一特征图像做池化处理,以得到所述第二维度的所述特征向量。4.根据权利要求1所述的方法,其特征在于,所述的对所述第一特征图像进行特征提取,生成第二特征图像,包括:基于预设分类的类别标签数对所述第一特征图像进行特征提取,生成第三维度的所述第二特征图像,所述第三维度等于所述类别标签数与预设常数的乘积,且所述第三维度小于所述第一特征图像的第一维度。5.根据权利要求4所述的方法,其特征在于,所述的对所述第二特征图像进行第二降维处理与第二分类处理生成第二标签分类预测结果,包括:对所述第二特征图像进行池化处理,以得到与所述类别标签数相同维度的特征向量;通过将与所述类别标签数相同维度的所述特征向量输入第二全连接层进行分类处理,生成所述第二标签分类预测结果。6.根据...

【专利技术属性】
技术研发人员:魏秀参刘威威
申请(专利权)人:南京旷云科技有限公司徐州旷视数据科技有限公司北京旷视科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1