一种图像分类方法及装置制造方法及图纸

技术编号:21572572 阅读:24 留言:0更新日期:2019-07-10 15:40
本申请提供了一种图像分类方法及装置,其中,该方法包括:获取待分类的目标图像;将目标图像输入至预先训练好的分类模型中,输出目标图像的类别;其中,目标图像在分类模型中的处理过程包括:提取目标图像的目标方向梯度直方图HOG特征矩阵;分别计算目标HOG特征矩阵和每个类别对应的参考HOG特征矩阵之间的互信息值;基于计算出的互信息值,确定与目标HOG特征矩阵之间的互信息值由大到小排列在前K位的参考HOG特征矩阵;K为正整数;根据排列在前K位的参考HOG特征矩阵分别对应的类别,将出现次数最多的类别作为目标图像的类别。采用上述方式,可以在保证准确率较高的情况下,节省硬件处理资源,提升图像处理效率。

An Image Classification Method and Device

【技术实现步骤摘要】
一种图像分类方法及装置
本申请涉及大数据
,具体而言,涉及一种图像分类方法及装置。
技术介绍
图像在现代生活中随处可见,图像承载的信息越来越多,图像处理和识别技术也越来越重要。目前在很多应用场景下都会涉及到图像分类问题,例如,对物体进行检测分割、车牌识别、工件分类等。对于图像分类问题,通常是采用一些深度学习模型来提取图像特征并进行分类,例如卷积神经网络模型等,但这类深度学习模型由于网络结构较为复杂,可能存在如下局限:一方面,应用过程中运算量较大,消耗较多的硬件处理资源且图像处理效率较低,另一方面,需要利用庞大的训练样本集对模型进行训练,才能保证模型预测具备一定的准确度。
技术实现思路
有鉴于此,本申请提供一种图像分类方法及装置,能够在保证准确率较高的情况下,节省硬件处理资源,提升图像处理效率。第一方面,本申请提供了一种图像分类方法,包括:获取待分类的目标图像;将所述目标图像输入至预先训练好的分类模型中,输出所述目标图像的类别;其中,所述目标图像在所述分类模型中的处理过程包括:提取所述目标图像的目标方向梯度直方图HOG特征矩阵;分别计算所述目标HOG特征矩阵和每个类别对应的参考HOG特征矩阵之间的互信息值;基于计算出的互信息值,确定与所述目标HOG特征矩阵之间的互信息值由大到小排列在前K位的参考HOG特征矩阵;K为正整数;根据所述排列在前K位的参考HOG特征矩阵分别对应的类别,将出现次数最多的类别作为所述目标图像的类别。第二方面,本申请提供一种图像分类装置,包括:获取模块,用于获取待分类的目标图像;处理模块,用于将所述目标图像输入至预先训练好的分类模型中,输出所述目标图像的类别;其中,所述处理模块在所述分类模型中执行的处理过程包括:提取所述目标图像的目标方向梯度直方图HOG特征矩阵;分别计算所述目标HOG特征矩阵和每个类别对应的参考HOG特征矩阵之间的互信息值;基于计算出的互信息值,确定与所述目标HOG特征矩阵之间的互信息值由大到小排列在前K位的参考HOG特征矩阵;K为正整数;根据所述排列在前K位的参考HOG特征矩阵分别对应的类别,将出现次数最多的类别作为所述目标图像的类别。第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面的任一种可能的实施方式中所述的图像分类方法的步骤。第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面的任一种可能的实施方式中所述的图像分类方法的步骤。本申请提供的图像分类方法及装置,在基于预先训练好的分类模型对目标图像的类别进行预测时,可以首先提取待分类的目标图像的目标HOG特征矩阵,由于目标HOG特征矩阵可以反映出目标图像的边缘特征,故提取出的图像特征更为精确,减少其它图像信息的干扰;进一步地,可以计算目标HOG特征矩阵与每个类别对应的参考HOG特征矩阵之间的互信息值,由于互信息值的大小可以反映出目标HOG特征矩阵和参考HOG特征矩阵之间的相似程度,故可以通过选取互信息值最高的前K个参考HOG特征矩阵,并基于前K个参考HOG特征矩阵分别对应的类别,来最终预测出目标图像的类别。基于上述分类模型进行图像分类的方式,相对现有基于深度学习模型来进行图像分类的方式来说,提取图像特征和预测类别的过程运算量较少,可以在保证准确率较高的情况下,节省硬件处理资源,提升图像处理效率。并且由于上述分类模型相对深度学习模型来说,不需要复杂的卷积神经网络模型,模型结构较为简单,故可以利用有限的训练样本进行训练得到分类模型,且能够保证较高的准确率。为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1示出了本申请实施例提供的对分类模型进行训练的流程示意图;图2示出了本申请实施例提供的对基础特征提取模块的训练过程的流程示意图;图3示出了本申请实施例提供的对基础类别预测模块进行训练的流程示意图;图4示出了本申请实施例提供的一种图像分类方法的流程示意图;图5示出了本申请实施例提供的一种图像分类装置的结构示意图;图6示出了本申请实施例提供的一种电子设备的结构示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。目前,针对图像分类问题,通常采用一些网络结构较为复杂的深度学习模型来提取图像特征并基于提取的图像特征来进行分类预测,例如卷积神经网络模型等。一般来说,网络结构越复杂,提取出的图像特征越细致,得到的分类预测结果的准确率越高,但是由于网络结构的复杂度升高,在提取图像特征时的运算量也会相应的增大,导致需要消耗更多的硬件处理资源,图像处理效率也会降低。另外,由于网络结构的复杂度升高,待训练的模型参数也较多,需要庞大的训练样本集对深度学习模型进行训练,才能达到一定的准确率,很难通过有限的训练样本训练出一个预测准确度较高的深度学习模型,这使得前期需要耗费大量人力物力去获取足够多的训练样本,且在对深度学习模型进行训练时也需要耗费较多时间,也存在硬件处理资源消耗较多,训练过程效率较低的问题。为解决上述问题,本申请提供了一种图像分类方法及装置,可以基于预先训练的分类模型来预测目标图像的类别。示例性的,目标图像例如为文本图像、或工件图像等,可以实现对文本类别、或工件类别的识别,当然,也可以实现对其它物体或人物或场景的类别的识别等,本申请对此并不限定。在基于预先训练的分类模型来预测目标图像的类别时,通过结合图像的梯度方向直方图(histogramoforientedGradient,HOG)特征矩阵,计算待分类的目标图像的HOG特征矩阵与参考HOG特征矩阵之间的互信息值,互信息值的大小可以较好的反映出不同图像之间的相似程度,进一步结合改进后的K最近邻(K-NearestNeighbour,KNN)算法,确定出互信息值由大到小排列在前K位的参考HOG特征矩阵,然后根据前K位的参考HOG特征矩阵分别对应的类别,最终可以预测出目标图像的类别。相对现有基于深度学习模型来进行图像分类的方式来说,提取图像特征和预测类别的过程运算量较少,可以在保证准确率较高的情况下,节省硬件处理资源,提升本文档来自技高网...

【技术保护点】
1.一种图像分类方法,其特征在于,包括:获取待分类的目标图像;将所述目标图像输入至预先训练好的分类模型中,输出所述目标图像的类别;其中,所述目标图像在所述分类模型中的处理过程包括:提取所述目标图像的目标方向梯度直方图HOG特征矩阵;分别计算所述目标HOG特征矩阵和每个类别对应的参考HOG特征矩阵之间的互信息值;基于计算出的互信息值,确定与所述目标HOG特征矩阵之间的互信息值由大到小排列在前K位的参考HOG特征矩阵;K为正整数;根据所述排列在前K位的参考HOG特征矩阵分别对应的类别,将出现次数最多的类别作为所述目标图像的类别。

【技术特征摘要】
1.一种图像分类方法,其特征在于,包括:获取待分类的目标图像;将所述目标图像输入至预先训练好的分类模型中,输出所述目标图像的类别;其中,所述目标图像在所述分类模型中的处理过程包括:提取所述目标图像的目标方向梯度直方图HOG特征矩阵;分别计算所述目标HOG特征矩阵和每个类别对应的参考HOG特征矩阵之间的互信息值;基于计算出的互信息值,确定与所述目标HOG特征矩阵之间的互信息值由大到小排列在前K位的参考HOG特征矩阵;K为正整数;根据所述排列在前K位的参考HOG特征矩阵分别对应的类别,将出现次数最多的类别作为所述目标图像的类别。2.如权利要求1所述的图像分类方法,其特征在于,所述分别计算所述目标HOG特征矩阵和每个类别对应的参考HOG特征矩阵之间的互信息值,包括:根据所述目标HOG特征矩阵中各个特征参数,计算每种特征参数出现在所述目标HOG特征矩阵中的第一概率,并基于计算出的第一概率,确定所述目标HOG特征矩阵的第一信息熵;其中,每个特征参数用于表征所述目标图像中对应的图像区域的图像特征,取值相同的特征参数为同一种特征参数,所述图像区域包括至少一个像素点;以及,根据每个所述参考HOG特征矩阵的各个特征参数,计算每种特征参数出现在每个所述参考HOG特征矩阵中的第二概率,并基于计算出的第二概率,确定每个所述参考HOG特征矩阵的第二信息熵;以及,计算所述目标HOG特征矩阵和每个所述参考HOG特征矩阵中同一位置处出现同种特征参数的第三概率,并基于计算出的第三概率,确定所述目标HOG特征矩阵和每个所述参考HOG特征矩阵之间的第三信息熵;基于所述第一信息熵、每个所述参考HOG特征矩阵的第二信息熵、以及所述目标HOG特征矩阵和每个所述参考HOG特征矩阵之间的第三信息熵,计算所述目标HOG特征矩阵和每个所述参考HOG特征矩阵之间的互信息值。3.如权利要求1所述的图像分类方法,其特征在于,所述方法还包括:获取训练样本集和测试样本集,其中,所述训练样本集中包括不同类别的训练样本子集,每种类别的训练样本子集中包括归属于该类别的多个训练样本图像,所述测试样本集中包括多个测试样本图像,每个测试样本图像与预设类别标签相对应;基于所述不同类别的训练样本子集中的训练样本图像、以及所述测试样本集中的测试样本图像,对基础分类模型中的基础特征提取模块和基础类别预测模块分别进行训练,在确定训练完成后分别得到特征提取模块和类别预测模块;将训练完成后的特征提取模块和类别预测模块构成所述分类模型。4.如权利要求3所述的图像分类方法,其特征在于,根据以下方式训练所述基础特征提取模块:将每个测试样本图像和每个类别的训练样本子集中的训练样本图像输入至所述基础特征提取模块中,分别提取每个测试样本图像的第一HOG特征矩阵、以及每个类别的每个训练样本图像的第二HOG特征矩阵;将提取出的第一HOG特征矩阵和提取出的第二HOG特征矩阵输入至所述基础类别预测模块中,预测每个测试样本图像的类别;基于预测出的每个所述测试样本图像的类别和每个所述测试样本图像的预设类别标签,确定本轮训练过程的准确率;若所述准确率不满足第一预设条件,则调整所述基础特征提取模块的模型参数并重新执行训练过程,直至确定所述准确率满足所述第一预设条件;若所述准确率满足所述第一预设条件,则确定所述基础特征提取模块训练完成。5.如权利要求4所述的图像分类方法,其特征在于,根据以下方式训练所述基础类别预测模块:将每个测试样本图像和每个类别的训练样本子集中的训练样本图像输入至训练完成后的特征提取模块中,分别提取每个测试样本图像的第一HOG特征矩阵、以及每个类别的每个训练样本图像的第二HOG特征矩阵;将提取出的第一HOG特征矩阵和提取出的第二HOG特征矩阵输入至所述基础类别预测模块中,根据每个类别对应的每N个第二HOG特征矩阵,确定出每个类别对应的中心HOG特征矩阵;确定与每个第一HOG特征矩阵之间的互信息值由大到小排列在前K位的中心HOG特征矩阵;基于确定的排列在前K位的中心HOG特征矩阵分别对应的类别,预测每个所述测试样本图像的类别;K,N为正整数;基于预测出的每个所述测试样本图像的类别和每个所述测试样本图像的预设类别标签,确定本轮训练过程的准确率;若所述准确率不满足第二预设条件,则调整所述基础类别预测模块的模型参数K和N,并重新进行训练过程,直至确定所述准确率满足所述第二预设条件;若所述准确率满足所述第二预设条件,则确定所述基础类别预测模块训练完成。6.一种图像分类装置,其特征在于,包括:获取模块,用于获取待分类的目标...

【专利技术属性】
技术研发人员:徐启南
申请(专利权)人:新华三大数据技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1