图像分类方法及装置制造方法及图纸

技术编号:25990584 阅读:21 留言:0更新日期:2020-10-20 18:58
本申请涉及人工智能领域中计算机视觉领域的图像识别技术,提供了一种图像分类方法及装置。涉及人工智能领域,具体涉及计算机视觉领域。该方法包括:获取待处理图像的输入特征图;根据神经网络的M个卷积核对所述输入特征图进行卷积处理,得到M个通道的候选输出特征图,M为正整数;根据N个矩阵对所述候选输出特征图的M个通道进行矩阵变换,得到N个通道的输出特征图,其中,所述N个矩阵中的每个矩阵的通道数小于M,N大于M,N为正整数;根据所述输出特征图对所述待处理图像进行分类,得到所述待处理图像的分类结果。该方法有助于降低图像分类处理的计算量和参数量。

【技术实现步骤摘要】
图像分类方法及装置
本申请涉及人工智能领域,并且更具体地,涉及一种图像分类方法及装置。
技术介绍
计算机视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断,和军事等领域中各种智能/自主系统中不可分割的一部分,它是一门关于如何运用照相机/摄像机和计算机来获取我们所需的,被拍摄对象的数据与信息的学问。形象地说,就是给计算机安装上眼睛(照相机/摄像机)和大脑(算法)用来代替人眼对目标进行识别、跟踪和测量等,从而使计算机能够感知环境。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。总的来说,计算机视觉就是用各种成象系统代替视觉器官获取输入信息,再由计算机来代替大脑对这些输入信息完成处理和解释。计算机视觉的最终研究目标就是使计算机能像人那样通过视觉观察和理解世界,具有自主适应环境的能力。图像分类是各类图像处理应用的基础,计算机视觉常常会涉及到如何对获取到的图像进行分类的问题。随着人工智能技术的快速发展,基于深度学习的卷积神经网络(convolutionalneuralnetworks,CNN)在图像分类处理中得到了越来越广泛的应用。但是,卷积神经网络所包含的参数量和计算量都过大。因此,如何降低神经网络的运算开销成为一个亟需解决的问题。
技术实现思路
本申请提供一种图像分类方法及装置,该方法有助于降低图像分类处理的计算量和参数量。第一方面,提供了一种图像分类方法,该方法包括:获取待处理图像的输入特征图;根据神经网络的M个卷积核对所述输入特征图进行卷积处理,得到M个通道的候选输出特征图,M为正整数;根据N个矩阵对所述候选输出特征图的M个通道进行矩阵变换,得到N个通道的输出特征图,其中,所述N个矩阵中的每个矩阵的通道数小于M,N大于M,N为正整数;根据所述输出特征图对所述待处理图像进行分类,得到所述待处理图像的分类结果。可选地,所述M个卷积核可以为现有卷积神经网络中的标准卷积核。需要说明的是,在本申请实施例中,标准卷积核的通道数与输入特征图的通道数相同,例如,若待处理图像的输入特征图的通道数为C,那么,现有卷积神经网络中的标准卷积核的通道数也为C,即标准卷积核的通道数与输入特征图的通道数相同,其中,C为正整数。在本申请实施例中,通过少量标准卷积核(即M个卷积核)对待处理图像进行卷积处理,得到少量的候选特征图,并对这些少量的候选特征图进行矩阵变换以得到所需的输出特征图,其中,标准卷积核的个数少于现有卷积神经网络中的标准卷积核的个数,同时,矩阵变换中使用的矩阵的通道数也小于标准卷积核,因此,有助于减少神经网络模型的计算量和参数量,从而降低图像分类处理的计算量和参数量。可选地,所述N个矩阵中每个矩阵的通道数可以为1,或者,所述N个矩阵中每个矩阵的通道数也可以大于1。结合第一方面,在第一方面的某些实现方式中,所述N个矩阵包括M组卷积核,所述M组卷积核分别与所述候选输出特征图的M个通道对应;所述根据N个矩阵对所述M个候选输出特征图进行矩阵变换,得到N个通道的输出特征图,包括:根据所述M组卷积核中的每一组卷积核,对所述候选输出特征图的M个通道中对应的通道进行卷积,得到所述N个通道的输出特征图。结合第一方面,在第一方面的某些实现方式中,所述根据所述M组卷积核中的每一组卷积核,对所述候选输出特征图的M个通道中对应的通道进行卷积,得到所述N个通道的输出特征图,包括:根据所述M组卷积核中的每一组卷积核,对所述候选输出特征图的M个通道中对应的通道进行深度卷积,得到所述N个通道的输出特征图。结合第一方面,在第一方面的某些实现方式中,所述M组卷积核中的每一组的卷积核与所述M组卷积核中的其他组的卷积核相同。结合第一方面,在第一方面的某些实现方式中,所述根据所述输出特征图对所述待处理图像进行分类,得到所述待处理图像的分类结果,包括:对所述候选输出特征图和所述输出特征图进行特征拼接,得到特征拼接特征图,所述特征拼接特征图的通道数为M+N;根据所述特征拼接特征图对所述待处理图像进行分类,得到所述待处理图像的分类结果。可选地,上述特征拼接可以是指所述候选输出特征图和所述输出特征图在深度方向上组成新的特征图,即上述特征拼接特征图。例如,所述候选输出特征图的通道数为M,所述输出特征图的通道数为N,所述候选输出特征图和所述输出特征图可以进行特征拼接,得到一个通道数为M+N的特征拼接特征图。特征拼接可以通过恒等特征映射的方式,可以将更多的细节(或特征)引入输出特征图,同时,这种恒等映射并不会引入额外的参数或者计算量,因此可以在不增加参数量和计算量的情况下,提升图像分类的效果。第二方面,提供了一种图像分类方法,该方法包括:获取待处理图像的输入特征图;根据神经网络的M个第一卷积核对所述输入特征图进行卷积处理,得到M个通道的第一候选输出特征图,M为正整数;根据K个第一矩阵对所述M个第一候选输出特征图进行矩阵变换,得到K个通道的第一输出特征图,其中,所述K个第一矩阵中的每个矩阵的通道数小于M,K大于M,K为正整数;根据神经网络的P个第二卷积核对所述第一输出特征图进行卷积处理,得到P个通道的第二候选输出特征图,P为正整数;根据N个第二矩阵对所述P个第二候选输出特征图进行矩阵变换,得到N个通道的第二输出特征图,其中,所述N个第二矩阵中的每个矩阵的通道数小于P,N大于P,N为正整数;根据所述第二输出特征图对所述待处理图像进行分类,得到所述待处理图像的分类结果。可选地,所述M个第一卷积核可以为现有卷积神经网络中的标准卷积核。需要说明的是,在本申请实施例中,标准卷积核的通道数与输入特征图的通道数相同,例如,若待处理图像的输入特征图的通道数为C,那么,现有卷积神经网络中的标准卷积核的通道数也为C,即标准卷积核的通道数与输入特征图的通道数相同,其中,C为正整数。类似地,所述P个第二卷积核也可以为现有卷积神经网络中的标准卷积核。在本申请实施例中,通过少量标准卷积核及矩阵变换实现现有卷积神经网络中的卷积处理,可以有效减少各输出特征图之间的冗余性,减少神经网络模型的计算量和参数量,从而降低图像分类处理的计算量和参数量,因此,本申请实施例中的图像分类方法可以在不增加参数量和计算量(或者减少参数量和计算量)的情况下,提升图像分类的效果。可选地,所述K个第一矩阵中每个矩阵的通道数可以为1,或者,所述K个第一矩阵中每个矩阵的通道数也可以大于1。可选地,所述N个第二矩阵中每个矩阵的通道数可以为1,或者,所述N个第二矩阵中每个矩阵的通道数也可以大于1。结合第二方面,在第二方面的某些实现方式中,所述根据神经网络的P个第二卷积核对所述第一输出特征图进行卷积处理,得到P个通道的第二候选输出特征图,包括:对所述第一输出特征图进行深度卷积,得到深度卷积特征图;根据所述P个第二卷积核对所述深度卷积特征图进行卷积处理,得到所述第二候选输出特征图。结合第二方面,在第二方面的某些实现方式中,本文档来自技高网...

【技术保护点】
1.一种图像分类方法,其特征在于,包括:/n获取待处理图像的输入特征图;/n根据神经网络的M个卷积核对所述输入特征图进行卷积处理,得到M个通道的候选输出特征图,M为正整数;/n根据N个矩阵对所述候选输出特征图的M个通道进行矩阵变换,得到N个通道的输出特征图,其中,所述N个矩阵中的每个矩阵的通道数小于M,N大于M,N为正整数;/n根据所述输出特征图对所述待处理图像进行分类,得到所述待处理图像的分类结果。/n

【技术特征摘要】
1.一种图像分类方法,其特征在于,包括:
获取待处理图像的输入特征图;
根据神经网络的M个卷积核对所述输入特征图进行卷积处理,得到M个通道的候选输出特征图,M为正整数;
根据N个矩阵对所述候选输出特征图的M个通道进行矩阵变换,得到N个通道的输出特征图,其中,所述N个矩阵中的每个矩阵的通道数小于M,N大于M,N为正整数;
根据所述输出特征图对所述待处理图像进行分类,得到所述待处理图像的分类结果。


2.根据权利要求1所述的方法,其特征在于,所述N个矩阵包括M组卷积核,所述M组卷积核分别与所述候选输出特征图的M个通道对应;
所述根据N个矩阵对所述M个候选输出特征图进行矩阵变换,得到N个通道的输出特征图,包括:
根据所述M组卷积核中的每一组卷积核,对所述候选输出特征图的M个通道中对应的通道进行卷积,得到所述N个通道的输出特征图。


3.根据权利要求2所述的方法,其特征在于,所述根据所述M组卷积核中的每一组卷积核,对所述候选输出特征图的M个通道中对应的通道进行卷积,得到所述N个通道的输出特征图,包括:
根据所述M组卷积核中的每一组卷积核,对所述候选输出特征图的M个通道中对应的通道进行深度卷积,得到所述N个通道的输出特征图。


4.根据权利要求2所述的方法,其特征在于,所述M组卷积核中的每一组的卷积核与所述M组卷积核中的其他组的卷积核相同。


5.根据权利要求1至4中任一项所述的方法,其特征在于,所述根据所述输出特征图对所述待处理图像进行分类,得到所述待处理图像的分类结果,包括:
对所述候选输出特征图和所述输出特征图进行特征拼接,得到特征拼接特征图,所述特征拼接特征图的通道数为M+N;
根据所述特征拼接特征图对所述待处理图像进行分类,得到所述待处理图像的分类结果。


6.一种图像分类方法,其特征在于,包括:
获取待处理图像的输入特征图;
根据神经网络的M个第一卷积核对所述输入特征图进行卷积处理,得到M个通道的第一候选输出特征图,M为正整数;
根据K个第一矩阵对所述M个第一候选输出特征图进行矩阵变换,得到K个通道的第一输出特征图,其中,所述K个第一矩阵中的每个矩阵的通道数小于M,K大于M,K为正整数;
根据神经网络的P个第二卷积核对所述第一输出特征图进行卷积处理,得到P个通道的第二候选输出特征图,P为正整数;
根据N个第二矩阵对所述P个第二候选输出特征图进行矩阵变换,得到N个通道的第二输出特征图,其中,所述N个第二矩阵中的每个矩阵的通道数小于P,N大于P,N为正整数;
根据所述第二输出特征图对所述待处理图像进行分类,得到所述待处理图像的分类结果。


7.根据权利要求6所述的方法,其特征在于,所述根据神经网络的P个第二卷积核对所述第一输出特征图进行卷积处理,得到P个通道的第二候选输出特征图,包括:
对所述第一输出特征图进行深度卷积,得到深度卷积特征图;
根据所述P个第二卷积核对所述深度卷积特征图进行卷积处理,得到所述第二候选输出特征图。


8.根据权利要求7所述的方法,其特征在于,所述对所述第一输出特征图进行深度卷积,得到深度卷积特征图,包括:
对所述第一输出特征图进行步幅大于1的深度卷积,得到所述深度卷积特征图。


9.根据权利要求6或7所述的方法,其特征在于,所述根据所述第二输出特征图对所述待处理图像进行分类,得到所述待处理图像的分类结果,包括:
对所述输入特征图和所述第二输出特征图进行残差连接,得到残差连接特征图;
根据所述残差连接特征图对所述待处理图像进行分类,得到所述待处理图像的分类结果。


10.一种图像分类装置,其特征在于,包括:
获取单元,用于获取待处理图像的输入特征图;
卷积单元,用于根据神经网络的M个卷积核对所述输入特征图进行卷积处理,得到M个通道的候选输出特征图,...

【专利技术属性】
技术研发人员:韩凯王云鹤舒晗许春景
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1