图像分类方法及装置制造方法及图纸

技术编号：25990584 阅读：21 留言：0更新日期：2020-10-20 18:58

本申请涉及人工智能领域中计算机视觉领域的图像识别技术，提供了一种图像分类方法及装置。涉及人工智能领域，具体涉及计算机视觉领域。该方法包括：获取待处理图像的输入特征图；根据神经网络的M个卷积核对所述输入特征图进行卷积处理，得到M个通道的候选输出特征图，M为正整数；根据N个矩阵对所述候选输出特征图的M个通道进行矩阵变换，得到N个通道的输出特征图，其中，所述N个矩阵中的每个矩阵的通道数小于M，N大于M，N为正整数；根据所述输出特征图对所述待处理图像进行分类，得到所述待处理图像的分类结果。该方法有助于降低图像分类处理的计算量和参数量。

全部详细技术资料下载

【技术实现步骤摘要】
图像分类方法及装置
本申请涉及人工智能领域，并且更具体地，涉及一种图像分类方法及装置。
技术介绍
计算机视觉是各个应用领域，如制造业、检验、文档分析、医疗诊断，和军事等领域中各种智能/自主系统中不可分割的一部分，它是一门关于如何运用照相机/摄像机和计算机来获取我们所需的，被拍摄对象的数据与信息的学问。形象地说，就是给计算机安装上眼睛(照相机/摄像机)和大脑(算法)用来代替人眼对目标进行识别、跟踪和测量等，从而使计算机能够感知环境。因为感知可以看作是从感官信号中提取信息，所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。总的来说，计算机视觉就是用各种成象系统代替视觉器官获取输入信息，再由计算机来代替大脑对这些输入信息完成处理和解释。计算机视觉的最终研究目标就是使计算机能像人那样通过视觉观察和理解世界，具有自主适应环境的能力。图像分类是各类图像处理应用的基础，计算机视觉常常会涉及到如何对获取到的图像进行分类的问题。随着人工智能技术的快速发展，基于深度学习的卷积神经网络(convolutionalneuralnetworks，CNN)在图像分类处理中得到了越来越广泛的应用。但是，卷积神经网络所包含的参数量和计算量都过大。因此，如何降低神经网络的运算开销成为一个亟需解决的问题。
技术实现思路
本申请提供一种图像分类方法及装置，该方法有助于降低图像分类处理的计算量和参数量。第一方面，提供了一种图像分类方法，该方法包括：获取待处理图像的输入特征图；根据神经网...

【技术保护点】
1.一种图像分类方法，其特征在于，包括：/n获取待处理图像的输入特征图；/n根据神经网络的M个卷积核对所述输入特征图进行卷积处理，得到M个通道的候选输出特征图，M为正整数；/n根据N个矩阵对所述候选输出特征图的M个通道进行矩阵变换，得到N个通道的输出特征图，其中，所述N个矩阵中的每个矩阵的通道数小于M，N大于M，N为正整数；/n根据所述输出特征图对所述待处理图像进行分类，得到所述待处理图像的分类结果。/n

【技术特征摘要】
1.一种图像分类方法，其特征在于，包括：
获取待处理图像的输入特征图；
根据神经网络的M个卷积核对所述输入特征图进行卷积处理，得到M个通道的候选输出特征图，M为正整数；
根据N个矩阵对所述候选输出特征图的M个通道进行矩阵变换，得到N个通道的输出特征图，其中，所述N个矩阵中的每个矩阵的通道数小于M，N大于M，N为正整数；
根据所述输出特征图对所述待处理图像进行分类，得到所述待处理图像的分类结果。

2.根据权利要求1所述的方法，其特征在于，所述N个矩阵包括M组卷积核，所述M组卷积核分别与所述候选输出特征图的M个通道对应；
所述根据N个矩阵对所述M个候选输出特征图进行矩阵变换，得到N个通道的输出特征图，包括：
根据所述M组卷积核中的每一组卷积核，对所述候选输出特征图的M个通道中对应的通道进行卷积，得到所述N个通道的输出特征图。

3.根据权利要求2所述的方法，其特征在于，所述根据所述M组卷积核中的每一组卷积核，对所述候选输出特征图的M个通道中对应的通道进行卷积，得到所述N个通道的输出特征图，包括：
根据所述M组卷积核中的每一组卷积核，对所述候选输出特征图的M个通道中对应的通道进行深度卷积，得到所述N个通道的输出特征图。

4.根据权利要求2所述的方法，其特征在于，所述M组卷积核中的每一组的卷积核与所述M组卷积核中的其他组的卷积核相同。

5.根据权利要求1至4中任一项所述的方法，其特征在于，所述根据所述输出特征图对所述待处理图像进行分类，得到所述待处理图像的分类结果，包括：
对所述候选输出特征图和所述输出特征图进行特征拼接，得到特征拼接特征图，所述特征拼接特征图的通道数为M+N；
根据所述特征拼接特征图对所述待处理图像进行分类，得到所述待处理图像的分类结果。

6.一种图像分类方法，其特征在于，包括：
获取待处理图像的输入特征图；
根据神经网络的M个第一卷积核对所述输入特征图进行卷积处理，得到M个通道的第一候选输出特征图，M为正整数；
根据K个第一矩阵对所述M个第一候选输出特征图进行矩阵变换，得到K个通道的第一输出特征图，其中，所述K个第一矩阵中的每个矩阵的通道数小于M，K大于M，K为正整数；
根据神经网络的P个第二卷积核对所述第一输出特征图进行卷积处理，得到P个通道的第二候选输出特征图，P为正整数；
根据N个第二矩阵对所述P个第二候选输出特征图进行矩阵变换，得到N个通道的第二输出特征图，其中，所述N个第二矩阵中的每个矩阵的通道数小于P，N大于P，N为正整数；
根据所述第二输出特征图对所述待处理图像进行分类，得到所述待处理图像的分类结果。

7.根据权利要求6所述的方法，其特征在于，所述根据神经网络的P个第二卷积核对所述第一输出特征图进行卷积处理，得到P个通道的第二候选输出特征图，包括：
对所述第一输出特征图进行深度卷积，得到深度卷积特征图；
根据所述P个第二卷积核对所述深度卷积特征图进行卷积处理，得到所述第二候选输出特征图。

8.根据权利要求7所述的方法，其特征在于，所述对所述第一输出特征图进行深度卷积，得到深度卷积特征图，包括：
对所述第一输出特征图进行步幅大于1的深度卷积，得到所述深度卷积特征图。

9.根据权利要求6或7所述的方法，其特征在于，所述根据所述第二输出特征图对所述待处理图像进行分类，得到所述待处理图像的分类结果，包括：
对所述输入特征图和所述第二输出特征图进行残差连接，得到残差连接特征图；
根据所述残差连接特征图对所述待处理图像进行分类，得到所述待处理图像的分类结果。

10.一种图像分类装置，其特征在于，包括：
获取单元，用于获取待处理图像的输入特征图；
卷积单元，用于根据神经网络的M个卷积核对所述输入特征图进行卷积处理，得到M个通道的候选输出特征图，...

【专利技术属性】
技术研发人员：韩凯，王云鹤，舒晗，许春景，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人