图片分类方法和装置、机器人制造方法及图纸

技术编号:18399598 阅读:29 留言:0更新日期:2018-07-08 19:51
本发明专利技术公开了一种图片分类方法和装置、机器人。其中,该方法包括:将待分类的目标图片输入卷积神经网络的卷积层,其中,卷积神经网络至少包括一个卷积层和一个池化层;根据预先设置的第一卷积核对第一矩阵做卷积运算,得到第一向量,其中,第一向量为一维向量,第一矩阵是卷积神经网络的最后一个池化层的输出;根据预先设置的第二卷积核对第一向量做卷积运算,得到第二向量,其中,第二向量为一维向量;根据第二向量对目标图片进行分类。本发明专利技术解决了现有技术中全连接层的参数太多导致网络对终端的性能要求较高的技术问题。

【技术实现步骤摘要】
图片分类方法和装置、机器人
本专利技术涉及图像处理领域,具体而言,涉及一种图片分类方法和装置、机器人。
技术介绍
当前研究者投入了非常多的精力研究神经网络,包括深度信念网,深度玻尔兹曼机,自动编码机,去噪编码机,卷积神经网络等。在这些网络中,全连接层是非常主要的构件,例如,深度信念网,自动编码机这样的网络所有层都是全连接层;卷积神经网络会增加几层全连接层以获得较好的分类准确度。全连接层的主要问题有:参数太多导致网络对终端的性能要求较高。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种图片分类方法和装置、机器人,以至少解决现有技术中全连接层的参数太多导致网络对终端的性能要求较高的技术问题。根据本专利技术实施例的一个方面,提供了一种图片分类方法,包括:将待分类的目标图片输入到卷积神经网络的卷积层中,其中,所述卷积神经网络至少包括一个卷积层和一个池化层;根据预先设置的第一卷积核对第一矩阵做卷积运算,得到第一向量,其中,所述第一向量为一维向量,所述第一矩阵是所述卷积神经网络的最后一个池化层的输出;根据预先设置的第二卷积核对所述第一向量做卷积运算,得到第二向量,其中,所述第二向量为一维向量;根据所述第二向量对所述目标图片进行分类。进一步地,根据预先设置的第一卷积核对第一矩阵做卷积运算,得到第一向量包括:根据所述第一卷积核对所述第一矩阵做卷积运算,得到第二矩阵;将所述第二矩阵的所有元素按照预设顺序重新排列,得到所述第一向量。进一步地,在根据预先设置的第一卷积核对第一矩阵做卷积运算之前,所述方法还包括:获取训练样本,其中,所述训练样本包括预先划分好类别的多张图片,所述类别用于表征所述训练样本所指示的事物的种类;根据所述训练样本对所述卷积神经网络进行训练,得到所述第一卷积核。进一步地,根据所述训练样本对所述卷积神经网络进行训练,得到所述第一卷积核包括:将所述训练样本输入到所述卷积神经网络的卷积层中;根据初始状态的卷积核对所述第一矩阵做卷积运算,得到第一向量;根据所述第二卷积核对所述第一向量做卷积运算,得到第二向量;根据所述第二向量中目标元素的值确定所述训练样本的分类结果,其中,所述第二向量中目标元素的值指示所述第二向量的类别与所述目标元素对应的类别相同的概率大小,其中,所述目标元素是所述第二向量中的任意一个元素;将所述分类结果与每张所述图片的类别进行比较,得到分类误差值;判断所述分类误差值是否大于预设误差值;如果所述分类误差值大于所述预设误差值,对所述初始状态的卷积核的权重值进行调整,直至分类误差值小于等于所述预设误差值;如果所述分类误差值小于等于所述预设误差值,则训练结束,并将当前的卷积核作为所述第一卷积核。进一步地,所述第一卷积核满足如下公式:其中,m为卷积神经网络中输入向量维度,n为输出向量维度,stride为所述第一卷积核的步长,noc为输出通道个数,nconv为所述第一卷积核大小。根据本专利技术实施例的另一方面,还提供了一种图片分类装置,包括:输入单元,用于将待分类的目标图片输入到卷积神经网络的卷积层中,其中,所述卷积神经网络至少包括一个卷积层和一个池化层;第一运算单元,用于根据预先设置的第一卷积核对第一矩阵做卷积运算,得到第一向量,其中,所述第一向量为一维向量,所述第一矩阵是所述卷积神经网络的最后一个池化层的输出;第二运算单元,用于根据预先设置的第二卷积核对所述第一向量做卷积运算,得到第二向量,其中,所述第二向量为一维向量;分类单元,用于根据所述第二向量对所述目标图片进行分类。进一步地,所述第一运算单元包括:第一运算子单元,用于根据所述第一卷积核对所述第一矩阵做卷积运算,得到第二矩阵;排列子单元,用于将所述第二矩阵的所有元素按照预设顺序重新排列,得到所述第一向量。进一步地,所述装置还包括:获取单元,用于在所述第一运算单元根据预先设置的第一卷积核对第一矩阵做卷积运算之前,获取训练样本,其中,所述训练样本包括预先划分好类别的多张图片,所述类别用于表征所述训练样本所指示的事物的种类;训练单元,用于根据所述训练样本对所述卷积神经网络进行训练,得到所述第一卷积核。进一步地,所述训练单元包括:输入子单元,用于将所述训练样本输入到所述卷积神经网络的卷积层中;第二运算子单元,用于根据初始状态的卷积核对所述第一矩阵做卷积运算,得到第一向量;第三运算子单元,用于根据所述第二卷积核对所述第一向量做卷积运算,得到第二向量;第一确定子单元,用于根据所述第二向量中目标元素的值确定所述训练样本的分类结果,其中,所述第二向量中目标元素的值指示所述第二向量的类别与所述目标元素对应的类别相同的概率大小,其中,所述目标元素是所述第二向量中的任意一个元素;比较子单元,用于将所述分类结果与每张所述图片的类别进行比较,得到分类误差值;判断子单元,用于判断所述分类误差值是否大于预设误差值;调整子单元,用于如果所述分类误差值大于所述预设误差值,对所述初始状态的卷积核的权重值进行调整,直至分类误差值小于等于所述预设误差值;第二确定子单元,用于如果所述分类误差值小于等于所述预设误差值,则训练结束,并将当前的卷积核作为所述第一卷积核。进一步地,所述第一卷积核满足如下公式:其中,m为卷积神经网络中输入向量维度,n为输出向量维度,stride为所述第一卷积核的步长,noc为输出通道个数,nconv为所述第一卷积核大小。根据本专利技术实施例的另一方面,还提供了一种机器人,包括:上述图片分类装置。在本专利技术实施例中,目标图片为待分类的图片,将目标图片输入卷积神经网络的卷积层,卷积神经网络的最后一个池化层输出第一矩阵,根据第一卷积核对第一矩阵做卷积运算,得到第一向量,根据第二卷积核对第一向量做卷积运算,得到第二向量,第二向量的各个元素的值能够表示目标图片为某个类别的概率大小,因此,能够通过第二向量对目标图片进行分类,减少了全连接层参数的数量,降低了对终端性能的要求,使得网络能够部署在手机或者其他的一些嵌入式系统上,达到了降低对部署网络的终端性能的要求的技术效果,进而解决了现有技术中全连接层的参数太多导致网络对终端的性能要求较高的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本专利技术的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种图片分类方法的流程图;图2是根据本专利技术实施例的一种图片分类装置的示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一本文档来自技高网
...

【技术保护点】
1.一种图片分类方法,其特征在于,包括:将待分类的目标图片输入到卷积神经网络的卷积层中,其中,所述卷积神经网络至少包括一个卷积层和一个池化层;根据预先设置的第一卷积核对第一矩阵做卷积运算,得到第一向量,其中,所述第一向量为一维向量,所述第一矩阵是所述卷积神经网络的最后一个池化层的输出;根据预先设置的第二卷积核对所述第一向量做卷积运算,得到第二向量,其中,所述第二向量为一维向量;根据所述第二向量对所述目标图片进行分类。

【技术特征摘要】
1.一种图片分类方法,其特征在于,包括:将待分类的目标图片输入到卷积神经网络的卷积层中,其中,所述卷积神经网络至少包括一个卷积层和一个池化层;根据预先设置的第一卷积核对第一矩阵做卷积运算,得到第一向量,其中,所述第一向量为一维向量,所述第一矩阵是所述卷积神经网络的最后一个池化层的输出;根据预先设置的第二卷积核对所述第一向量做卷积运算,得到第二向量,其中,所述第二向量为一维向量;根据所述第二向量对所述目标图片进行分类。2.根据权利要求1所述的方法,其特征在于,根据预先设置的第一卷积核对第一矩阵做卷积运算,得到第一向量包括:根据所述第一卷积核对所述第一矩阵做卷积运算,得到第二矩阵;将所述第二矩阵的所有元素按照预设顺序重新排列,得到所述第一向量。3.根据权利要求1所述的方法,其特征在于,在根据预先设置的第一卷积核对第一矩阵做卷积运算之前,所述方法还包括:获取训练样本,其中,所述训练样本包括预先划分好类别的多张图片,所述类别用于表征所述训练样本所指示的事物的种类;根据所述训练样本对所述卷积神经网络进行训练,得到所述第一卷积核。4.根据权利要求3所述的方法,其特征在于,根据所述训练样本对所述卷积神经网络进行训练,得到所述第一卷积核包括:将所述训练样本输入到所述卷积神经网络的卷积层中;根据初始状态的卷积核对所述第一矩阵做卷积运算,得到第一向量;根据所述第二卷积核对所述第一向量做卷积运算,得到第二向量;根据所述第二向量中目标元素的值确定所述训练样本的分类结果,其中,所述第二向量中目标元素的值指示所述第二向量的类别与所述目标元素对应的类别相同的概率大小,其中,所述目标元素是所述第二向量中的任意一个元素;将所述分类结果与每张所述图片的类别进行比较,得到分类误差值;判断所述分类误差值是否大于预设误差值;如果所述分类误差值大于所述预设误差值,对所述初始状态的卷积核的权重值进行调整,直至分类误差值小于等于所述预设误差值;如果所述分类误差值小于等于所述预设误差值,则训练结束,并将当前的卷积核作为所述第一卷积核。5.根据权利要求1至4任一项所述的方法,其特征在于,所述第一卷积核满足如下公式:其中,m为卷积神经网络中输入向量维度,n为输出向量维度,stride为所述第一卷积核的步长,noc为输出通道个数,nconv为所述第一卷积核大小。6.一种图片分类装置,其特征在于,包括:输入单元,用于将待分类的目标图片输入到卷积神经网络的卷积层中,其中,所述卷积神经网络至少包括一个...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:深圳光启合众科技有限公司深圳光启创新技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1