用于图像数据分类的设备和方法技术

技术编号:15397042 阅读:68 留言:0更新日期:2017-05-19 11:33
公开一种用于图像数据分类的设备。所述设备可包括:目标码生成器,其被配置成获取多个训练数据样本,并且为每个所获取的训练数据样本生成目标码,其中所述训练数据样本被分组成不同类别,并且所生成的目标码具有与所述类别的数量相同的维度;目标预测生成器,其被配置成接收多个任意数据样本,并且为每个所接收的任意数据样本均生成目标预测;以及预测器,其被配置成基于所述生成的目标码和所生成的目标预测来预测所述接收的任意数据样本中的每个的类别。还公开一种用于图像数据分类的方法。

Apparatus and method for classification of image data

An apparatus for classifying image data is disclosed. The apparatus may include: the target code generator, which is configured to obtain a plurality of training data samples, and obtain the target training data are generated for each of the sample code, wherein the training data samples are grouped into different categories, and the generated object code with the same number of categories and the dimensions of the target; the prediction generator is configured to receive a plurality of arbitrary data, and any data received for each sample were generated target prediction; and predictor, which is configured to generate the target code and the generated target prediction based on prediction of each of the received data samples in arbitrary categories. A method for classifying image data is also disclosed.

【技术实现步骤摘要】
【国外来华专利技术】用于图像数据分类的设备和方法
本申请大体涉及目标识别的领域,更具体地,涉及用于图像数据分类的设备和方法。
技术介绍
学习的鲁棒性和不变表示一直是计算机视觉的长期目标。与诸如SIFT或HoG的手工制作的视觉特征相比,最近已显示,由深度模型学习的特征更能够捕获在视觉世界的各种现象下不变的抽象概念,例如,视点、照明和杂乱。因此,越来越多的研究在探索使用视觉问题的深度表示,尤其是分类任务的深度表示。替代于将深度模型用于直接分类,很多视觉研究选择遵循多级技术。已经显示,这种技术在组合深度特征的良好不变行为和标准分类器的辨别力方面是有效的。通常,它们首先以监督的方式学习深度模型,例如,卷积神经网络。含有长度K的向量的1对K编码(1-of-Kcoding)与用于分类的softmax函数一起使用,其中第k个元素为一而其余的为零。1对K码中的每个元素基本上表示具体类别的概率。随后,从倒数第二层或较浅层中提取原始图像的特征,以形成高维特征向量,作为对诸如SVM的分类器的输入。在神经网络训练中,现有技术通常采用1对K编码方案。然而,由1对K编码训练的神经网络系统中形成的鉴别性隐藏特征是有限的,并且由神经网络系统生成的预测不具有纠错能力。因此,需要在神经网络训练中具有更好表现的更有效目标编码。
技术实现思路
根据本申请的实施例公开了用于数据分类的设备。该设备可包括:目标码生成器,其被配置成获取多个训练数据样本,并且为每个所获取的训练数据样本均生成目标码,其中训练数据样本被分组成不同类别;目标预测生成器,其被配置成接收多个任意数据样本,并且为每个所接收的任意数据样本生成目标预测;以及预测器,其被配置成基于所生成的目标码和所生成的目标预测来预测所接收的任意数据样本中的每个样本的类别。根据本申请的另一实施例公开了用于数据分类的方法。该方法可包括:获取多个训练数据样本,其中训练数据样本被分组成不同类别;为每个所获取的训练数据样本生成目标码;为未分类数据样本生成该未分类数据样本的目标预测;以及基于所生成的目标码和所生成的目标预测来预测该未分类数据样本的类别本专利技术为神经网络训练带来额外的有益效果。一方面,可在神经网络系统中形成更多的鉴别性隐藏特征。另一方面,由神经网络系统生成的预测具有纠错能力。附图说明下文参考附图描述本专利技术的示例性非限制实施例。附图是说明性的,并且一般不按确切比例。不同图上的相同或类似元件引用相同的附图标号。图1是示出根据本申请的实施例的用于图像数据分类的设备的示意图。图2是示出根据本申请的实施例的目标码生成器的示意图。图3是示出根据本申请的另一实施例的具有训练单元的设备的示意图。图4是示出根据本申请的另一实施例的训练单元的示意图。图5是示出根据本申请的实施例的预测器的示意图。图6是示出根据本申请的另一实施例的训练单元的示意图。图7是示出根据本申请的另一实施例的预测器的示意图。图8是示出根据本申请的实施例的用于图像数据分类的方法的示意流程图。图9是示出根据本申请的实施例的用于生成目标码的过程的示意流程图。图10是示出根据本申请的实施例的用于训练神经网络系统的过程的示意流程图。图11是示出根据本申请的实施例的用于预测未分类数据样本的类别的过程的示意流程图。图12是示出根据本申请的另一实施例的用于训练神经网络系统的过程的示意流程图。图13是示出根据本申请的另一实施例的用于预测未分类数据样本的类别的过程的示意流程图。具体实施方式本部分将详细说明示例性实施例,这些实施例的实例将在附图中说明。在合适的情况下,附图中相同的附图标号始终指代相同或相似部分。图1是示出符合一些公开实施例的用于数据分类的示例性设备1000的示意图。应了解,设备1000可使用某一硬件、软件或它们的组合来实施。此外,本申请的实施例可适合于体现在一个或多个计算机可读存储介质(包括但不限于,磁盘存储器、CD-ROM、光学存储器等)上的计算机程序产品,所述计算机可读存储介质含有计算机程序码。在用软件实施设备1000的情况下,设备1000可在一个或多个系统中运行,该系统可包括通用计算机、计算机集群、主流计算机、专用于提供在线内容的计算装置或者包括一组以集中或分布方式操作的计算机的计算机网络。再次参考图1,在设备1000由硬件或者硬件和软件的组合实施的情况下,它可包括目标码生成器100、神经网络系统200和预测器300。在图1所示的实施例中,目标码生成器100可被配置成获取多个训练数据样本,并且为每个所获取的训练数据样本均生成目标码,其中训练数据样本被分组成不同类别。目标预测生成器200可被配置成接收多个任意数据样本,并且为每个所接收的任意数据样本均生成目标预测。在一些实施例中,目标预测生成器200可包括神经网络系统。在一些实施例中,神经网络系统可包括深度信念网络和卷积网络中的至少一个。例如,神经网络可包括卷积滤波器、池化层以及局部连接层或全连接层,这些是本领域中公知的,因此,本文中省略它们的详细配置。预测器300可被配置成基于所生成的目标码和所生成的目标预测来预测所接收的任意数据样本中的每个样本的类别。在下文中,将描述目标码(或目标编码)的定义。令T为整数的集合,称为字母集(alphabetset)。T中的元素被称为符号。例如,T={0,1}是二进制字母集。目标码S是矩阵S∈Tn×l,其中目标码的每一行被称为码字,l表示每个码字中的符号的数量,并且n表示码字的总数量。目标码可使用基于哈达玛(Hadamard)矩阵建立的确定性方法进行构建。针对目标码S,令表示S的行中的符号的经验分布的集合,即,针对i=1、2、…、n,αi是长度|T|的向量,其中αi的第t个分量计算S的第i行中的第t个符号出现的次数。类似地,令为S的列中的符号的经验分布的集合。在给定两个不同行索引i和i'的情况下,将目标码S的行i与行i'之间的汉明距离定义为即,用于计算列索引的数量,从而使得行i与行i'中的对应符号不相等。为简单起见,称之为成对汉明距离。表1示出1对K目标码的实例,其通常用在深度学习中表示K个类别。K个符号中的每个(‘0’或‘1’)表示具体类别的概率。在这里,目标码可写成S=I,其中I∈TK×K是单位矩阵。容易实现1对K编码的一些性质。例如,针对i=1、2、……、K,得到和因为每个码字中只有一个符号具有值‘1’。类似地,得到和成对汉明距离是二。表1替代于表示类别,目标编码可起到额外的作用,诸如,纠错或有助于更好的特征表示。为了实现额外的作用,应构建满足具体要求的目标码S。下文中将介绍好的目标码应满足的具体要求。一般而言,具体要求可总结成三方面:每一列的一致性、每一行的冗余,以及不变的成对汉明距离。在下文中,将基于上述要求来描述如何生成如表2所示的目标码,该目标码也被视作表示为SBC的平衡码(BC)。表2如图2所示,目标码生成器100还包括矩阵生成模块110、移除模块120、改变模块130和选择模块140。目标码生成器100被配置成生成哈达玛矩阵,其中哈达玛矩阵的元素是“+1”或“-1”,并且哈达玛矩阵的维度大于训练数据样本的类别的数量。具体而言,针对元素为‘+1’或‘-1’的正方形m×m矩阵H,如果HHT=mI,那么这个矩阵被称为哈达玛矩阵。在一些实施例中,可以使用‘+’表示本文档来自技高网...
用于图像数据分类的设备和方法

【技术保护点】
一种用于图像数据分类的设备,包括:目标码生成器,其被配置成获取多个训练数据样本,并且为每个所获取训练数据样本均生成目标码,其中所述训练数据样本被分组成不同类别;目标预测生成器,其被配置成接收多个任意数据样本,并且为每个所接收的任意数据样本均生成目标预测;以及预测器,其被配置成基于所生成的目标码和所生成的目标预测来预测所接收的任意数据样本中的每个的类别。

【技术特征摘要】
【国外来华专利技术】1.一种用于图像数据分类的设备,包括:目标码生成器,其被配置成获取多个训练数据样本,并且为每个所获取训练数据样本均生成目标码,其中所述训练数据样本被分组成不同类别;目标预测生成器,其被配置成接收多个任意数据样本,并且为每个所接收的任意数据样本均生成目标预测;以及预测器,其被配置成基于所生成的目标码和所生成的目标预测来预测所接收的任意数据样本中的每个的类别。2.根据权利要求1所述的设备,其中所述目标码生成器还包括:矩阵生成模块,其被配置成生成哈达玛矩阵,其中所述哈达玛矩阵的元素是“+1”或“-1”,并且所述哈达玛矩阵的维度大于所述训练数据样本的类别的数量;移除模块,其被配置成移除所述哈达玛矩阵的第一行和第一列;改变模块,其被配置成将所述哈达玛矩阵中的“+1”和“-1”分别改变成“0”和“1”;以及选择模块,其被配置成随机选择已改变的哈达玛矩阵的多个行作为所述目标码,其中所选择的行的数量与所述训练数据样本的所述类别的数量相同,并且所述选择的行中的每行均对应于一个目标码。3.根据权利要求2所述的设备,其中所述预测生成器包括神经网络系统,并且其中所述设备还包括:训练单元,其被配置成使用所获取的训练数据样本来训练所述神经网络系统,从而使得所训练的神经网络系统能够生成所述目标预测。4.根据权利要求3所述的设备,其中所述目标码是标定真实目标码。5.根据权利要求4所述的设备,其中所述训练单元还包括:取得模块,其被配置成从多个所述训练数据样本中取得一个训练数据样本,其中所述训练数据样本中的每个样本与对应的标定真实目标码相关联;误差计算模块,其被配置成计算为所述训练数据样本生成的目标预测与所述标定真实目标码之间的误差;以及反向传播模块,其被配置成将所计算的误差反向传播通过所述神经网络系统,以调整所述神经网络系统的神经元之间的连接的权重,其中,所述取得模块、所述误差计算模块和所述反向传播模块重复所述取得、所述计算和所述反向传播的过程,直到所述误差小于预定值。6.根据权利要求5所述的设备,其中所述预测器还被配置成包括:接收模块,其被配置成接收未分类数据样本;距离计算模块,其被配置成计算未分类数据样本的目标预测与各类所述训练样本的对应标定真实目标码之间的汉明距离;以及分配模块,其被配置成将所述未分类数据样本分配到与所计算的汉明距离之中的最小汉明距离对应的类别。7.根据权利要求4所述的设备,其中所述训练单元还包括:取得模块,其被配置成从所述训练数据样本中取得一个训练数据样本,其中所述训练数据样本中的每个样本与对应的标定真实目标码相关联;误差计算模块,其被配置成计算为所述训练数据样本生成的目标预测与所述标定真实目标码之间的误差;反向传播模块,其被配置成将所计算的误差反向传播通过所述神经网络系统,以调整所述神经网络系统的神经元之间的连接的权重;以及提取模块,其被配置成在所述误差小于预定值之后,从所述神经网络系统的倒数第二层中提取隐藏层特征,并且基于所提取的隐藏层特征和所述训练数据样本的类别标签来训练多类分类器,其中所述取得模块、所述误差计算模块和所述反向传播模块重复所述取得、所述计算和所述反向传播的过程,直到所述误差小于预定值。8.根据权利要求5或7所述的设备,其中所述误差是汉明距离。9.根据权利要求7所述的设备,其中所述预测器还包括:...

【专利技术属性】
技术研发人员:汤晓鸥杨硕罗平吕健勤
申请(专利权)人:北京市商汤科技开发有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1