用于图像数据分类的设备和方法技术

技术编号：15397042 阅读：68 留言：0更新日期：2017-05-19 11:33

公开一种用于图像数据分类的设备。所述设备可包括：目标码生成器，其被配置成获取多个训练数据样本，并且为每个所获取的训练数据样本生成目标码，其中所述训练数据样本被分组成不同类别，并且所生成的目标码具有与所述类别的数量相同的维度；目标预测生成器，其被配置成接收多个任意数据样本，并且为每个所接收的任意数据样本均生成目标预测；以及预测器，其被配置成基于所述生成的目标码和所生成的目标预测来预测所述接收的任意数据样本中的每个的类别。还公开一种用于图像数据分类的方法。

Apparatus and method for classification of image data

An apparatus for classifying image data is disclosed. The apparatus may include: the target code generator, which is configured to obtain a plurality of training data samples, and obtain the target training data are generated for each of the sample code, wherein the training data samples are grouped into different categories, and the generated object code with the same number of categories and the dimensions of the target; the prediction generator is configured to receive a plurality of arbitrary data, and any data received for each sample were generated target prediction; and predictor, which is configured to generate the target code and the generated target prediction based on prediction of each of the received data samples in arbitrary categories. A method for classifying image data is also disclosed.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于图像数据分类的设备和方法
本申请大体涉及目标识别的领域，更具体地，涉及用于图像数据分类的设备和方法。
技术介绍
学习的鲁棒性和不变表示一直是计算机视觉的长期目标。与诸如SIFT或HoG的手工制作的视觉特征相比，最近已显示，由深度模型学习的特征更能够捕获在视觉世界的各种现象下不变的抽象概念，例如，视点、照明和杂乱。因此，越来越多的研究在探索使用视觉问题的深度表示，尤其是分类任务的深度表示。替代于将深度模型用于直接分类，很多视觉研究选择遵循多级技术。已经显示，这种技术在组合深度特征的良好不变行为和标准分类器的辨别力方面是有效的。通常，它们首先以监督的方式学习深度模型，例如，卷积神经网络。含有长度K的向量的1对K编码(1-of-Kcoding)与用于分类的softmax函数一起使用，其中第k个元素为一而其余的为零。1对K码中的每个元素基本上表示具体类别的概率。随后，从倒数第二层或较浅层中提取原始图像的特征，以形成高维特征向量，作为对诸如SVM的分类器的输入。在神经网络训练中，现有技术通常采用1对K编码方案。然而，由1对K编码训练的神经网络系统中形成的鉴别性隐藏特征是有限的，并且由神经网络系统生成的预测不具有纠错能力。因此，需要在神经网络训练中具有更好表现的更有效目标编码。
技术实现思路
根据本申请的实施例公开了用于数据分类的设备。该设备可包括：目标码生成器，其被配置成获取多个训练数据样本，并且为每个所获取的训练数据样本均生成目标码，其中训练数据样本被分组成不同类别；目标预测生成器，其被配置成接收多个任意数据样本，并且为每个所接收的任意数据样本生成目标预测；以及预...
用于图像数据分类的设备和方法

【技术保护点】
一种用于图像数据分类的设备，包括：目标码生成器，其被配置成获取多个训练数据样本，并且为每个所获取训练数据样本均生成目标码，其中所述训练数据样本被分组成不同类别；目标预测生成器，其被配置成接收多个任意数据样本，并且为每个所接收的任意数据样本均生成目标预测；以及预测器，其被配置成基于所生成的目标码和所生成的目标预测来预测所接收的任意数据样本中的每个的类别。

【技术特征摘要】
【国外来华专利技术】1.一种用于图像数据分类的设备，包括：目标码生成器，其被配置成获取多个训练数据样本，并且为每个所获取训练数据样本均生成目标码，其中所述训练数据样本被分组成不同类别；目标预测生成器，其被配置成接收多个任意数据样本，并且为每个所接收的任意数据样本均生成目标预测；以及预测器，其被配置成基于所生成的目标码和所生成的目标预测来预测所接收的任意数据样本中的每个的类别。2.根据权利要求1所述的设备，其中所述目标码生成器还包括：矩阵生成模块，其被配置成生成哈达玛矩阵，其中所述哈达玛矩阵的元素是“+1”或“-1”，并且所述哈达玛矩阵的维度大于所述训练数据样本的类别的数量；移除模块，其被配置成移除所述哈达玛矩阵的第一行和第一列；改变模块，其被配置成将所述哈达玛矩阵中的“+1”和“-1”分别改变成“0”和“1”；以及选择模块，其被配置成随机选择已改变的哈达玛矩阵的多个行作为所述目标码，其中所选择的行的数量与所述训练数据样本的所述类别的数量相同，并且所述选择的行中的每行均对应于一个目标码。3.根据权利要求2所述的设备，其中所述预测生成器包括神经网络系统，并且其中所述设备还包括：训练单元，其被配置成使用所获取的训练数据样本来训练所述神经网络系统，从而使得所训练的神经网络系统能够生成所述目标预测。4.根据权利要求3所述的设备，其中所述目标码是标定真实目标码。5.根据权利要求4所述的设备，其中所述训练单元还包括：取得模块，其被配置成从多个所述训练数据样本中取得一个训练数据样本，其中所述训练数据样本中的每个样本与对应的标定真实目标码相关联；误差计算模块，其被配置成计算为所述训练数据样本生成的目标预测与所述标定真实目标码之间的误差；以及反向传播模块，其被配置成将所计算的误差反向传播通过所述神经网络系统，以调整所述神经网络系统的神经元之间的连接的权重，其中，所述取得模块、所述误差计算模块和所述反向传播模块重复所述取得、所述计算和所述反向传播的过程，直到所述误差小于预定值。6.根据权利要求5所述的设备，其中所述预测器还被配置成包括：接收模块，其被配置成接收未分类数据样本；距离计算模块，其被配置成计算未分类数据样本的目标预测与各类所述训练样本的对应标定真实目标码之间的汉明距离；以及分配模块，其被配置成将所述未分类数据样本分配到与所计算的汉明距离之中的最小汉明距离对应的类别。7.根据权利要求4所述的设备，其中所述训练单元还包括：取得模块，其被配置成从所述训练数据样本中取得一个训练数据样本，其中所述训练数据样本中的每个样本与对应的标定真实目标码相关联；误差计算模块，其被配置成计算为所述训练数据样本生成的目标预测与所述标定真实目标码之间的误差；反向传播模块，其被配置成将所计算的误差反向传播通过所述神经网络系统，以调整所述神经网络系统的神经元之间的连接的权重；以及提取模块，其被配置成在所述误差小于预定值之后，从所述神经网络系统的倒数第二层中提取隐藏层特征，并且基于所提取的隐藏层特征和所述训练数据样本的类别标签来训练多类分类器，其中所述取得模块、所述误差计算模块和所述反向传播模块重复所述取得、所述计算和所述反向传播的过程，直到所述误差小于预定值。8.根据权利要求5或7所述的设备，其中所述误差是汉明距离。9.根据权利要求7所述的设备，其中所述预测器还包括：...

【专利技术属性】
技术研发人员：汤晓鸥，杨硕，罗平，吕健勤，
申请(专利权)人：北京市商汤科技开发有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人