一种基于卷积神经网络和因素空间的零样本图像分类方法及系统技术方案

技术编号：20623810 阅读：28 留言：0更新日期：2019-03-20 14:59

本发明专利技术提出一种基于卷积神经网络和因素空间的零样本图像分类方法及系统，构建一个统一的零样本分类神经网络，首先利用一个经典卷积神经网络提取数据集中的图像特征，作为神经网络的输入；使用因素压减技术降低已知因素的维度，并将已知因素和潜在因素嵌入到网络中，作为中间层共同决定最终的分类结果；该网络实现了从图像输入到最终的类别输出。训练零样本分类网络，迭代确定网络模型参数。利用零样本分类神经网络对图像进行识别，完成零样本图像的分类。本发明专利技术用一个卷积神经网络模型统一处理了视觉空间、因素空间和类别空间之间的关系，解决了特定的线性或非线性函数表达泛化能力不强的问题，把作为辅助知识的因素嵌入到网络中，易于理解、训练和使用。

A Zero Sample Image Classification Method and System Based on Convolutional Neural Network and Factor Space

The invention proposes a zero-sample image classification method and system based on convolution neural network and factor space, and constructs a unified zero-sample classification neural network. Firstly, a classical convolution neural network is used to extract image features from data sets as input of the neural network. Factor reduction technology is used to reduce the dimension of known factors and potential factors. Embedded in the network, as the middle layer jointly decides the final classification results; the network achieves the final classification output from image input. The zero sample classification network is trained and the parameters of the network model are determined iteratively. The zero-sample classification neural network is used to recognize the image and complete the classification of the zero-sample image. The present invention uses a convolutional neural network model to deal with the relationship among visual space, factor space and category space, solves the problem of weak generalization ability of specific linear or non-linear functions, and embeds the factors as auxiliary knowledge into the network, which is easy to understand, train and use.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于卷积神经网络和因素空间的零样本图像分类方法及系统
本专利技术涉及一种基于卷积神经网络和因素空间的零样本图像分类方法及系统，属于图像识别

技术介绍
在大规模可用数据集的支撑下，计算机视觉中的物体识别算法近几年来取得了突破性的进展。但是人工收集和标注数据是一项十分耗时耗力的工作，特别是对于一些罕见物体的图像或者相似物体的分类中，需要专家来区分不同的类别。在没有训练数据的情况下，一般的方法很难进行正确识别，这时的视觉识别问题通常叫做零样本分类或者零样本学习。零样本分类问题中，训练集中都是有类别标签标注的图像数据(又叫可见类)，测试集中有部分数据并未出现在训练集中(又叫不可见类)，但是却同样要进行这些不可见类物体的识别。例如，模型在“马”、“牛”等类别上训练过，因此模型能够识别“马”、“牛”的图片，当模型遇到“象”这个新类别时，零样本分类也要能够识别。在没有任何图像训练样本的情况下，零样本分类通常借助辅助知识空间来关联图像视觉空间和类别空间，这些辅助知识可以是词向量、文本描述、语义向量等。辅助知识空间作为一个视觉空间和类别空间的中间层、公共空间，分别与视觉空间和类别空间构成一个不同的映射，从而实现知识的共享和迁移。比如，通过语义向量标识的辅助知识实现类别描述，可以将可见类与不可见类联系起来，语义向量作为图像与类别标签之间的中间层。在利用辅助知识获取合适的类别描述后，现有的零样本分类研究主要集中在：建立合适的模型，用来表达辅助知识空间与图像视觉空间、辅助知识空间与类别空间的关系。现有技术通常通过假定特定的线性或非线性函数来表达这些模型，这种特定线性...

【技术保护点】
1.一种基于卷积神经网络和因素空间的零样本图像分类方法，其特征在于步骤如下：(1)构建零样本分类神经网络；(2)对所述零样本分类神经网络进行训练，确定网络模型参数；(3)通过所述零样本分类神经网络对零样本图像进行识别，完成零样本图像的分类。

【技术特征摘要】
1.一种基于卷积神经网络和因素空间的零样本图像分类方法，其特征在于步骤如下：(1)构建零样本分类神经网络；(2)对所述零样本分类神经网络进行训练，确定网络模型参数；(3)通过所述零样本分类神经网络对零样本图像进行识别，完成零样本图像的分类。2.根据权利要求1所述的一种基于卷积神经网络和因素空间的零样本图像分类方法，其特征在于：所述零样本是指在神经网络训练中，部分待识别的图像没有样本。3.根据权利要求1所述的一种基于卷积神经网络和因素空间的零样本图像分类方法，其特征在于：所述步骤(1)构建零样本分类神经网络，具体为：(1.1)将m类训练集trainX的图像输入经典卷积网络的特征提取层，对图像进行特征提取；图像集包括训练集trainX和测试集testX，图像集包含m+n类，均有对应的类别标签，其中训练集trainX包含m类，测试集testX包含m+n类，其中，n类为在训练集中没有出现图像样本的类别；(1.2)将提取出的特征θ(x)乘以权重矩阵W(11)和W(12)作为Net1层的输入，经过激活函数之后得到Net1层的输出；Net1层是因素分类层，其输出分为已知因素和潜在因素；其中，已知因素是指s维的语义向量特征，对于图像集中的m+n类，其s维的语义向量特征均已知；潜在因素是指在训练过程中，除已知因素以外、对分类结果有影响的其他因素；(1.3)将Net1层的输出乘以权重矩阵W(21)和W(22)作为Net2层的输入，经过激活函数之后得到Net2层的输出；(1.4)将Net2层的输出乘以权重矩阵W(3)作为Net3层的输入，经过softmax函数得到Net3层的输出，即分类结果，从而完成构建零样本分类神经网络。4.根据权利要求3所述的一种基于卷积神经网络和因素空间的零样本图像分类方法，其特征在于：对m类训练集trainX的图像进行预处理，将图像样本裁剪成统一大小。5.根据权利要求3所述的一种基于卷积神经网络和因素空间的零样本图像分类方法，其特征在...

【专利技术属性】
技术研发人员：程奇峰，代京，李旗挺，雍颖琼，王振亚，袁本立，王琳娜，宋盛菊，阳佳，张宏江，刘冬，杜立超，康磊晶，李一帆，宁学，
申请(专利权)人：中国运载火箭技术研究院，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人