基于多组间因子分析的零样本图像分类方法技术

技术编号：15087585 阅读：34 留言：0更新日期：2017-04-07 17:19

一种基于多组间因子分析的零样本图像分类方法，包括：使用训练数据的视觉特征及其相应类别的语义特征构建协方差矩阵；求解协方差矩阵的特征值，选择最大的d个特征值对应的d维特征向量作为映射矩阵；在验证集中学习得到下式中的权重；使用映射矩阵，将测试数据的视觉特征和未见过的类别的语义特征映射至公共空间；对测试数据进行分类。本发明专利技术能够寻求图像的视觉特征与多个模态的语义特征之间的公共空间，其在零样本图像分类中可以取得更高的准确率，因此是一种有效的零样本图像分类方法，本发明专利技术的方法简单易行，效果优良。除了零样本图像分类问题，同时也能适应其他的多模态分类、检索问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种实现零样本图像分类的方法。特别是涉及一种通过多组间因子分析方法，建立图像的视觉空间与图像类别的语义空间之间的联系，从而实现零样本图像分类的基于多组间因子分析的零样本图像分类方法。
技术介绍
对于传统的图像分类系统，要想准确识别出某类图像，必须给出相应的带标签的训练数据。但训练数据的标签往往是难以获得的，零样本图像分类就是解决类别标签缺失问题的一种有效手段，其目的在于模仿人类无需看过实际视觉样例，就能认出新的类别的能力。零样本图像分类系统通过有标签的训练数据，也就是已经见过的类别，在视觉空间和语义空间之间建立映射关系。然后根据这个映射关系，将测试数据的视觉特征与未见过的类别的语义特征相联系，选择语义最接近的类别作为测试数据的标签。在零样本图像分类中，对于未见过的类别的测试图像和相应的类别名称，需要借助语义空间建立联系。在语义空间中，每一个类别名称都被表示成一个高维向量。早期工作中，这个语义空间通常是基于属性的，于是每个类别名称就能表示成一个属性向量。例如Lampert等人对50类动物图像标注了85个语义属性，比如对象的颜色、形状等，用其作为高级语义描述方式。近年来，随着自然语言处理技术的发展，基于文本矢量的语义空间逐渐流行。常用的文本矢量提取方法是Mikolov等人提出的Word2Vec，它是一种无监督的方法，可以将语料库中的单词用向量来表示，并且向量之间的相似度可以很好的反映单词语义上的相似度。在给定的语义空间中求得已见过的和未见过的类别的语义特征向量后，各类别间的语义相关性就可以由语义特...

【技术保护点】
一种基于多组间因子分析的零样本图像分类方法，其特征在于，包括如下步骤：1)使用训练数据的视觉特征X1及其相应类别的语义特征X2,...Xc构建协方差矩阵M；2)求解协方差矩阵M的特征值，选择最大的d个特征值对应的d维特征向量作为映射矩阵W；3)在验证集中学习得到下式中的权重αik*=argmaxk[Σi=2cαisim(W1Txj,WiTyik)],---(4)]]>k＝1,2,...,n.式中，xj是验证数据的视觉特征，是与xj相对应类别的第k个模态的语义特征，sim(a,b)＝aTb/(||a||·||b||)，为两个向量的距离；4)使用映射矩阵W，将测试数据的视觉特征和未见过的类别的语义特征yk映射至公共空间；5)用步骤3)中的公式对测试数据进行分类，式中的k*是测试数据相应的类别。

【技术特征摘要】
1.一种基于多组间因子分析的零样本图像分类方法，其特征在于，包括如下步骤：
1)使用训练数据的视觉特征X1及其相应类别的语义特征X2,...Xc构建协方差矩阵M；
2)求解协方差矩阵M的特征值，选择最大的d个特征值对应的d维特征向量作为映射
矩阵W；
3)在验证集中学习得到下式中的权重αik*=argmaxk[Σi=2cαisim(W1Txj,WiTyik)],---(4)]]>k＝1,2,...,n.
式中，xj是验证数据的视觉特征，是与xj相对应类别的第k个模态的语义特征，
sim(a,b)＝aTb/(||a||·||b||)，为两个向量的距离；
4)使用映射矩阵W，将测试数据的视觉特征和未见过的类别的语义特征yk映射至公
共空间；
5)用步骤3)中的公式对测试...

【专利技术属性】
技术研发人员：冀中，谢于中，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人