当前位置: 首页 > 专利查询>天津大学专利>正文

基于判别性字典矩阵对的零样本分类方法技术

技术编号:18942003 阅读:32 留言:0更新日期:2018-09-15 11:22
一种基于判别性字典矩阵对的零样本分类方法:将数据集分为训练样本和测试样本;从训练样本中,选择视觉特征矩阵和类别语义特征矩阵作为输入;计算子编码矩阵;分别重构视觉特征矩阵中的各类的视觉特征矩阵;计算重构误差;按照求得的映射矩阵的闭式解,对映射矩阵的数值进行更新;对字典矩阵的数值进行更新;重复上述过程,直到重构误差达到收敛;求得各测试类别的满足高斯分布的虚拟类别语义特征矩阵;计算各测试样本的虚拟类别语义特征矩阵与训练样本的类别语义特征矩阵间的相似度,得到余弦相似度;计算各测试样本的虚拟样本矩阵;用虚拟样本矩阵训练SVM分类器,使用SVM分类器对测试样本进行分类。本发明专利技术能够更加明确地区分类别之间的异同信息。

Zero sample classification method based on Discriminant dictionary matrix pairs

A zero-sample classification method based on Discriminant dictionary matrix pairs is proposed, which divides the data set into training samples and test samples, selects visual feature matrix and category semantic feature matrix as input from training samples, calculates sub-coding matrix, reconstructs various visual feature matrices in the visual feature matrix, and calculates repetition. Constructional errors; updating the values of the mapping matrix according to the closed-form solution of the obtained mapping matrix; updating the values of the dictionary matrix; repeating the above process until the reconstruction error converges; obtaining the semantic feature matrices of the virtual categories satisfying the Gaussian distribution for each test class; computing the virtual classes of each test sample The cosine similarity is obtained by comparing the similarity between the semantic feature matrix and the class semantic feature matrix of the training samples; the virtual sample matrix of each test sample is calculated; the SVM classifier is trained with the virtual sample matrix, and the test samples are classified with the SVM classifier. The invention can more clearly distinguish the similarities and differences between different regions.

【技术实现步骤摘要】
基于判别性字典矩阵对的零样本分类方法
本专利技术涉及一种零样本分类方法。特别是涉及一种基于判别性字典矩阵对的零样本分类方法.
技术介绍
据粗略估计,人类至少能够识别3000个不同的物体类别。如果利用传统的物体识别技术对同样类别的物体进行识别则需要百万数量级的标注训练样本集,而对数据集进行标注需要大量的时间和人力。为了解决训练样本缺失的问题,零样本学习引起了人们的关注。在没有训练样本的情况下进行物体分类,这个任务叫作零样本学习(Zero-ShotLearning,ZSL)。人类能根据拥有的知识储备,加以类别的描述信息对未知类别的样本进行预测和分类。例如:当描述物体为“有着粗壮的肢干的庞大灰色动物”时,就可以辨认出是大象。受此启发,零样本学习就是利用类别语义信息以及可见类别和未见类别之间的语义关联实现对未见类别样本的分类,使机器学习系统不仅拥有学习归纳的能力还拥有推断的能力。为了实现知识的迁移,表征类别之间的语义关联,常用的类别语义特征有属性特征和文本矢量特征两种。属性特征通常是人为标注的,而文本矢量特征是利用的自然语言处理技术在维基百科等语料库中提取出来的。图像是由视觉空间中的视觉特征表示的,由于语义鸿沟的存在,它不能与语义空间的语义特征直接建立联系。现有方法大多通过可见类别的图像的视觉特征和其相应的类别语义特征,学习从视觉空间到类别语义空间的映射函数。然后,通过该映射函数,将测试样本的视觉特征映射至该类别语义空间,得到预测的类别语义特征,根据最近邻的方法确定测试样本所属类别。字典学习技术是在稀疏编码理论当中的重要最组成部分。具体来讲,就是使用过完备的字典对一个信号稀疏表示。其中过完备的字典中的字典原子就相当于使用的汉语词典中的每个字,我们希望可以在汉语词典中选取最少的字来近似表达一句话的完整意思。将字典学习技术应用在零样本分类当中,即是应用字典D以及其对应的编码系数C对可见类别的视觉特征进行重构。而字典学习技术的解决通常涉及到两个步骤:1)固定一个字典矩阵D,使用稀疏编码方法,求解编码系数C。2)固定已求得的编码系数C,用某种算法更新字典D。其中,由于字典矩阵是过完备的,使其对应的编码系数C存在多种可能。因此,在编码系数C的求解过程中可以利用一定的规则进行约束,求得可以满足零样本分类中知识迁移目的的唯一解。假设在训练阶段有M个类的m个带标签的样本,并且每个样本都同时与一个视觉特征矢量和语义嵌入空间中的一个语义矢量相联系。我们把X=[X1,X2,…XM]∈Rp×m作为在训练阶段使用样本的视觉特征,p是视觉特征的维度,Xk(1≤k≤M)代表第k类的样本。并且我们使用Y∈{0,1}m×M和A=[A1,A2,…AM]∈Rq×M分别代表所有训练样本对应的真实标签矩阵和类别语义特征,Ak(1≤k≤M)代表第k类的类别语义特征。在测试阶段,给出了N个未见类别的n个样本,用Xu∈Rp×n表示,以及未见类别的类别语义特征。零样本分类的目的就是利用由训练样本中学到的知识以及测试样本的视觉特征Xu和类别语义特征Au进行测试样本类别Yu的预测。现存的基于映射的方法主要包括以下步骤:1、利用训练样本的视觉特征X和类别语义特征A训练由视觉空间到类别语义空间的映射关系2、利用训练样本学习到的映射关系f将测试样本的视觉特征映射到类别语义空间,得到测试样本预测的类别语义特征。3、利用预测得到的类别语义特征与测试样本的类别语义特征间的相似度关系,确定测试样本所属类别。通常确定类别使用的判别标准为最近邻方法。然而上述的基于映射的方法存在着以下问题:在计算映射关系的过程中求得的映射函数是针对训练样本整体,并且默认映射函数为f(x)=a,即认为预测的类别语义特征与真实的语义特征是相等的关系。这样不仅忽略了预测的类别语义特征与真实语义特征的细微差别,也使得利用训练样本学习到的映射关系缺少了各个类别之间的异同关系。因此使得学习得到的模型不能很好的拟合不同类别之间的关系,造成信息的缺失。
技术实现思路
本专利技术所要解决的技术问题是,提供一种适合于真实场景下的零样本分类的基于判别性字典矩阵对的零样本分类方法。本专利技术所采用的技术方案是:一种基于判别性字典矩阵对的零样本分类方法,包括如下步骤:1)将数据集分为训练样本和测试样本;2)从训练样本中,选择视觉特征矩阵X=[X1,X2,…,Xi,…,XM]和类别语义特征矩阵A=[A1,A2,…,Ai,…,AM]作为输入;3)计算子编码矩阵Ci:Ci=PiAi+λQAi其中,Pi和Q为采用高斯随机分布函数生成的映射矩阵,λ为设定的权衡Pi和Q两者之间所占比重的参数;4)分别重构视觉特征矩阵中的各类的视觉特征矩阵Xi:Xi=DCi其中,D为采用高斯随机分布函数生成的字典矩阵;5)计算重构误差:其中,γ为设定的权衡第四项和第五项两者之间所占比重的参数;||||2为2范数,||||F为Frobenius范数;dm为字典矩阵D的元素,M为训练样本的类别数;6)按照采用最小二乘法求得的映射矩阵Pi和Q的闭式解:对映射矩阵Pi和Q的数值进行更新,其中,I是单位矩阵;7)采用交替方向乘子算法对字典矩阵D的数值进行更新;8)重复步骤3)~步骤7),直到重构误差达到收敛;9)按照下式求得各测试类别的满足高斯分布的虚拟类别语义特征矩阵Avir:其中,au为测试样本的类别语义特征,为设定的数值;10)使用余弦相似度计算各测试样本的虚拟类别语义特征矩阵Avir与训练样本的类别语义特征矩阵A=[A1,A2,…,Ai,…,AM]间的相似度,得到余弦相似度wij;其中,ai为第i个训练样本的类别语义特征,为虚拟类别语义特征矩阵Avir的第j列;11)按如下公式计算各测试样本的虚拟样本矩阵Xvir:其中,uyj为按降序排列后的余弦相似度,即第y个训练样本的类别语义特征和第j个虚拟类别语义特征间的余弦相似度,k为选择的与第j个虚拟类别语义特征间相似的训练样本的类别语义特征的个数,为与选择的训练样本对应的映射矩阵,为虚拟样本矩阵Xvir的第j列;12)用虚拟样本矩阵Xvir训练SVM分类器,并使用SVM分类器对测试样本进行分类。本专利技术基于判别性字典矩阵对的零样本分类方法,利用字典学习方法学习视觉特征与类别语义特征间的映射关系,更加明确地区分类别之间的异同信息,其优势主要体现在:1、新颖性:首次引入保存异同信息的两个映射矩阵,充分考虑了类别间的差异,并且使用了高斯分布生成虚拟数据用以保证分类的可靠性,设计了适合于真实场景下的零样本分类技术。2、有效性:通过实验证明了与现存的归纳方法相比,本专利技术的方法在性能上有所提高,说明了该专利技术的有效性。3、实用性:本专利技术结构简单,可以较方便地应用图像识别、信息检索等其他领域。附图说明图1是本专利技术基于判别性字典矩阵对的零样本分类方法的流程图。具体实施方式下面结合实施例和附图对本专利技术的基于判别性字典矩阵对的零样本分类方法做出详细说明。本专利技术的基于判别性字典矩阵对的零样本分类方法,假设字典学习技术可以使用字典矩阵D和编码矩阵C对视觉特征X进行重构,并学得不同类别间的辨别信息。本专利技术在此基础上,认为编码矩阵C由具有类辨别性的多个子编码矩阵Ck表示,即C=[C1,C2,…CM](k=1,2,…M),其中M为类的个数。由此本文档来自技高网
...

【技术保护点】
1.一种基于判别性字典矩阵对的零样本分类方法,其特征在于,包括如下步骤:1)将数据集分为训练样本和测试样本;2)从训练样本中,选择视觉特征矩阵X=[X1,X2,…,Xi,…,XM]和类别语义特征矩阵A=[A1,A2,…,Ai,…,AM]作为输入;3)计算子编码矩阵Ci:Ci=PiAi+λQAi其中,Pi和Q为采用高斯随机分布函数生成的映射矩阵,λ为设定的权衡Pi和Q两者之间所占比重的参数;4)分别重构视觉特征矩阵中的各类的视觉特征矩阵Xi:Xi=DCi其中,D为采用高斯随机分布函数生成的字典矩阵;5)计算重构误差:

【技术特征摘要】
1.一种基于判别性字典矩阵对的零样本分类方法,其特征在于,包括如下步骤:1)将数据集分为训练样本和测试样本;2)从训练样本中,选择视觉特征矩阵X=[X1,X2,…,Xi,…,XM]和类别语义特征矩阵A=[A1,A2,…,Ai,…,AM]作为输入;3)计算子编码矩阵Ci:Ci=PiAi+λQAi其中,Pi和Q为采用高斯随机分布函数生成的映射矩阵,λ为设定的权衡Pi和Q两者之间所占比重的参数;4)分别重构视觉特征矩阵中的各类的视觉特征矩阵Xi:Xi=DCi其中,D为采用高斯随机分布函数生成的字典矩阵;5)计算重构误差:其中,γ为设定的权衡第四项和第五项两者之间所占比重的参数;||||2为2范数,||||F为Frobenius范数;dm为字典矩阵D的元素,M为训练样本的类别数;6)按照采用最小二乘法求得的映射矩阵Pi和Q的闭式解:对映射矩阵Pi和Q的数值进行更新,其中,I是单位矩阵;7)采用交替方向乘子算法对字典矩阵...

【专利技术属性】
技术研发人员:冀中王俊月于云龙
申请(专利权)人:天津大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1