基于判别性字典矩阵对的零样本分类方法技术

技术编号：18942003 阅读：43 留言：0更新日期：2018-09-15 11:22

一种基于判别性字典矩阵对的零样本分类方法：将数据集分为训练样本和测试样本；从训练样本中，选择视觉特征矩阵和类别语义特征矩阵作为输入；计算子编码矩阵；分别重构视觉特征矩阵中的各类的视觉特征矩阵；计算重构误差；按照求得的映射矩阵的闭式解，对映射矩阵的数值进行更新；对字典矩阵的数值进行更新；重复上述过程，直到重构误差达到收敛；求得各测试类别的满足高斯分布的虚拟类别语义特征矩阵；计算各测试样本的虚拟类别语义特征矩阵与训练样本的类别语义特征矩阵间的相似度，得到余弦相似度；计算各测试样本的虚拟样本矩阵；用虚拟样本矩阵训练SVM分类器，使用SVM分类器对测试样本进行分类。本发明专利技术能够更加明确地区分类别之间的异同信息。

Zero sample classification method based on Discriminant dictionary matrix pairs

A zero-sample classification method based on Discriminant dictionary matrix pairs is proposed, which divides the data set into training samples and test samples, selects visual feature matrix and category semantic feature matrix as input from training samples, calculates sub-coding matrix, reconstructs various visual feature matrices in the visual feature matrix, and calculates repetition. Constructional errors; updating the values of the mapping matrix according to the closed-form solution of the obtained mapping matrix; updating the values of the dictionary matrix; repeating the above process until the reconstruction error converges; obtaining the semantic feature matrices of the virtual categories satisfying the Gaussian distribution for each test class; computing the virtual classes of each test sample The cosine similarity is obtained by comparing the similarity between the semantic feature matrix and the class semantic feature matrix of the training samples; the virtual sample matrix of each test sample is calculated; the SVM classifier is trained with the virtual sample matrix, and the test samples are classified with the SVM classifier. The invention can more clearly distinguish the similarities and differences between different regions.

全部详细技术资料下载

【技术实现步骤摘要】
基于判别性字典矩阵对的零样本分类方法
本专利技术涉及一种零样本分类方法。特别是涉及一种基于判别性字典矩阵对的零样本分类方法.
技术介绍
据粗略估计，人类至少能够识别3000个不同的物体类别。如果利用传统的物体识别技术对同样类别的物体进行识别则需要百万数量级的标注训练样本集，而对数据集进行标注需要大量的时间和人力。为了解决训练样本缺失的问题，零样本学习引起了人们的关注。在没有训练样本的情况下进行物体分类，这个任务叫作零样本学习(Zero-ShotLearning，ZSL)。人类能根据拥有的知识储备，加以类别的描述信息对未知类别的样本进行预测和分类。例如：当描述物体为“有着粗壮的肢干的庞大灰色动物”时，就可以辨认出是大象。受此启发，零样本学习就是利用类别语义信息以及可见类别和未见类别之间的语义关联实现对未见类别样本的分类，使机器学习系统不仅拥有学习归纳的能力还拥有推断的能力。为了实现知识的迁移，表征类别之间的语义关联，常用的类别语义特征有属性特征和文本矢量特征两种。属性特征通常是人为标注的，而文本矢量特征是利用的自然语言处理技术在维基百科等语料库中提取出来的。图像是由...

【技术保护点】
1.一种基于判别性字典矩阵对的零样本分类方法，其特征在于，包括如下步骤：1)将数据集分为训练样本和测试样本；2)从训练样本中，选择视觉特征矩阵X＝[X1,X2,…,Xi,…,XM]和类别语义特征矩阵A＝[A1,A2,…,Ai,…,AM]作为输入；3)计算子编码矩阵Ci：Ci＝PiAi+λQAi其中，Pi和Q为采用高斯随机分布函数生成的映射矩阵，λ为设定的权衡Pi和Q两者之间所占比重的参数；4)分别重构视觉特征矩阵中的各类的视觉特征矩阵Xi：Xi＝DCi其中，D为采用高斯随机分布函数生成的字典矩阵；5)计算重构误差：

【技术特征摘要】
1.一种基于判别性字典矩阵对的零样本分类方法，其特征在于，包括如下步骤：1)将数据集分为训练样本和测试样本；2)从训练样本中，选择视觉特征矩阵X＝[X1,X2,…,Xi,…,XM]和类别语义特征矩阵A＝[A1,A2,…,Ai,…,AM]作为输入；3)计算子编码矩阵Ci：Ci＝PiAi+λQAi其中，Pi和Q为采用高斯随机分布函数生成的映射矩阵，λ为设定的权衡Pi和Q两者之间所占比重的参数；4)分别重构视觉特征矩阵中的各类的视觉特征矩阵Xi：Xi＝DCi其中，D为采用高斯随机分布函数生成的字典矩阵；5)计算重构误差：其中，γ为设定的权衡第四项和第五项两者之间所占比重的参数；||||2为2范数，||||F为Frobenius范数；dm为字典矩阵D的元素，M为训练样本的类别数；6)按照采用最小二乘法求得的映射矩阵Pi和Q的闭式解：对映射矩阵Pi和Q的数值进行更新，其中，I是单位矩阵；7)采用交替方向乘子算法对字典矩阵...

【专利技术属性】
技术研发人员：冀中，王俊月，于云龙，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人