A zero-sample classification method based on Discriminant dictionary matrix pairs is proposed, which divides the data set into training samples and test samples, selects visual feature matrix and category semantic feature matrix as input from training samples, calculates sub-coding matrix, reconstructs various visual feature matrices in the visual feature matrix, and calculates repetition. Constructional errors; updating the values of the mapping matrix according to the closed-form solution of the obtained mapping matrix; updating the values of the dictionary matrix; repeating the above process until the reconstruction error converges; obtaining the semantic feature matrices of the virtual categories satisfying the Gaussian distribution for each test class; computing the virtual classes of each test sample The cosine similarity is obtained by comparing the similarity between the semantic feature matrix and the class semantic feature matrix of the training samples; the virtual sample matrix of each test sample is calculated; the SVM classifier is trained with the virtual sample matrix, and the test samples are classified with the SVM classifier. The invention can more clearly distinguish the similarities and differences between different regions.
【技术实现步骤摘要】
基于判别性字典矩阵对的零样本分类方法
本专利技术涉及一种零样本分类方法。特别是涉及一种基于判别性字典矩阵对的零样本分类方法.
技术介绍
据粗略估计,人类至少能够识别3000个不同的物体类别。如果利用传统的物体识别技术对同样类别的物体进行识别则需要百万数量级的标注训练样本集,而对数据集进行标注需要大量的时间和人力。为了解决训练样本缺失的问题,零样本学习引起了人们的关注。在没有训练样本的情况下进行物体分类,这个任务叫作零样本学习(Zero-ShotLearning,ZSL)。人类能根据拥有的知识储备,加以类别的描述信息对未知类别的样本进行预测和分类。例如:当描述物体为“有着粗壮的肢干的庞大灰色动物”时,就可以辨认出是大象。受此启发,零样本学习就是利用类别语义信息以及可见类别和未见类别之间的语义关联实现对未见类别样本的分类,使机器学习系统不仅拥有学习归纳的能力还拥有推断的能力。为了实现知识的迁移,表征类别之间的语义关联,常用的类别语义特征有属性特征和文本矢量特征两种。属性特征通常是人为标注的,而文本矢量特征是利用的自然语言处理技术在维基百科等语料库中提取出来的。图像是由视觉空间中的视觉特征表示的,由于语义鸿沟的存在,它不能与语义空间的语义特征直接建立联系。现有方法大多通过可见类别的图像的视觉特征和其相应的类别语义特征,学习从视觉空间到类别语义空间的映射函数。然后,通过该映射函数,将测试样本的视觉特征映射至该类别语义空间,得到预测的类别语义特征,根据最近邻的方法确定测试样本所属类别。字典学习技术是在稀疏编码理论当中的重要最组成部分。具体来讲,就是使用过完备的字典对 ...
【技术保护点】
1.一种基于判别性字典矩阵对的零样本分类方法,其特征在于,包括如下步骤:1)将数据集分为训练样本和测试样本;2)从训练样本中,选择视觉特征矩阵X=[X1,X2,…,Xi,…,XM]和类别语义特征矩阵A=[A1,A2,…,Ai,…,AM]作为输入;3)计算子编码矩阵Ci:Ci=PiAi+λQAi其中,Pi和Q为采用高斯随机分布函数生成的映射矩阵,λ为设定的权衡Pi和Q两者之间所占比重的参数;4)分别重构视觉特征矩阵中的各类的视觉特征矩阵Xi:Xi=DCi其中,D为采用高斯随机分布函数生成的字典矩阵;5)计算重构误差:
【技术特征摘要】
1.一种基于判别性字典矩阵对的零样本分类方法,其特征在于,包括如下步骤:1)将数据集分为训练样本和测试样本;2)从训练样本中,选择视觉特征矩阵X=[X1,X2,…,Xi,…,XM]和类别语义特征矩阵A=[A1,A2,…,Ai,…,AM]作为输入;3)计算子编码矩阵Ci:Ci=PiAi+λQAi其中,Pi和Q为采用高斯随机分布函数生成的映射矩阵,λ为设定的权衡Pi和Q两者之间所占比重的参数;4)分别重构视觉特征矩阵中的各类的视觉特征矩阵Xi:Xi=DCi其中,D为采用高斯随机分布函数生成的字典矩阵;5)计算重构误差:其中,γ为设定的权衡第四项和第五项两者之间所占比重的参数;||||2为2范数,||||F为Frobenius范数;dm为字典矩阵D的元素,M为训练样本的类别数;6)按照采用最小二乘法求得的映射矩阵Pi和Q的闭式解:对映射矩阵Pi和Q的数值进行更新,其中,I是单位矩阵;7)采用交替方向乘子算法对字典矩阵...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。