一种基于对抗自编码器模型的零样本分类方法技术

技术编号：20623641 阅读：26 留言：0更新日期：2019-03-20 14:54

一种基于对抗自编码器模型的零样本分类方法，利用在可见类别上训练好的对抗自编码器网络，选择可以最好的近似模拟视觉特征分布以及使视觉特征与类别语义特征关联的网络参数w和v，继而将未见类别的类别语义特征at输入到该网络中，利用解码器网络G生成视觉特征，计算生成的视觉特征与真实的视觉特征间的欧氏距离。最终，认为距离最小的类别为预测的类别，以此实现零样本分类任务。本发明专利技术更加符合真实数据的特点，同时对齐了视觉特征与类别语义特征，在零样本任务中能够实现更好的分类效果。

A Zero Sample Classification Method Based on Countermeasure Self-Encoder Model

A zero-sample classification method based on anti-self-encoding model is proposed. Using the anti-self-encoding network trained on visible categories, the network parameters w and V which can best simulate the distribution of visual features and associate visual features with category semantic features are selected. Then, the category semantic features at which no category is seen are input into the network, and the decoder network G is used to generate views. The Euclidean distance between the generated visual features and the real visual features is calculated. Finally, the category with the smallest distance is considered as the predicted category, so as to realize the task of zero sample classification. The method is more in line with the characteristics of real data, and aligns visual features and category semantic features, so as to achieve better classification effect in zero sample tasks.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于对抗自编码器模型的零样本分类方法
本专利技术涉及一种零样本分类方法。特别是涉及一种基于对抗自编码器模型的零样本分类方法。
技术介绍
深度学习极大地促进了计算机视觉的发展，例如物体分类，图像检索和动作识别等。这些任务的性能通常在利用大量的标注数据训练后进行评估。然而，一些任务只有一小部分训练数据甚至没有训练数据，使得传统分类模型性能较差。为了提高传统分类模型对具有少量数据或者没有数据的类别的分类性能，零样本学习引起了广泛关注。零样本学习(ZeroShotLearning)的任务就是对没有训练数据的类别进行分类。人类具备推理的能力，也就是说人类可以根据对物体的描述以及先验知识，成功推理出未见物体的类别。例如，当给了这样一句描述：“独角兽的外形类似于马，不同的是独角兽在头上多了一个长角”，人们可以马上辨认出独角兽。零样本学习通过模拟人类的推理能力来识别新的类别。在零样本学习中，数据分为两部分，分别是训练数据(可见类别)和测试数据(未见类别)，并且两者的类别是不同的。对未见类别的识别通常由从可见类别到未见类别的知识迁移实现，在这个过程中，为了表征类别之间的语义关联，借助了可见类别与未见类别共同的语义特征，常用的类别语义特征有属性特征和文本矢量特征两种。属性特征是由人工标注的，文本矢量特征是在大的文本语料库上用自然语言技术处理得到的。图像通常由视觉特征表示，与语义特征之间存在语义鸿沟，不能与语义空间直接建立联系。大部分现有的零样本学习方法包括两个步骤，首先学习视觉空间和语义空间的映射函数，然后利用学习到的映射函数计算测试数据的视觉特征和未见类别的语义特征间的...

【技术保护点】
1.一种基于对抗自编码器模型的零样本分类方法，其特征在于，包括如下步骤：1)初始化辨别器D，编码器E和解码器G的参数r，w和v；2)将训练样本的视觉特征x和类别语义特征a分别随机选取一组设定批量的数据，分别对应作为编码器E和解码器G的输入；3)根据如下对抗自编码器模型训练编码器E和解码器G，利用Adam优化器对所述模型参数进行优化，保留使所述模型计算结果最小的编码器E与解码器G的参数w和v：

【技术特征摘要】
1.一种基于对抗自编码器模型的零样本分类方法，其特征在于，包括如下步骤：1)初始化辨别器D，编码器E和解码器G的参数r，w和v；2)将训练样本的视觉特征x和类别语义特征a分别随机选取一组设定批量的数据，分别对应作为编码器E和解码器G的输入；3)根据如下对抗自编码器模型训练编码器E和解码器G，利用Adam优化器对所述模型参数进行优化，保留使所述模型计算结果最小的编码器E与解码器G的参数w和v：其中，第一项代表输入类别语义特征a时，通过解码器G得到视觉特征的过程；第二项代表输入类别语义特征a时，先后通过解码器G和编码器E重构类别语义特征的过程；是对应的对抗自编码器模型参数正则项；λ是该正则项对应的参数；为2范数表示；4)根据选取的设定批量的数据，利用训练好的编码器E与解码器G得到辨别器D的三个输入x，x'和其中，x对应真实的视觉特征；x...

【专利技术属性】
技术研发人员：冀中，王俊月，于云龙，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人