【技术实现步骤摘要】
一种基于条件对抗自动编码机的广义零样本图像识别方法
本专利技术涉及一种零样本图像识别方法,尤其涉及一种基于条件对抗自动编码机的广义零样本图像识别方法。
技术介绍
近年来,随着互联网上爆发性的数据增长,新事物不断涌现,难以收集足够的标记数据来训练图像识别模型。为此,专家学者提出了零样本学习的概念,引起了广泛的研究兴趣。零样本学习是受人类认知新事物的过程所启发,企图从有限的知识或者其他的已知事物中,辅以相应的知识描述,认知新事物。零样本学习中可见类是训练过程中能够使用的类,而不可见类是训练过程中不可使用,测试过程中使用的类。即从可见类数据中学习知识,进而能够迁移到不可见类中,进行零样本图像识别。因此能够解决标记数据不足和缺失的难题。现有的零样本学习工作大多数从可见类数据中学习一个视觉-语义映射,然后将此映射泛化到不可见类数据上。然而现有工作大部分在测试过程中仅仅使用不可见类,即仅做了零样本图像识别,未综合判断不可见类数据和可见类数据的准确率。该测试场景是不合理的,因为测试数据既可能来自不可见类,也可能来自可见类。与此不同的是,广 ...
【技术保护点】
1.一种基于条件对抗自动编码机的广义零样本图像识别方法,其特征在于所述的条件对抗自动编码机采用对抗训练模式,同时生成可见类和不可见类伪样本,包括以下步骤:/n步骤1,构建一个编码器,以图像视觉特征和对应的类别属性串联作为输入,编码成潜在语义表示后输出;/n步骤2,构建一个解码器,以步骤1中的潜在语义表示和对应的类别属性串联作为输入,解码重构出图像视觉特征,计算重构损失;/n步骤3,构建一个判别器,通过对抗训练,将数据潜在语义表示的集成后验分布匹配为一个先验分布,如标准正态分布;从先验分布随机采样的数据为真,潜在语义表示数据为假;/n步骤4,构建和优化总目标函数,迭代更新模型 ...
【技术特征摘要】
1.一种基于条件对抗自动编码机的广义零样本图像识别方法,其特征在于所述的条件对抗自动编码机采用对抗训练模式,同时生成可见类和不可见类伪样本,包括以下步骤:
步骤1,构建一个编码器,以图像视觉特征和对应的类别属性串联作为输入,编码成潜在语义表示后输出;
步骤2,构建一个解码器,以步骤1中的潜在语义表示和对应的类别属性串联作为输入,解码重构出图像视觉特征,计算重构损失;
步骤3,构建一个判别器,通过对抗训练,将数据潜在语义表示的集成后验分布匹配为一个先验分布,如标准正态分布;从先验分布随机采样的数据为真,潜在语义表示数据为假;
步骤4,构建和优化总目标函数,迭代更新模型的参数,保存解码器模型;
步骤5,采用解码器,串联先验分布的随机采样数据和可见类或不可见类的类别属性,输入到解码器,生成类别对应的伪样本,有监督训练分类器SVM;
步骤6,广义零样本图像识别学习,输入图像视觉特征,SVM分类结果为识别结果。
2.根据权利要求1所述的一种基于条件对抗自动编码机的广义零样本图像识别方法,其特征在于,步骤1具体为编码图像视觉特征和类别属性为潜在语义表示:编码器E定义为概率模型z~q(z|x,a),采用前向神经网络θE实现,通过该网络,图像的视觉特征x和对应类别属性a的串联数据(x,a)将被编码成潜在表示z,为了能够采用已知分布生成伪样本,将潜在表示强制匹配为一个先验分布p(z)。
3.根据权利要求2所述的一种基于条件对抗自动编码机的广义零样本图像识别方法,其特征在于,步骤2具体为解码潜在语义表示和类别属性为重构的图像视觉特征:解码器G用于从潜在表示z和它对应的类别属性a重构出输入的x,定义为一个深度网络p(x|z,a),网络参数为θR,输出为x*,即x的重构,解码器在整个对抗自动编码机训练完毕之后将扮演生成器的角色,从已知的分布中采样噪声数据,串联上条件数据,生成训练需要的伪样本数据,训练解码器采用L2范数平方构建的重构损失如公式(1)所示:
4.根据权利要求3所述的一种基于条件对抗自动编码机的广义零样本图像识别方法,其特征在于,步骤3具体为构建判别网络,匹配潜在语义表示的集成后验分布为先验分布:判别器网络D将潜在表示或者从先验分布采样的噪声,与对应的类别属性串联(z,a)作为输入,输出一个概率,指示潜在表示与对应语义嵌入的相关程度,因此...
【专利技术属性】
技术研发人员:钟芳明,邓永红,张元烨,
申请(专利权)人:大连理工大学人工智能大连研究院,大连钜智信息科技有限公司,
类型:发明
国别省市:辽宁;21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。