The invention discloses a depth zero sample classification method based on word embedding, and classes not appearing in the learning stage can still be recognized in the prediction stage. A zero-sample image learning model based on word embedding and depth feature extraction is proposed. The method learns a subspace of image feature and semantic feature combined embedding through a powerful depth neural network, and achieves the goal of zero-sample image learning by utilizing the semantic ability of word vector. The invention not only proposes a model combining depth learning method with zero-sample learning, but also makes a lot of improvements to the embedded space of the combination part, providing reference and guidance for zero-sample image learning or other modal zero-sample learning, overcoming the ambiguity of sample attribute definition and artificial features in traditional zero-sample learning. Extraction and so on. The invention is widely used in end-to-end class prediction tasks, especially for class prediction tasks with insufficient training samples or even without a certain class of training samples.
【技术实现步骤摘要】
一种基于词嵌入的深度零样本分类方法
本专利技术涉及模式识别
,特别是一种基于词嵌入的深度零样本分类方法。
技术介绍
零样本学习(ZSL)模型是一种特殊的机器学习问题,属于迁移学习的极端情况,即在训练样本中缺失某几类样本或者训练数据集中从未存在某几类样本,然而实际情况需要我们依然能够在测试任务中识别出这些训练集缺失的类别样本。零样本学习在各种实际生活中有大量的应用,最主要的应用就是针对数据不够多的情况下使用,如何有效的提高零样本学习效率具有十分重要意义。由于训练集样本的缺失,传统机器学习方法无法完成零样本学习任务,研究者们提出一种全部类别共同映射的中间层特征空间,建立一种训练类别信息与测试类别信息的连接空间,将原本使用类别信息分类能力转化到该中间层,摆脱了必须使用类别信息分类的限制。目前主要的技术手段是选择属性空间作为中间层特征空间。属性空间是人为的定义的特征空间,如“形状”“纹理”“是否含有某个属性”,这些可以描述类别的语义特性,属性作为不同类别共享的中间层语义特征,不仅可以弥补底层的视觉特征和高层的类别特征之间的语义鸿沟,还可是通过不同属性的组合,学习到新的类别。但是基于属性的零样本学习有着本质的缺点,各个类别的属性是需要人为设定的,分类效果好坏与否取决于人为的属性选择的好坏,不同种类的图像分类需要不同领域的专业人士来做属性标定,然后才能实现分类,并不是一种端到端的实现方法。而且人为的设定属性会消耗人力物力,效率不高。
技术实现思路
本专利技术所要解决的技术问题是克服现有技术的不足而提供一种基于词嵌入的深度零样本分类方法,利用文本数据集易获取的优势和词 ...
【技术保护点】
1.一种基于词嵌入的深度零样本分类方法,其特征在于,包括以下步骤:步骤1,输入图像训练集
【技术特征摘要】
1.一种基于词嵌入的深度零样本分类方法,其特征在于,包括以下步骤:步骤1,输入图像训练集xi表示图像训练集的第i张图片,1≤i≤n1,n1为图像训练集图片数量,训练卷积神经网络,得到卷积神经网络参数θx;步骤2,输入文本训练集yj表示文本训练集的第j个单词,1≤j≤n2,n2为文本训练集单词数量,且n2>n1,训练文本神经网络,得到文本神经网络参数θy;步骤3,改变步骤1和步骤2的网络结构,去掉卷积神经网络和文本神经网络的顶层,各自新增一个全连接层:图像特征映射层和文本特征映射层,使卷积神经网络和文本神经网络在顶层相互连接,建立公共子空间;再次输入图像和文本训练集,通过如下损失函数L训练两者的映射层参数Wx和Wy:Fi=f(xi;θx),Gj=g(yj;θy),其中,Fi和Gj分别表示第i张图片和第j个单词的特征,Wx和Wy为图像特征映射层参数和文本特征映射层参数,为和的内积,和分别表示图像和单词经过映射后的公共子空间特征,sigmoid(*)为激活函数,上标T表示转置,Sij为相似矩阵,当xi和yj为同一种类别时Sij值为1,否则为0;γ和η是超参数,为F范数,e为自然底数;步骤4,通过随机梯度下降算法SGD交替迭代优化步骤3的损失函数L,使其最小;计算和并通过反向传播算法的链式法则来更新Wx、θx、Wy和θy;步骤5,将测试图像xq输入到神经网络中...
【专利技术属性】
技术研发人员:秦牧轩,荆晓远,吴飞,孙莹,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。