【技术实现步骤摘要】
一种基于样本级注意力网络的少样本学习方法
本专利技术涉及样本图像分类
,特别是一种基于样本级注意力网络的少样本学习方法。
技术介绍
近年来,在深度网络的帮助下,计算机在图像识别任务上已经超越了人类,但是深度网络也存在着三个问题:第一,训练深度网络模型需要大量的标记数据,所以图像识别技术多数都集中在有大规模数据集的物体识别上。第二,现实中很多的场景是不存在大量标注数据的,或者很多标注数据需要领域专家进行标注,获得大规模标注数据集的成本过于高,导致很多领域目前无法使用深度学习。第三,深度学习需要大量的数据和多次迭代训练出一个模型,但是当面临新类别出现的时候,又需要重新进行训练。基于此,学者们提出了少样本学习,少样本学习的目标就是面对新类别样本数量极少的情况下,利用过往的经验进行快速学习。少样本学习的研究意义在于以下两点:第一,少样本学习能够借助几个新类别标记的数据集就对整个数据集进行分类,进而能够解决对大量未知图片标记的问题。第二,少样本学习可以在原先训练好的模型基础上,加上少量新类别数据进行训练,就可以快速学习到 ...
【技术保护点】
1.一种基于样本级注意力网络的少样本学习方法,其特征在于,包括以下步骤:/n将支撑集的样本和查询集的样本分别输入到特征提取模块中,得到相应的支撑集特征向量和查询集特征向量;/n将每个类对应的支撑集特征向量输入到样本级注意力网络模块中得到每个类别的类原型;/n通过计算查询集特征向量与每个类原型之间的距离,得到查询集特征向量所属类别的概率分布;/n采用查询集的交叉熵损失与支撑集的分类损失共同训练特征提取模块与样本级注意力网络模块,反向传播求梯度更新网络。/n
【技术特征摘要】
1.一种基于样本级注意力网络的少样本学习方法,其特征在于,包括以下步骤:
将支撑集的样本和查询集的样本分别输入到特征提取模块中,得到相应的支撑集特征向量和查询集特征向量;
将每个类对应的支撑集特征向量输入到样本级注意力网络模块中得到每个类别的类原型;
通过计算查询集特征向量与每个类原型之间的距离,得到查询集特征向量所属类别的概率分布;
采用查询集的交叉熵损失与支撑集的分类损失共同训练特征提取模块与样本级注意力网络模块,反向传播求梯度更新网络。
2.根据权利要求1所述的一种基于样本级注意力网络的少样本学习方法,其特征在于,所述将每个类对应的支撑集特征向量输入到样本级注意力网络模块中得到每个类别的类原型具体为:
对于类别i,其原型的计算公式如下:
式中,ci代表支撑集Ts中第i类的类原型,N表示第i类支撑集样本数量,αj表示第i类支撑集中第j个支撑集样本的权重,表示第i类中第j个支撑集样本的特征向量。
3.根据权利要求2所述的一种基于样本级注意力网络的少样本学习方法,其特征在于,所述第i类支撑集中第j个支撑集样本的权重αj的计算公式如下:
其中,
式中,表示第i类中第j个支撑集样本的特征向量,为查询集样本的特征向...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。