一种基于跨样本注意力聚合的小样本学习方法和装置制造方法及图纸

技术编号:33860784 阅读:36 留言:0更新日期:2022-06-18 10:50
本发明专利技术公开了一种基于跨样本注意力聚合的小样本学习方法,包括将将支持集输入至卷积神经网络后压缩至矩阵形式得到多类别特征向量,将多类别特征向量输入至注意力聚合模块得到支持集的多个类别聚合向量;将查询集输入至卷积神经网络后压缩至矩阵形式得到查询特征向量,将查询特征向量输入至注意力聚合模块得到查询聚合向量;基于类别聚合向量、查询聚合向量和真实类别聚合向量通过距离感知概率激活方法得到查询图片的类别预测概率值;类别预测概率值构建交叉熵损失函数,通过交叉熵损失函数优化训练模型中的参数得到类别预测模型;该方法能够清晰区分物体和背景区域,并能够准确提取类别特征。确提取类别特征。确提取类别特征。

【技术实现步骤摘要】
一种基于跨样本注意力聚合的小样本学习方法和装置


[0001]本专利技术属于小样本学习领域,具体涉及一种基于跨样本注意力聚合的小样本学习方法和装置。

技术介绍

[0002]人类可以从很少的实例中学习新的概念,并拥有很强的泛化能力,这些能力是深度学习算法目前还不具有的,即人类可以从一个或几个实例中学习一个新的概念,但深度学习标准算法则需要更多的实例才能勉强达到相同的能力。深度学习在图像识别、图像分割、自然语言处理等领域获得了较大进展,在实际应用中,庞大的训练样本量往往是高昂的,进而其训练样本量庞大的缺点饱受诟病。
[0003]研究者通过各种算法的设计,试图以少量训练样本达到同样的效果,除常见的数据增强、迁移学习外,小样本算法的研究也受到了广泛的关注。目前已有的研究方案,根据出发点和动机的不同,可以大致划分为下列三类:(1)基于数据扩充的小样本学习;(2)基于元学习的小样本学习;(3)基于度量的小样本学习,但目前为止,以原型网络等为代表的常规的小样本学习算法的效果仍有限。
[0004]大多数常规的小样本学习算法对于图片的局部和类别实例本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于跨样本注意力聚合的小样本学习方法,其特征在于,包括:(1)将原始图片集分为训练样本集和验证样本集,将训练样本集分为第一支持集和第一查询集,第一支持集包括多类别图片集,每个类别图片集包括多个相同类别图片,第一查询集包括多个相同类别的查询图片;(2)构建训练模型,训练模型包括支持子模型和查询子模型,其中,支持子模型包括第一卷积神经网络和第一注意力聚合模块,将第一支持集输入至第一卷积神经网络后压缩至矩阵形式得到多类别特征向量,将多类别特征向量分别输入至第一注意力聚合模块得到第一支持集的多个类别聚合向量;查询子模型包括第二卷积神经网络和第二注意力聚合模块,将查询集输入至第二卷积神经网络后压缩至矩阵形式得到单个类别特征向量,将单个类别特征向量输入至第二注意力聚合模块得到第一查询集的查询聚合向量;基于多个类别聚合向量、查询聚合向量和真实类别聚合向量通过距离感知概率激活方法得到查询图片的类别预测概率值;(3)构建损失函数,基于单一类别查询图片类别预测概率值构建交叉熵损失函数,通过交叉熵损失函数优化训练模型中的参数得到类别预测模型;(4)应用时,将多类别图片集和查询图片集输入至类别预测模型得到每个查询图片的预测类别。2.根据权利要求1所述的基于跨样本注意力聚合的小样本学习方法,其特征在于,将第一支持集输入至第一卷积神经网络后压缩至矩阵形式得到多个类别特征向量,包括:将第一支持集中的多个类别图片集输入至第一卷积神经网络得到多类别特征图集,将每个类别特征图集压缩至矩阵形式得到每个类别特征向量。3.根据权利要求1所述的基于跨样本注意力聚合的小样本学习方法,其特征在于,将每个类别特征向量输入至第一注意力聚合模块得到每个支持类别聚合向量,包括:对每个类别特征向量求均值得到平均类别特征向量,将平均类别特征向量和每个类别特征向量输入至度量函数,对度量结果进行归一化得到权重向量,将转置的权重向量与每个类别特征向量进行矩阵乘操作得到每个支持类别聚合向量。4.根据权利要求3所述的基于跨样本注意力聚合的小样本学习方法,其特征在于,对度量结果进行归一化得到权重向量W为:W=g(M)=softmax(

k*M)其中,g(﹒)为归一化函数,M为度量结果,k为超参数,softmax(﹒)为激活函数。5.根据权利要求1所述的基于跨样本注意力聚合的小样本学习方法,其特征在于,基于多个类别聚合向量、查询聚合向量和真实类别聚合向量通过距离感知概率激活方法得到查询图片的类别预测概率值为:其中,x
q

【专利技术属性】
技术研发人员:曹广刘鹏周迪
申请(专利权)人:浙江宇视科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1