一种基于记忆力机制和图神经网络的小样本图像分类方法技术

技术编号：30964068 阅读：12 留言：0更新日期：2021-11-25 20:30

本发明专利技术公开了一种基于记忆力机制和图神经网络的小样本图像分类方法，其特点是借助学习好的概念知识帮助小样本模型进行推理预测，具体包括：预训练、元训练和元测试三个阶段，所述预训练将训练好的特征提取器和分类器作为编码器和记忆库的初始化权值；所述元训练通过编码器提取支撑集和查询集样本的特征，从记忆库中挖掘每个类相关信息作为元知识，并通过一个图神经网络来传播任务相关节点以及元知识之间的相似性；所述元测试通过任务相关节点和元知识结点得到分类结果。本发明专利技术与现有技术相比具有借鉴人类识别过程，基于信息瓶颈的记忆图增广网络，借助学习好的概念知识，帮助模型进行推理预测实，方法简便，实用性强，具有一定推广应用的前景。推广应用的前景。推广应用的前景。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于记忆力机制和图神经网络的小样本图像分类方法

[0001]本专利技术涉及小样本图像分类
，尤其是一种基于记忆力机制和图神经网络的小样本图像分类方法。

技术介绍

[0002]深度学习的成功源于大量标注数据，而人类只需利用少量的几个样本，就有很好的泛化能力，两者之间的差距引起了人们对小样本学习的研究。与传统的深度学习场景不同，小样本学习的目的不在于对未知样本进行分类，而是在非常有限的标注数据和过往的知识中对新任务快速适应。
[0003]最近，利用元学习与情景(episode)训练相结合的思想，在解决这一问题上取得了显著的优势。直觉上，使用情景(episode)抽样策略，是一个很有希望的趋势，将知识从已知的类别(即有足够训练样本的已知类别)转移到新的类别(即有少量样本的新类别)，模拟人类的学习过程。尽管元学习与episode训练策略在小样本学习上取得了显著的成果，但是它们中的大多数忽略了一个关键性问题，即当一个一个情景(episode)来临训练时，过去所学的知识如何面对新任务。
[0004]现有技术存在着当面对未知的任务时，学习到的概念无法利用模型进行推理预测。

技术实现思路

[0005]本专利技术的目的是针对现有技术的不足而提出的一种基于记忆力机制和图神经网络的小样本图像分类方法，采用基于信息瓶颈的记忆图增广网络的方法，当面对未知分类任务时，利用图神经网络与记忆机制，使得学习到的概念帮助小样本模型进行推理预测，该方法很好的借鉴人类识别过程，借助学习好的概念知识，较好的实现了利用...

【技术保护点】

【技术特征摘要】
1.一种基于记忆力机制和图神经网络的小样本图像分类方法，其特征在于利用图神经网络与记忆机制，借助学习好的概念知识帮助小样本模型进行推理预测，具体包括下述步骤：步骤1：预训练在整个训练集上学习一个有监督的特征提取器和线性分类器，并将其作为元训练阶段编码器和记忆库的初始化权值；步骤2：元训练通过编码器提取支撑集和查询集样本的特征，将其作为任务相关节点，所述支撑集样本的特征由构建的记忆库存储；所述记忆库采用更新方式进行优化，以逐步提纯判别性信息，最后从记忆库中挖掘每个类相关信息作为元知识，并通过一个图神经网络来传播任务相关节点以及元知识之间的相似性；步骤3：元测试通过任务相关节点和元知识结点得到分类结果，在元测试过程中，记忆库和其他模块不被更新，episode采样训练策略的样本来自测试集。2.根据权利要求1所述基于记忆力机制和图神经网络的小样本图像分类方法，其特征在于所述步骤1具体包括如下步骤：1.1：在整个训练集上训练一个有监督的特征提取器和线性分类器；1.2：使用训练好的特征提取器和线性分类器分别作为元训练阶段编码器和记忆库1.2：使用训练好的特征提取器和线性分类器分别作为元训练阶段编码器和记忆库的初始化权值。3.根据权利要求1所述基于记忆力机制和图神经网络的小样本图像分类方法，其特征在于所述步骤2具体包括如下步骤：2.1：采用一个包含支撑集样本和查询集样本的N
‑
WayK
‑
shot T
‑
query任务，通过编码器提取支撑集样本S和查询集样本Q的特征表示作为任务相关的节点2.2：使用类内均值计算支撑集样本中每个类的中心点f
cen
∈R
[N,d]
，并将其与存储在记忆库中相同类别的原型点f
p
∈R
[N,d]
进行串接，将串接后的特征表示f
cat
∈R
[N,2d]
输入到一个全连接层减少维度以提纯语义信息，所述语义信息由下述1式进行约束和提纯：maxI+f
p
,Y)
‑
βI(f
cen
,f
p
)
ꢀꢀꢀꢀꢀꢀ
(1)；其中：I(.,.)表示互信息；Y表示标签；β表示拉格朗日系数；所述记忆库由下述2式进行提纯优化：将提纯后记忆库的特征表示f
D
∈R
[N,d]
与记忆库相同类别的原型点由下述3式的动量更新对记忆库进一步优化：f
p
←
λf
p
+(1
‑
λ)f
B
ꢀꢀꢀꢀꢀ
(3)；其中：λ是动量系数；2.3：计算类中心点与记忆库中每个原型点之间的余弦相似性，选择与中心点最近的
k个原型点MK＝{m1,m2,
…
,m
k
}，将k个原型点都与中心点拼接...

【专利技术属性】
技术研发人员：张志忠，谢源，刘勋承，田旭东，马利庄，
申请(专利权)人：华东师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人