一种基于孪生知识蒸馏与自监督学习的小样本分类方法技术

技术编号：32966274 阅读：16 留言：0更新日期：2022-04-09 11:22

本发明专利技术公开了一种基于孪生知识蒸馏与自监督学习的小样本分类(小样本)方法，将孪生知识蒸馏与自监督学习相结合用于下游小样本分类任务。具体包括如下步骤：获取用于训练孪生知识蒸馏模型的图像数据集；利用图像数据集从头训练预先定义好的孪生知识蒸馏网络，优化目标是孪生知识蒸馏与自监督相结合的损失函数；获得了训练好的特征提取器F，并将它应用于小样本分类任务。本发明专利技术在3个小样本分类任务基(miniImageNet，tieredImageNet和CIFAR

全部详细技术资料下载

【技术实现步骤摘要】
一种基于孪生知识蒸馏与自监督学习的小样本分类方法

[0001]本专利技术属于计算机视觉领域，特别地涉及到了知识蒸馏技术与小样本分类任务。

技术介绍

[0002]小样本学习(Few
‑
shot learning，简称小样本)是指让机器学习模型在学习了一定类别的大量数据后，对于新的类别，只需要少量的样本就能快速学习。小样本学习中的分类问题主要指N
‑
way K
‑
shot问题，它是指：在训练阶段，在训练集中随机抽取N个类别，每个类别K个样本(共N
×
K个数据)作为模型的支持集输入，再从这N个类别中剩余的数据抽取Q个样本作为模型的问题集，即要求模型从N
×
K个数据中学会如何区分这N个类别。
[0003]目前的小样本方法可以分为三类：基于梯度的方法；数据增强方法；基于度量的方法。
[0004]基于梯度的方法主要指基于元学习的方法，它是指在训练阶段，通过学习一系列的N
‑
way K
‑
shot问...

【技术保护点】

【技术特征摘要】
1.一种基于孪生知识蒸馏与自监督学习的小样本分类方法，其特征在于，包括以下步骤：S1、获取用于训练孪生知识蒸馏网络模型与测试小样本分类任务的图像数据集；S2、建立由特征提取网络和分类器网络构成的孪生知识蒸馏网络模型，并使用孪生知识蒸馏与自监督学习相结合的方法训练所述孪生知识蒸馏网络模型；S3、将训练好的孪生知识蒸馏网络模型应用于小样本分类任务。2.如权力要求1所述的基于孪生知识蒸馏与自监督学习的小样本分类方法，其特征在于，步骤S1中，获取的用于训练孪生知识蒸馏网络模型的图像数据集包括C
base
个基类，每个基类包括满足预设数据量的大数量带标签样本；获取的用于测试小样本分类任务的图像数据集包括C
target
个测试类别，每个测试类别包括少量样本；且基类与测试类别在标签空间中不相交，3.如权利要求2所述的基于孪生知识蒸馏与自监督学习的小样本分类方法，其特征在于，步骤S2具体包括：S21、从用于训练孪生知识蒸馏网络的图像数据集中随机采样一个批量的图像样本其中批量大小N
bs
预先给定；S22、对于基类中的一个样本x，通过特征提取网络与分类器网络得到它的类别预测向量，即z＝[z1，...，z
i
，...，z
m
]，再经过softmax分类器得到它属于第i类的预测概率其中，τ＞0是温度缩放参数，它控制softmax输出的归一化概率分布的平滑性；M为类别个数；对于多分类任务，目标损失函数为L
CE
(x)＝H(y，P(x))其中，H表示交叉熵损失，P(x)是输入x的预测的概率分布，y是类别真实标签；S23、将相同类别的一对样本作为所述孪生知识蒸馏网络模型的输入，得到各自的概率分布P
S
(x
i
)与P
S
(x
j
)，让P
T
(x)＝(P
S
(x
i
)+P
S
(x
j
))/2作为教师，分别去蒸馏两个学生分布；同时，两个学生概率分布也要受类别真实标签的监督L
TwinKd
(x
i
，x
j
)＝H(αy+βP
T
(x)，P
S
(x
i
))+H(αy+βP
T
(x)，P

【专利技术属性】
技术研发人员：于云龙，靳莉莎，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人