【技术实现步骤摘要】
基于低维对比自适应的小样本开放集图像识别方法
[0001]本专利技术属于计算机视觉
,尤其是小样本开放集场景下的图像识别领域,涉及一种基于低维对比自适应的小样本开放集图像识别方法。
技术介绍
[0002]开放集图像识别是对普通图像识别任务的一个扩展,旨在正确分类训练集中定义的已知类别图像并识别未知类别的图像。近年来,以深度卷积网络为基础深度学习模型在数据样本丰富场景下的开放集图像识别任务中取得优异的性能。然而,传统方法无法直接应用于稀有动物识别等数据样本相对匮乏的场景,在训练数据不足情况下学习得到的模型可能过拟合,导致新数据样本上的泛化能力偏弱。为此,从人类认知新事物的角度,研究人员提出小样本学习理论,并探讨解决小样本开放集图像识别问题的方法。小样本开放集图像识别旨在通过少量具有类别标记的支持集样本识别未标记的查询集样本,其中支持集样本的类别为已知,这些开放集中的类别可能在训练集中未出现且查询集样本可以是任意的未知类别,即支持集和查询集对应的类别标记空间不一致。小样本开放集图像识别模型需要区分已知类别的查询集样本并识别未知类别的查询集样本,可应用于稀缺药物发现(drug discovery)、军事目标识别等数据相对匮乏的开放场景。例如,在药物发现领域中相同分子结构的药物样本少,且存在未知的新型结构药物,已有方法不能同时解决该任务中的数据稀缺且类别开放问题,不利于专业人员准确决策。
[0003]现有的小样本开放集识别研究工作大多从常规的小样本和开放集识别问题发展而来,并采用度量学习的框架。为模拟真实的应用 ...
【技术保护点】
【技术特征摘要】
1.基于低维对比自适应的小样本开放集图像识别方法,其特征在于,首先获取由已知类别标记的样本和部分未知类别样本组成的开放图像数据集,然后进行如下操作:步骤(1)对开放图像数据集进行采样,获得支持集和包含部分未知类别样本的查询集,将两者输入到视觉特征提取模块,输出支持特征向量集和查询特征向量集;步骤(2)构建低维对比嵌入模块,输入为支持特征向量集和查询特征向量集,输出为低维密集支持特征向量集和低维密集查询特征向量集;步骤(3)构建任务自适应校正模块,输入为支持特征向量集和低维密集支持特征向量集,输出为支持原型向量集;步骤(4)构建度量分类模块,输入低维密集支持特征向量集、低维密集查询特征向量集、支持原型向量集和查询特征向量集,输出为查询集中样本的预测类别标记;步骤(5)利用随机梯度下降算法优化由低维对比嵌入模块、任务自适应校正模块和度量分类模块组成的小样本开放集图像识别模型,对新的支持集和查询集通过步骤(1)~(4)得到查询集中图像样本类别。2.如权利要求1所述的基于低维对比自适应的小样本开放集图像识别方法,其特征在于,步骤(1)具体是:(1
‑
1)将开放图像数据集中所有图像缩放至相同大小,对缩放后的图像数据集以随机方式不放回采样,得到已知类标记集以及支持集和查询集,C表示支持集中的样本类别总数;支持集上标s表示支持,N
s
表示支持集中的图像样本个数且N
s
=C
×
K,K表示支持集中每个类别的样本数,表示第i个支持图像样本和对应的类别标记;查询集上标q表示查询,N
q
表示查询集中的图像样本个数,表示第j个查询图像样本和对应的类别标记,表示未知类标记集,说明查询集中存在来自未知类别的样本;表示实数域,H表示图像高度,W表示图像宽度,3表示RGB通道数量;(1
‑
2)构建由深度卷积网络和一个全连接层组成的视觉特征提取模块,其中,深度卷积网络是在大规模图像数据集ImageNet上预训练好的18层残差网络ResNet
‑
18,全连接层的输出维度为d;(1
‑
3)将支持集和查询集输入到视觉特征提取模块得到支持特征向量集和查询特征向量集其中表示第i个支持特征向量,表示第j个查询特征向量,d表示单个特征向量的维度。3.如权利要求2所述的基于低维对比自适应的小样本开放集图像识别方法,其特征在于,步骤(2)具体是:(2
‑
1)构建低维对比嵌入模块,低维对比嵌入模块由低维投影单元、重构误差辅助损失和监督对比辅助损失组成;低维投影单元将样本投影到二分类低维空间,重构误差辅助损失尽可能保留样本关键的视觉特征;监督对比辅助损失增加已知类样本和未知类样本在低
维空间的距离,并减少已知类间样本低维特征的距离,挖掘更合理的未知类视觉特征;(2
‑
2)将支持特征向量集和查询特征向量输入到低维投影单元,得到低维密集支持特征向量集和低维密集查询特征向量集第i个低维密集支持特征向量第j个低维密集查询特征向量d
′
表示投影后低维向量的维度且d
′
<<d,表示低维投影参数矩阵,T表示矩阵转置操作;(2
‑
3)根据每个低维密集支持向量和低维密集支持查询向量计算低维密集特征重构辅助损失loss1,以尽可能地保留原始高维空间的关键视觉特征,表示向量的L2范式的平方,λ表示正则化项的比例因子超参数,用于抑制过拟合,λ>0;(2
‑
4)根据低维密集向量和对应样本的查询集类标记计算监督对比辅助损失loss2,exp(
·
)表示自然常数e为底的指数函数,cos(
·
,
·
)表示余弦相似度函数,τ表示相似度缩放因子超参数,τ>0,和分别表示对应类标记为已知类和未知类的查询样本。4.如权利要求3所述的基于低维对比自适应的小样本开放集图像识别方法,其特征在于,步骤(3)具体是:(3
‑
1)构建任务自适应校正模块,任务自适应校正模块利用类间向量间的相关性构造类间关系向量集,自适应地调整已知类的特征表示,使不同已知类特征更具区分性,同时通过低维密集支持特征向量集对类特征进行校正重构,去除掉未知类的无关信息,减小未知类中相似视觉特征对已知类别造成的干扰;(3
‑
2)根据支持特征向量得到出初始的支持原型向量集类别为c的支持原...
【专利技术属性】
技术研发人员:李平,陈家俊,王然,徐向华,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。