【技术实现步骤摘要】
一种基于主动学习的开放集图像识别方法及系统
[0001]本专利技术涉及机器学习开放集图像识别
,尤其涉及一种基于主动学习的开放集图像识别方法及系统。
技术介绍
[0002]图像分类问题是计算机视觉领域最基本的问题,具有广阔的应用场景。在实际生活中,例如,交通管理领域中通过对拍摄的车辆图片进行分类,实现更好的城市道路规划;电子商务领域中通过对客户浏览的商品图案进行分类,更精准的向客户进行商品推荐;农业领域中通过对采集的昆虫图片进行分类,指导农民及时发现害虫并进行防治。图像分类的目标是将不同的图像划分到不同的类别,实现最小的分类误差。近年来,基于深度学习的图像分类技术往往通过大量标记图像数据学习分类模型,对无标记的图像数据进行类别预测,这个过程是封闭的,即标记数据和未标记数据中的图像属于相同类别。然而,现实应用场景是开放的,在未标记数据中通常会出现与标记数据类别不同的图像,标记数据和未标记数据之间的类别空间不同,导致模型对未标记样本的预测性能降低。开放集图像识别任务要求分类器不仅要准确地对已见类数据进行分类,还要有效地处理新类数据。
[0003]已有的开放集图像识别方法主要有样本重加权和开放集检测评分。样本重加权方法的思想是为开放集图像分配较低的权重,降低其对模型训练的影响。样本重加权方法中涉及基于元学习的无标记数据重加权机制以及基于距离的无标记数据重加权机制。开放集检测评分的目的是设计一个评分机制,为每个未标记的图像数据计算一个开放集评分,根据分数和预定义的阈值检测开放集图像。在开放集图像识别领域,基于模 ...
【技术保护点】
【技术特征摘要】
1.一种基于主动学习的开放集图像识别方法,其特征在于,该方法包括如下步骤:S1:给定标记图像数据集和未标记数据集利用语言模型Word2Vec生成已见类图像对应的类别语义表示S2:引入图像旋转预测框架RotNet,对给定图像数据集中的图像分别旋转0
°
、90
°
、180
°
和270
°
,进行自监督表示增强学习,训练图像特征提取模型,构造自监督损失L
sef
;S3:利用图像特征提取模型对所有图像进行特征表示,融入类别语义知识,将图像特征和类别语义知识映射到公共空间进行相似度计算,利用余弦相似度,计算图像特征和类别语义匹配得分,构造匹配损失L
ma
;S4:通过Otsu算法自适应选择预定义的阈值,将匹配得分与预定义的阈值进行比较,匹配得分低于阈值的未标记图像认为是开放集图像,匹配得分高于阈值的未标记图像认为是已见类图像;S5:采用主动学习策略,选择高置信度开放集样本和高置信度已见类样本,top
‑
k得分最高的样本是高置信度样本,将高置信度已见类样本及其计算得到的伪标签添加到标记数据中进行训练,以此形成循环,直到开放集样本都被识别出来,同时实现标记数据集的扩充;S6:为每个未标记数据进行类别预测,构造分类损失L
ce
。2.根据权利要求1所述的一种基于主动学习的开放集图像识别方法,其特征在于,所述步骤S1包括:给定标记样本集和一个未标记样本集其中和分别表示有标记和无标记的图像,表示有标记样本的真实标签,标记样本集中包含K个目标类别,即为每个类别定义一个语义表示为每个类别定义一个语义表示表示类别语义特征。3.根据权利要求1所述的一种基于主动学习的开放集图像识别方法,其特征在于,所述步骤S2包括:引入图像旋转预测框架RotNet,对所有标记数据和未标记数据进行自监督表示增强学习,将每张图像分别旋转0
°
、90
°
、180
°
和270
°
生成4个对应图像,并预测类别概率,对于图像特征x
i
,旋转之后的特征x
i,j
=x
i
*(j
‑
1)*90
°
,其中j=1,2,3,4,旋转后的预测概率q
i,j
:q
i,j
=h(f(x
i,j
)),其中h(
·
)表示1个线性层和1个softmax函数,训练过程的自监督损失函数为:4.根据权利要求1所述的一种基于主动学习的开放集图像识别方法,其特征在于,所述步骤S3包括:将图像特征和类别语义特征映射到公共空间实现视觉特征和语义特征的对齐,对于语义特征,利用Word2Vec得到已见类语义表示,对于图像x和它的标签y,首先提取图像x的特征z=f(x),接着抽取标签y对应的语义表示a,然后将z和a映射到一个公共空间进行相似度计算,利用余弦相似度,得到样本x和标签y的匹配得分:
s(x,y)=s(z,a)=cos(f(x),a),s(x,y)通过计算图像和类别语义相似度的大小来反映y是否是x的正确类别标签,其中类别语义相似度大的被认为是正确的类别标签;随机选择除真实标签和最难区分标签之外的标签下面是模型训练的损失函数,标记数据的损失函数如下:其中,和分别表示最难区分的标签和随机选择的标签,分...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。