当前位置: 首页 > 专利查询>天津大学专利>正文

一种考虑多粒度类相关性的对比式开放集识别方法及装置制造方法及图纸

技术编号:31740450 阅读:28 留言:0更新日期:2022-01-05 16:18
本发明专利技术公开了一种考虑多粒度类相关性的对比式开放集识别方法及装置,方法包括:构架一由特征提取、多粒度类相关性损失、及分类器组成的对比式开放集识别模型;基于所述多粒度层级结构的训练集对所述对比式开放集识别模型进行训练,计算多粒度类相关性损失函数,通过构建并度量不同类别在分层结构上的相关性,约束模型学习,实现类别层次上的表示学习增强,更新所述模型的权重,获取优化后的模型;基于所述优化后的模型对已知类测试集和未知类测试集进行识别,获取识别结果。装置包括:处理器和存储器。本发明专利技术通过在标签语义空间构建分层结构并度量多粒度类相关性的方式,约束模型学习不同已知类间的相关关系,进一步提高其表示学习能力。示学习能力。示学习能力。

【技术实现步骤摘要】
一种考虑多粒度类相关性的对比式开放集识别方法及装置


[0001]本专利技术涉及机器学习开放集识别领域,尤其涉及一种考虑多粒度类相关性的对比式开放集识别方法及装置。

技术介绍

[0002]深度学习方法在计算机视觉的多个任务中得到了广泛应用。但传统深度神经网络(Deep Neural Network,DNN)只能处理封闭场景,即训练集和测试集中包含相同类别数据。若某样本为训练集中未出现的新类样本,DNN会将样本预测为训练集中某一已知类别从而给出一个错误结果。
[0003]开放集识别任务(Open Set Recognition,OSR)旨在对已知类别样本进行正确分类的同时,对出现的未知类别样本进行准确地判别。在开放集识别任务中,未知类样本的不可预知性是开放集识别任务的主要挑战之一。在训练过程中,模型无法获得开放集样本的相关信息,这为模型判别未知类带来了难度。解决开放集识别问题的一种简单直接的方法是在经典监督学习分类网络中使用SoftMax层的输出作为判断依据,若其预测某样本的置信度低于所设定的阈值,则识别该样本属于未知类。但SoftMax层本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种考虑多粒度类相关性的对比式开放集识别方法,其特征在于,所述方法包括:将数据集划分为训练集、已知类测试集和未知类测试集,并对训练集数据构建多粒度层级结构;构架一由特征提取、多粒度类相关性损失、及分类器组成的对比式开放集识别模型;基于所述多粒度层级结构的训练集对所述对比式开放集识别模型进行训练,计算多粒度类相关性损失函数,通过构建并度量不同类别在分层结构上的相关性,约束模型学习,实现类别层次上的表示学习增强,更新所述模型的权重,获取优化后的模型;基于所述优化后的模型对已知类测试集和未知类测试集进行识别,获取识别结果。2.根据权利要求1所述的一种考虑多粒度类相关性的对比式开放集识别方法,其特征在于,所述多粒度类相关性损失为:对于训练集样本{x
k
,y
k
}
k=1...N
,,利用标签的语义信息构建X
α,α=0...α
层的层级结构,其中α为层级数,X
α=0
为数据原始标签y
k
作为叶子结点所在的层级;利用Word2Vec(
·
)模块对原始标签进行语义特征的提取,获得词向量vec,利用K

Means方法对词向量vec进行粗粒度层级上的聚类,得到粗粒度标签进而得到实例

粗粒度标签对样本以此类推,通过提取X
α=1
层的粗粒度标签信息,获得X
α
层的粗粒度标签信息;其中,t为粗粒度类别数。3.根据权利要求1所述的一种考虑多粒度类相关性的对比式开放集识别方法,其特征在于,所述多粒度类相关性损失函数为:其中,λ>0为平衡权重;其中,“·”代表内积,为温标参数,设置为A(i)≡I\{i},即训练集样本中除锚点i外,与锚点i拥有相同标签的全部实例均作为监督对比式学习的正例,为正例样本标签,为锚点样本标签,为模型学习到的锚点样本的特征,为模型...

【专利技术属性】
技术研发人员:王煜张琬迎朱鹏飞胡清华
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1