一种基于联合聚类域自适应的图片分类方法和系统技术方案

技术编号:31905027 阅读:31 留言:0更新日期:2022-01-15 12:43
本发明专利技术提出一种基于联合聚类域自适应的图片分类方法和系统,包括:通过特征提取网络可分别提取源域图片数据和目标域图片数据的特征,得到源域特征和目标域特征;基于源域特征和目标域特征到聚类中心的距离显式表达域内类别条件分布概率;最小化源域数据标签与域内类别条件分布概率的相对熵距离,更新特征提取网络与类别聚类中心;最小化目标域数据的标签分配与域内类别条件分布概率的相对熵距离,再次更新特征提取网络与聚类中心;将待分类图片输入经过再次更新的特征提取网络,得到待分类图片的图片特征,计算图片特征与经过再次更新的类别聚类中心中所有类别中心的概率,取概率最大的类别作为待分类图片的图片分类结果。率最大的类别作为待分类图片的图片分类结果。率最大的类别作为待分类图片的图片分类结果。

【技术实现步骤摘要】
一种基于联合聚类域自适应的图片分类方法和系统


[0001]本专利技术涉及图片分类
,并特别涉及一种基于联合聚类域自适应的图片分类方法和系统。

技术介绍

[0002]现有深度卷积神经网络方法基于训练数据集和应用场景具有相同分布的假设。然而用于模型训练的数据集与最终的实际应用场景往往存在差异,这将导致模型最终的性能有较大的下降。无监督域自适应(UDA)提供了一种在无目标域标签时解决域分布不匹配问题导致的性能下降的方法。
[0003]传统的无监督域自适应方法通过设计损失函数度量并最小化域之间的差异距离来对齐不同域的特征分布。度量方法包括最大均方差(MMD)、Kullback

Leibler散度(KL)以及基于GAN的域分类器。这些方法可以被概括为在保持源域分类正确率的前提下寻找域不变特征空间。
[0004]现有方法的理论基础为在域一致的特征空间上,源域与目标域的分布足够相似。然而在实际应用中,即使达到了两个域之间特征分布相似,在下游分类任务上目标域的性能依然有所下降,且可能产生负迁移的效果
专利技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于联合聚类域自适应的图片分类方法,其特征在于,包括:步骤1、通过特征提取网络可分别提取源域图片数据和目标域图片数据的特征,得到源域特征和目标域特征;步骤2、获取类别聚类中心,基于该源域特征和该目标域特征到该聚类中心的距离显式表达域内类别条件分布概率;步骤3、通过最小化源域数据标签与域内类别条件分布概率的相对熵距离,更新该特征提取网络与类别聚类中心;步骤4、通过最小化目标域数据的标签分配与域内类别条件分布概率的相对熵距离,再次更新特征提取网络与聚类中心;步骤5、将待分类图片输入经过再次更新的特征提取网络,得到待分类图片的图片特征,计算该图片特征与经过再次更新的类别聚类中心中所有类别中心的距离,表示该待分类图片属于各类别的概率,取概率最大的类别作为该待分类图片的图片分类结果。2.如权利要求1所述的基于联合聚类域自适应的图片分类方法,其特征在于,该步骤1包括利用该特征提取网络提取源域和目标域图片数据的特征:其中为输入图片数据,表示参数为θ
R
的神经网络,表示输出特征。3.如权利要求2所述的基于联合聚类域自适应的图片分类方法,其特征在于,该步骤2包括:其中表示类别j图片的特征聚类中心,p(y
j
|x
i
,q)表示图片样本x
i
属于类别y
j
的域内类别条件分布概率。4.如权利要求3所述的基于联合聚类域自适应的图片分类方法,其特征在于,该步骤3中最小化源域数据标签与域内类别条件分布概率的相对熵距离具体为:其中N表示源域内样本数量,表示源域中样本x
i
的类别标签,表示源域样本x
i
经过神经网络提取到的特征。5.如权利要求4所述的基于联合聚类域自适应的图片分类方法,其特征在于,步骤4中最小化目标域数据的标签分配与域内类别条件分布概率的相对熵距离具体为;其中N表示目标域内样本数量,表示源域样本x
i
的类别标签分配,表示源域样本x
i
经过神经网络提取到的特征,γ
i
源域样本x
i
经过聚类算法获得的标签分配。
6.一种基于...

【专利技术属性】
技术研发人员:张蕊汪瑜张曦珊刘少礼
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1