【技术实现步骤摘要】
基于细粒度领域自适应的跨领域图像分类方法及系统
本专利技术涉及图像分类领域和机器学习领域,并特别涉及一种基于深度学习的细粒度领域自适应方法及系统。
技术介绍
图像分类问题吸引了大量研究者的注意,训练一个图像分类的分类器往往需要大量带标签的数据,在现实的应用中,通常很难获得大量带标签的图像数据。同时我们通常很容易获得一些公有数据集,比如ImageNet数据有上百万的图片,一个直接的想法使用这些已有的数据集来帮助提升我们目标应用中的图像分类效果。这些已有的数据集成为源领域,目标应用上的数据称作目标领域。值得注意的是,源领域和目标领域的数据分布通常是不同的,不同领域的数据分布的不同通常称为领域偏移(domainshift)。跨领域图像分类旨在使用源领域数据来提升目标领域上的分类效果,通常需要解决领域偏移的问题。跨领域图像分类问题已经研究了很多年,传统的方法包括调整样本的权重、进行特征的转换等等,近几年深度学习的方法在跨领域图像分类上取得了更好的效果,本专利技术属于基于深度学习的跨领域图像分类方法。基于深度学习的跨领 ...
【技术保护点】
1.一种基于细粒度领域自适应的跨领域图像分类方法,其特征在于,包括:/n步骤1、获取源领域中具有类别标签的源领域图片以及待分类的目标领域图片,依次输入源领域图片和目标领域图片至卷积神经网络,分别得到源领域图片的源特征向量和目标领域图片的目标特征向量;/n步骤2、依次输入源特征向量和目标特征向量至多层全连接层,在每个全连接层使用局部最大均值差异损失衡量源领域和目标领域的特征差异,源特征向量经过多层全连接层处理后,得到源整合特征,将该源整合特征送入分类器获得预测标签,该预测标签结合预标记的类别标签得到交叉熵,该交叉熵和该特征差异作为分类损失函数;/n步骤3、通过最小化该分类损失 ...
【技术特征摘要】 【专利技术属性】
1.一种基于细粒度领域自适应的跨领域图像分类方法,其特征在于,包括:
步骤1、获取源领域中具有类别标签的源领域图片以及待分类的目标领域图片,依次输入源领域图片和目标领域图片至卷积神经网络,分别得到源领域图片的源特征向量和目标领域图片的目标特征向量;
步骤2、依次输入源特征向量和目标特征向量至多层全连接层,在每个全连接层使用局部最大均值差异损失衡量源领域和目标领域的特征差异,源特征向量经过多层全连接层处理后,得到源整合特征,将该源整合特征送入分类器获得预测标签,该预测标签结合预标记的类别标签得到交叉熵,该交叉熵和该特征差异作为分类损失函数;
步骤3、通过最小化该分类损失函数对该卷积神经网络进行训练,直到该分类损失函数收敛,保存当前卷积神经网络作为图像特征提取网络,将目标领域中待分类图片输入至该图像特征提取网络,并将得到的特征向量输入至分类器,得到待分类图片的图像分类结果。
2.如权利要求1所述的基于细粒度领域自适应的跨领域图像分类方法,其特征在于,步骤2中该局部最大均值差异损失具体为:
公式中的wisc表示源领域图片xis和类别c相关联的程度,witc表示源目标域图片xis和类别c相关联的程度,p和q分别表示源领域和目标领域的数据分布,Ds表示源领域集合,Dt表示目标领域集合,j是索引,H是希尔伯特空,φ表示到高维空间的映射。
3.如权利要求1所述的基于细粒度领域自适应的跨领域图像分类方法,其特征在于,步骤2中该局部最大均值差异损失具体为:
式中k表示核函数,wisc表示源领域图片xis和类别c相关联的程度,witc表示源目标域图片xis和类别c相关联的程度,z表示通过卷积神经网络提取到的特征。
4.如权利要求2所述的基于细粒度领域自适应的跨领域图像分类方法,其特征在于,步骤2中该分类损失函数为:
式中第一项为该交叉熵,在源领域上的交叉熵f(xsi)表示网络预测的结果,ysi表示真实标签,第二项为通过该局部最大均值差异损失求得的该特征差异。
5.如权利要求1所述的基于细粒度领域自适应的跨领域图像分类方法,其特征在于,该类别标签采用one-hot编码。
技术研发人员:朱勇椿,庄福振,何清,
申请(专利权)人:中国科学院计算技术研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。