一种基于无监督域适应的图像分类方法技术

技术编号:24499298 阅读:78 留言:0更新日期:2020-06-13 04:21
本发明专利技术公开一种基于无监督域适应的图像分类方法,包括:选取有标签的源域图像数据集和无标签的目标域图像数据集,并进行数据增广;构造对抗迁移网络减少源域图像数据集和目标域图像数据集条件分布的差异性;构造时序集成网络正则化目标域图像数据集中图像标签的预测结果;将对抗迁移网络、时序集成网络进行联合,构造图像分类模型;将增广后的图像数据集做为训练集,采用元学习的方式对图像分类模型进行训练;用训练后的图像分类模型对待分类的目标图像进行识别,完成目标图像分类。本发明专利技术在面向网络上海量图像数据分类的过程中,极大减少了人力标注数据,且不影响图像分类的准确率,用户能快速准确地从海量图像数据中搜索到所需要的图像。

An image classification method based on unsupervised domain adaptation

【技术实现步骤摘要】
一种基于无监督域适应的图像分类方法
本专利技术涉及图像识别
,特别是涉及一种基于无监督域适应的图像分类方法。
技术介绍
随着数码产品极易智能移动终端设备的普及,存储设备以及计算机网络的发展,每天网络上面新增数以亿计的海量图像数据,这些图像数据中蕴含着大量宝贵的信息,不加以合理地利用明显是一种极大的浪费。然而面对浩瀚庞大的图像数据库,如何将图像进行快速准确地分类,得到用户要搜索的图像结果,成为了科研以及商业领域迫切需要解决的问题。当今许多人工智能技术在网络图像的分类识别领域取得了巨大成就,但是这些人工智能技术均依赖于大量的标注,而标注大量数据的过程对劳动者来说非常艰辛,且成本极为昂贵,甚至是不可行的。鉴于以上原因,在面向海量网络图像数据的分类过程中,如何减少标注量,且在减少标注量的同时又不影响模型的分类准确率成为当下急需解决的一个问题。
技术实现思路
本专利技术的目的是提供一种基于无监督域适应的图像分类方法,以解决上述现有技术存在的问题,能够有效减少数据的标注量且不影响图像分类的准确率。为实现上述目的,本专利技术提供了如下方案:本专利技术提供一种基于无监督域适应的图像分类方法,包括如下步骤:S1、选取源域图像数据集和目标域图像数据集;所述源域图像数据集中的图像数据有标签,所述目标域图像数据集中的图像数据无标签;S2、对所选取的源域图像数据集和目标域图像数据集进行数据增广;S3、构造对抗迁移网络,通过对抗迁移网络减少源域图像数据集和目标域图像数据集条件分布的差异性;S4、构造时序集成网络,通过时序集成网络来正则化目标域图像数据集中图像标签的预测结果;来正则化目标域图像数据集中图像标签的预测结果;S5、将步骤S3所构造的对抗迁移网络、步骤S4所构造的时序集成网络进行联合,构造图像分类模型;将步骤S2增广后的图像数据集做为训练集,采用元学习的方式对图像分类模型进行训练;S6、采用步骤S5训练后的图像分类模型对待分类的目标图像进行识别,完成目标图像的分类。优选地,步骤S2中数据增广方式采用随机增广,包括:随机旋转、随机水平翻转、随机竖直翻转、随机仿射变换、高斯噪声。优选地,步骤S3中,对抗迁移网络的损失函数如式1所示:其中,Ns表示源域图像数量,Nt表示目标域图像数量;表示源域的域标签,设为0;表示目标域的域标签,设为1;Gd(·)表示判别器网络;g(·)表示梯度反转层;Gf(·)表示生成器网络,生成器网络为普通的卷积神经网络CNN;h(·)为数据增广操作;θm为生成器网络的参数,并将Gf(·;θm)定义为学生网络;为源域图像的真实标签,为目标域图像的伪标签,表示克罗内克积。优选地,步骤S4中,时序集成网络正则化项如式2所示:其中,M表示时序集成网络包括M组神经网络,即M个子任务;Gf(·)表示生成器网络,表示第m组神经网络的参数,并将定义为老师网络。优选地,步骤S4中,在神经网络的训练过程中,θm通过标准地反向传播进行更新,通过式3进行更新:其中,α表示平滑系数,t表示第t个训练步骤。优选地,步骤S5中,学生网络参数的更新方法如式4所示:其中,和分别表示源域图像和目标域图像经过随机增广后得到的特征值;Ys表示源域图像的标签集;β表示元学习元训练过程学习率;λ表示可调节的超参数;表示对抗损失函数;表示源域图像的标签损失函数,具体表达方式如式5所示:优选地,更新后的神经网络参数均采用时序集成网络正则化项来进行约束,优化后元学习的损失函数如式6所示:其中,η表示可调节的超参数。本专利技术公开了以下技术效果:(1)本专利技术通过域适应技术能够减少有标签的源域数据和无标签的目标域数据之间数据分布的差异,从而能够将借助于源域数据训练的模型应用在无标注信息的目标域上,因此,在面向网络上海量图像数据的分类过程中,极大减少了人力标注数据;(2)本专利技术包含了两个主要的子网络:一个子网络在基于标注的条件分布特征上引入了对抗训练的过程;另一个子网络用一个时序集成网络作为正则项来约束不含标注信息的目标域图像数据集上标注信息的预测结果;因此,本专利技术一方面可以学习到源域图像数据集与目标域图像数据集之间数据分布的差异性,另一方面能够从有标签信息的源域图像数据集到无标签信息的目标域图像数据集,正则化约束标注信息预测结果的一致性;同时,本专利技术提出了一种基于元学习的训练方法来避免负迁移,从而能使图像分类模型朝着域迁移和标签映射的方向上进行稳定地训练,能够有效保证网络上海量图像数据分类的准确性,从而用户能够快速搜索到所需要的图像。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术基于无监督域适应的图像分类模型结构图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。参照图1所示,本实施例提供一种基于无监督域适应的图像分类方法,包括如下步骤:S1、从网络搜索引擎中选取源域图像数据集Xs和目标域图像数据集Xt;所述源域图像数据集Xs中的图像数据有标签,所述目标域图像数据集Xt中的图像数据无标签。S2、对源域图像数据集Xs和目标域图像数据集Xt分别进行M组数据增广,得到增广后的图像数据集其中,和是由Xs和Xt经过相同的数据增广操作得到的,和是由Xt经过不同的数据增广操作得到的。数据增广方式采用随机增广h(·),包括:随机旋转、随机水平翻转、随机竖直翻转、随机仿射变换、高斯噪声。S3、构造对抗迁移网络,通过对抗迁移网络减少源域图像数据集和目标域图像数据集条件分布的差异性;对抗迁移网络的损失函数如式(1)所示:其中,Ns表示源域图像数量,Nt表示目标域图像数量;表示源域的域标签,设为0;表示目标域的域标签,设为1;Gd(·)表示判别器网络;g(·)表示梯度反转层;Gf(·)表示生成器网络,生成器网络为普通的卷积神经网络CNN;h(·)为数据增广操作;θm为生成器网络的参数,并将Gf(·;θm)定义为学生网络;为源域图像的真实标签,为目标域图像的伪标签,表示克罗内克积。S4、构造一组时序集成网络,通过时序集成网络来正则化目标域图像数据集中图像标签的预测结果;时序集成网络正则化项如式(2)所示:其中,M表示时序集成网本文档来自技高网...

【技术保护点】
1.一种基于无监督域适应的图像分类方法,其特征在于,包括如下步骤:/nS1、选取源域图像数据集和目标域图像数据集;所述源域图像数据集中的图像数据有标签,所述目标域图像数据集中的图像数据无标签;/nS2、对所选取的源域图像数据集和目标域图像数据集进行数据增广;/nS3、构造对抗迁移网络,通过对抗迁移网络减少源域图像数据集和目标域图像数据集条件分布的差异性;/nS4、构造时序集成网络,通过时序集成网络来正则化目标域图像数据集中图像标签的预测结果;来正则化目标域图像数据集中图像标签的预测结果;/nS5、将步骤S3所构造的对抗迁移网络、步骤S4所构造的时序集成网络进行联合,构造图像分类模型;将步骤S2增广后的图像数据集做为训练集,采用元学习的方式对图像分类模型进行训练;/nS6、采用步骤S5训练后的图像分类模型对待分类的目标图像进行识别,完成目标图像的分类。/n

【技术特征摘要】
1.一种基于无监督域适应的图像分类方法,其特征在于,包括如下步骤:
S1、选取源域图像数据集和目标域图像数据集;所述源域图像数据集中的图像数据有标签,所述目标域图像数据集中的图像数据无标签;
S2、对所选取的源域图像数据集和目标域图像数据集进行数据增广;
S3、构造对抗迁移网络,通过对抗迁移网络减少源域图像数据集和目标域图像数据集条件分布的差异性;
S4、构造时序集成网络,通过时序集成网络来正则化目标域图像数据集中图像标签的预测结果;来正则化目标域图像数据集中图像标签的预测结果;
S5、将步骤S3所构造的对抗迁移网络、步骤S4所构造的时序集成网络进行联合,构造图像分类模型;将步骤S2增广后的图像数据集做为训练集,采用元学习的方式对图像分类模型进行训练;
S6、采用步骤S5训练后的图像分类模型对待分类的目标图像进行识别,完成目标图像的分类。


2.根据权利要求1所述的基于无监督域适应的图像分类方法,其特征在于,步骤S2中数据增广方式采用随机增广,包括:随机旋转、随机水平翻转、随机竖直翻转、随机仿射变换、高斯噪声。


3.根据权利要求1所述的基于无监督域适应的图像分类方法,其特征在于,步骤S3中,对抗迁移网络的损失函数如式1所示:



其中,Ns表示源域图像数量,Nt表示目标域图像数量;表示源域的域标签,设为0;表示目标域的域标签,设为1;Gd(·)表示判别器网络;g(·)表示梯度反转层;Gf(·)表示生成器网络,生成器网络为普通的卷积神...

【专利技术属性】
技术研发人员:徐增林陈迪
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1