一种基于字典域适应的迁移稀疏编码图像分类方法技术

技术编号:20285431 阅读:14 留言:0更新日期:2019-02-10 17:55
本发明专利技术公开了一种基于字典域适应的迁移稀疏编码图像分类方法,属于机器学习领域。该方法在传统稀疏编码模型基础上引入字典对齐机制,构造特征迁移分类模型,来解决图像跨领域分类问题。源域和目标域样本服从不同分布时,传统稀疏编码图像分类算法,因无法从源域样本学习获取对目标域样本有效编码的字典,导致分类性能下降。本发明专利技术首先将字典对齐机制引入稀疏编码模型,其次采用L2正则化将字典约束项转化为无约束优化问题,并采用领域间字典逼近作为正则化项提升模型的知识迁移性能。本发明专利技术能有效抽取跨领域图像稀疏特征表示,获取更高的分类精度。

A Classification Method of Migrating Sparse Coded Images Based on Dictionary Domain Adaptation

The invention discloses a migration sparse coding image classification method based on dictionary domain adaptation, which belongs to the field of machine learning. Based on the traditional sparse coding model, a dictionary alignment mechanism is introduced to construct a feature migration classification model to solve the cross-domain image classification problem. When the samples of source domain and target domain obey different distributions, the traditional sparse coding image classification algorithm can not acquire the dictionary which effectively encodes the samples of target domain from the samples of source domain, which results in the degradation of classification performance. The invention first introduces dictionary alignment mechanism into sparse coding model, then transforms dictionary constraints into unconstrained optimization problems by L2 regularization, and uses inter-domain dictionary approximation as regularization term to improve knowledge transfer performance of the model. The method can effectively extract sparse feature representations of cross-domain images and obtain higher classification accuracy.

【技术实现步骤摘要】
一种基于字典域适应的迁移稀疏编码图像分类方法
本专利技术属于机器学习领域,具体涉及一种基于字典域适应的迁移稀疏编码图像分类方法。
技术介绍
采用机器学习方法进行图像分类是机器视觉和模式识别领域的热门研究课题。图像分类技术是指借助计算机对图像数据进行特征提取,形成一种对图像内容的描述,并根据这种描述对图像所属类别进行划分的图像处理方法。该技术具有广阔的应用前景,例如:互联网领域中基于内容的图片检索、个人图库自动归类、医学领域的图像识别或者安防领域中人脸识别和智能视频分析等。当前,研究者们已经提出了许多基于数据驱动的图像分类算法,即通过大量已标记数据对分类器进行训练和学习,将得到的分类模型对测试样本进行类别标签预测,其中较为常用的分类算法有:感知机、Logistic回归、K近邻,贝叶斯、决策树、支持向量机等。图像分类过程中,特征提取是获取图像表示的重要环节,它将原始图像数据转化为一组具有明显物理意义的信息,如几何、纹理或统计意义特征等。良好的特征提取可以挖掘输入图像许多更有意义的潜在信息,有益于对图像内容产生更深入的理解,同时也有助于训练并获取高精度的分类模型。稀疏编码作为起源于对人类视觉系统识别过程探索的仿生学方法,可以对图像去除繁杂冗余信息,获取原始信息最本质的特征表示,受到了研究者广泛关注。稀疏编码是对生物视觉识别自然图像过程的简单模拟。研究人员发现,虽然生物视觉系统神经元纵横交错、数目巨大,但是面对外界刺激响应时呈现稀疏特性,即仅有少数视觉神经元处于激活状态。这种稀疏性编码方式符合自然界生物进化普遍存在的能量消耗最小化策略,在面对复杂图像时,能够提供对繁杂冗余信息的简单表达与本质性描述,具有很好的去冗余与可解释性。稀疏编码作为一种高效图像特征提取算法,在信号处理、图像分类及人脸识别等领域获得广泛关注,并取得良好效果。机器学习虽然已经取得令人瞩目的成果,但与人类学习能力相比,还存在较大缺陷。目前,传统基于特征的图像分类算法,为获取高准确性与可靠性分类器,通常存在两个基本假设:(1)训练样本与测试样本必须服从相同的概率分布或者位于相同特征空间;(2)必须有足够多的标记样本。然而在许多实际应用中,对描述同一目标对象随着时间推移和周围环境变化,会产生不同程度的差异。此时,需要重新收集标记样本训练分类模型,但收集大量标记样本非常耗时耗力且代价昂贵;另外,标记样本也因难以获取造成数量稀少,导致出现所抽取特征表达能力有限的问题。稀疏编码作为一种强有力的高层特征提取工具,在面对复杂输入图像时,能够提供对图像的简单表示。然而在实际应用中,随着信息和图像规模的与日俱增,通常因为测试环境中光照、位移、角度等因素的变化,使得训练和测试样本的分布存在差异,导致传统稀疏编码图像分类模型在跨领域图像分类场景下性能骤降,难以获得令人满意的效果。迁移稀疏编码图像分类技术采用迁移学习思想,通过发掘不同但相关领域间不变的特征和结构并充分利用已有资源,构建稀疏特征迁移模型,将其他相关任务中的知识迁移至标记样本稀少的目标任务,帮助提升目标任务的学习效率。迁移稀疏编码图像分类技术将稀疏编码与迁移学习技术相结合,是实现稀疏特征在不同领域间进行重复利用的新技术。
技术实现思路
本专利技术所要解决的技术问题是:针对上述现有技术,提出一种基于字典域适应的迁移稀疏编码图像分类方法,解决了当训练和测试样本来自不同分布,面对不同分布领域的样本量化出不同的字典,造成编码特征差异,从而严重影响分类性能的问题。本专利技术为解决上述技术问题采用以下技术方案:本专利技术提出一种基于字典域适应的迁移稀疏编码图像分类方法,包含以下步骤:步骤一、对源域和目标域中图像样本分别进行预处理,获取源域和目标域图像数据集XS与XT;步骤二、分别采用源域和目标域图像数据集XS与XT训练稀疏编码模型,获取源域和目标域字典BS与BT;步骤三、通过对齐源域和目标域字典BS与BT,使得源域和目标域间的图像稀疏编码特征在跨领域知识迁移过程中保持不变,经过字典与编码交替优化过程来学习域适应字典B*,获得不同领域间样本关于域适应字典的共享编码特征A*={AS,AT},其中AS为源域图像数据集XS的稀疏编码;AT为目标域图像数据集XT的稀疏编码;减少源域和目标域间样本的分布差异性,实现稀疏编码在不同领域间的迁移;步骤四、采用源域图像数据集XS的稀疏编码AS及其标签集YS训练SVM分类器,对所述目标域图像数据集XT对应稀疏编码AT进行标签预测。如前所述的一种基于字典域适应的迁移稀疏编码图像分类方法,步骤一中所述对源域和目标域中的图像样本预处理步骤如下:(1)对源域和目标域中图像样本XS1与XT1分别进行分辨率一致缩放处理,得到XS2与XT2;(2)将数据集XS2与XT2分别进行归一化处理,得到数据集XS3与XT3;(3)将数据集XS3与XT3分别进行PCA降维处理,得到源域和目标域图像数据集XS与XT。如前所述的一种基于字典域适应的迁移稀疏编码图像分类方法,步骤二中所述构造两组稀疏编码模型为其中,c为字典约束项的阈值参数,用于控制模型的复杂度,AS为源域编码,AT为目标域编码。如前所述的一种基于字典域适应的迁移稀疏编码图像分类方法,步骤三中源域字典BS向目标域字典BT对齐后的字典的求解过程包括:(1)构建字典对齐目标函数并优化:(2)解出最优坐标转换矩阵(3)对字典进行转换:采用M*将源域字典BS向目标域字典BT对齐,则Ba=BSM*可视为源域字典BS向目标域字典BT对齐后的字典。如前所述的一种基于字典域适应的迁移稀疏编码图像分类方法,进一步地,步骤三中,所述构建基于字典域适应的迁移稀疏编码模型的目标函数如下:其中,和分别为源域和目标域样本的重构误差,μ为两者间平衡系数,λ为稀疏惩罚系数,为领域间字典逼近正则项。如前所述的基于字典域适应的迁移稀疏编码图像分类方法,进一步地,所述步骤三中,对基于字典域适应的迁移稀疏编码模型目标函数进行字典与编码的交替优化过程中,采用L2正则化项替代目标函数中字典约束项如前所述的基于字典域适应的迁移稀疏编码图像分类方法,进一步地,所述步骤三中,采用领域间字典逼近正则项取代字典L2正则化项提升知识迁移效率。本专利技术采用以上技术方案与现有技术相比,具有以下技术效果:(1)采用稀疏编码学习超完备字典找寻隐含在输入数据内部的结构和模式,同时稀疏性使得编码特征更易于线性可分;(2)采用字典对齐的方式来学习域适应字典,以保证不同领域样本都编码关于域适应字典的共享特征,从而提高编码特征从源域到目标域的可迁移性;(3)将字典约束问题使用L2正则项转化为了无约束优化问题,可以方便的求出字典优化的解析解,避免了在对字典的优化过程使用复杂的拉格朗日对偶法,同时采用领域间字典逼近正则项取代字典L2正则化项如此设计不仅解决了跨领域稀疏编码图像分类性能下降的问题,提升知识迁移效率,而且简化了字典优化的求解步骤。附图说明图1是本专利技术实施例所用数据集部分图像;图2是传统稀疏编码图像分类方法流程图;图3是基于字典域适应的迁移稀疏编码图像分类方法流程图;图4是16组跨域图像分类精度条形图;图5是各参数对算法分类精度影响;图6是特征可视化散点图。具体实施方式本
技术人员可以理解的是,除非另外定义,这里使用的所本文档来自技高网
...

【技术保护点】
1.一种基于字典域适应的迁移稀疏编码图像分类方法,其特征在于,包含以下步骤:步骤一、对源域和目标域图像样本分别进行预处理,获取源域和目标域图像数据集XS与XT;步骤二、分别采用源域和目标域图像数据集XS与XT训练稀疏编码模型,获取源域和目标域字典BS与BT;步骤三、通过对齐源域和目标域字典BS与BT,使得源域和目标域间的图像稀疏编码特征在跨领域知识迁移过程中保持不变,同时得到源域向目标域对齐后的字典Ba;借助Ba,并通过源域和目标域重构误差和领域间字典逼近正则项,构建基于字典域适应的迁移稀疏编码模型的目标函数;经过字典与编码交替优化过程来学习域适应字典B*,也获得不同领域间样本关于域适应字典的共享编码特征A*={AS,AT},其中AS为源域图像数据集XS的稀疏编码;AT为目标域图像数据集XT的稀疏编码;步骤四、采用源域图像数据集XS的稀疏编码AS及其标签集YS训练SVM分类器,对所述目标域图像数据集XT对应稀疏编码AT进行标签预测。

【技术特征摘要】
1.一种基于字典域适应的迁移稀疏编码图像分类方法,其特征在于,包含以下步骤:步骤一、对源域和目标域图像样本分别进行预处理,获取源域和目标域图像数据集XS与XT;步骤二、分别采用源域和目标域图像数据集XS与XT训练稀疏编码模型,获取源域和目标域字典BS与BT;步骤三、通过对齐源域和目标域字典BS与BT,使得源域和目标域间的图像稀疏编码特征在跨领域知识迁移过程中保持不变,同时得到源域向目标域对齐后的字典Ba;借助Ba,并通过源域和目标域重构误差和领域间字典逼近正则项,构建基于字典域适应的迁移稀疏编码模型的目标函数;经过字典与编码交替优化过程来学习域适应字典B*,也获得不同领域间样本关于域适应字典的共享编码特征A*={AS,AT},其中AS为源域图像数据集XS的稀疏编码;AT为目标域图像数据集XT的稀疏编码;步骤四、采用源域图像数据集XS的稀疏编码AS及其标签集YS训练SVM分类器,对所述目标域图像数据集XT对应稀疏编码AT进行标签预测。2.根据权利要求1所述的一种基于字典域适应的迁移稀疏编码图像分类方法,其特征在于,步骤一中,所述对源域和目标域中的图像样本预处理包含如下步骤:(1)对源域和目标域中图像样本XS1与XT1分别进行分辨率一致缩放处理,得到数据集XS2与XT2;(2)将数据集XS2与XT2分别进行归一化处理,得到数据集XS3与XT3;(3)将数据集XS3与XT3分别进行PCA降维处理,得到源域和目标域图像数据集XS与XT。3.根据权利要求1所...

【专利技术属性】
技术研发人员:王雪松李泽军臧绍飞程玉虎
申请(专利权)人:中国矿业大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1