The invention discloses a migration sparse coding image classification method based on dictionary domain adaptation, which belongs to the field of machine learning. Based on the traditional sparse coding model, a dictionary alignment mechanism is introduced to construct a feature migration classification model to solve the cross-domain image classification problem. When the samples of source domain and target domain obey different distributions, the traditional sparse coding image classification algorithm can not acquire the dictionary which effectively encodes the samples of target domain from the samples of source domain, which results in the degradation of classification performance. The invention first introduces dictionary alignment mechanism into sparse coding model, then transforms dictionary constraints into unconstrained optimization problems by L2 regularization, and uses inter-domain dictionary approximation as regularization term to improve knowledge transfer performance of the model. The method can effectively extract sparse feature representations of cross-domain images and obtain higher classification accuracy.
【技术实现步骤摘要】
一种基于字典域适应的迁移稀疏编码图像分类方法
本专利技术属于机器学习领域,具体涉及一种基于字典域适应的迁移稀疏编码图像分类方法。
技术介绍
采用机器学习方法进行图像分类是机器视觉和模式识别领域的热门研究课题。图像分类技术是指借助计算机对图像数据进行特征提取,形成一种对图像内容的描述,并根据这种描述对图像所属类别进行划分的图像处理方法。该技术具有广阔的应用前景,例如:互联网领域中基于内容的图片检索、个人图库自动归类、医学领域的图像识别或者安防领域中人脸识别和智能视频分析等。当前,研究者们已经提出了许多基于数据驱动的图像分类算法,即通过大量已标记数据对分类器进行训练和学习,将得到的分类模型对测试样本进行类别标签预测,其中较为常用的分类算法有:感知机、Logistic回归、K近邻,贝叶斯、决策树、支持向量机等。图像分类过程中,特征提取是获取图像表示的重要环节,它将原始图像数据转化为一组具有明显物理意义的信息,如几何、纹理或统计意义特征等。良好的特征提取可以挖掘输入图像许多更有意义的潜在信息,有益于对图像内容产生更深入的理解,同时也有助于训练并获取高精度的分类模型。稀疏编码作为起源于对人类视觉系统识别过程探索的仿生学方法,可以对图像去除繁杂冗余信息,获取原始信息最本质的特征表示,受到了研究者广泛关注。稀疏编码是对生物视觉识别自然图像过程的简单模拟。研究人员发现,虽然生物视觉系统神经元纵横交错、数目巨大,但是面对外界刺激响应时呈现稀疏特性,即仅有少数视觉神经元处于激活状态。这种稀疏性编码方式符合自然界生物进化普遍存在的能量消耗最小化策略,在面对复杂图像时,能够提供对 ...
【技术保护点】
1.一种基于字典域适应的迁移稀疏编码图像分类方法,其特征在于,包含以下步骤:步骤一、对源域和目标域图像样本分别进行预处理,获取源域和目标域图像数据集XS与XT;步骤二、分别采用源域和目标域图像数据集XS与XT训练稀疏编码模型,获取源域和目标域字典BS与BT;步骤三、通过对齐源域和目标域字典BS与BT,使得源域和目标域间的图像稀疏编码特征在跨领域知识迁移过程中保持不变,同时得到源域向目标域对齐后的字典Ba;借助Ba,并通过源域和目标域重构误差和领域间字典逼近正则项,构建基于字典域适应的迁移稀疏编码模型的目标函数;经过字典与编码交替优化过程来学习域适应字典B*,也获得不同领域间样本关于域适应字典的共享编码特征A*={AS,AT},其中AS为源域图像数据集XS的稀疏编码;AT为目标域图像数据集XT的稀疏编码;步骤四、采用源域图像数据集XS的稀疏编码AS及其标签集YS训练SVM分类器,对所述目标域图像数据集XT对应稀疏编码AT进行标签预测。
【技术特征摘要】
1.一种基于字典域适应的迁移稀疏编码图像分类方法,其特征在于,包含以下步骤:步骤一、对源域和目标域图像样本分别进行预处理,获取源域和目标域图像数据集XS与XT;步骤二、分别采用源域和目标域图像数据集XS与XT训练稀疏编码模型,获取源域和目标域字典BS与BT;步骤三、通过对齐源域和目标域字典BS与BT,使得源域和目标域间的图像稀疏编码特征在跨领域知识迁移过程中保持不变,同时得到源域向目标域对齐后的字典Ba;借助Ba,并通过源域和目标域重构误差和领域间字典逼近正则项,构建基于字典域适应的迁移稀疏编码模型的目标函数;经过字典与编码交替优化过程来学习域适应字典B*,也获得不同领域间样本关于域适应字典的共享编码特征A*={AS,AT},其中AS为源域图像数据集XS的稀疏编码;AT为目标域图像数据集XT的稀疏编码;步骤四、采用源域图像数据集XS的稀疏编码AS及其标签集YS训练SVM分类器,对所述目标域图像数据集XT对应稀疏编码AT进行标签预测。2.根据权利要求1所述的一种基于字典域适应的迁移稀疏编码图像分类方法,其特征在于,步骤一中,所述对源域和目标域中的图像样本预处理包含如下步骤:(1)对源域和目标域中图像样本XS1与XT1分别进行分辨率一致缩放处理,得到数据集XS2与XT2;(2)将数据集XS2与XT2分别进行归一化处理,得到数据集XS3与XT3;(3)将数据集XS3与XT3分别进行PCA降维处理,得到源域和目标域图像数据集XS与XT。3.根据权利要求1所...
【专利技术属性】
技术研发人员:王雪松,李泽军,臧绍飞,程玉虎,
申请(专利权)人:中国矿业大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。