【技术实现步骤摘要】
一种面向图像分类任务的多层字典学习方法
本专利技术涉及计算机视觉的
,尤其涉及一种面向图像分类任务的多层字典学习方法。
技术介绍
近年来,字典学习算法在图像分类及信号处理邻域受到广泛关注。字典学习,本质上就是寻找合适的稀疏子空间(其基函数通常被称为字典)进行数据的特征表示,以实现高精度的重构或分类。基于Aharon和Elad在2006年提出的KSVD算法,字典学习方法已经广泛应用于图像重构问题(如图像去噪、图像修复、图像超分辨率重建等)并取得很好的效果,这促进了字典学习在图像分类问题上的发展。不同于图像重构问题,图像分类的目标是对样本的标签做出正确的预测,因此如何有效地提取样本中的类别信息成为解决图像分类问题的关键。为了提升字典方法在分类问题上的表现能力,越来越多的研究者在字典学习的目标函数中加入类别信息,此类模型通常被统称为判别式字典学习(DiscriminativeDictionaryLearning,DDL)模型。这种方法最早出现在2010年Zhang等人提出的判别式KSVD(Discriminative ...
【技术保护点】
1.一种面向图像分类任务的多层字典学习方法,其特征在于:该方法用于提取图像样本中的类别信息,包括以下步骤:/n(1)将多层字典之间的依赖关系定义为残差学习,基于多层残差判别字典学习框架来学习多层字典及分类器;/n(2)基于步骤(1)学习的多层字典依次计算待分类数据的多轮编码向量,再利用相应的分类器进行分类,加和各分类器预测值得到最终识别结果。/n
【技术特征摘要】
1.一种面向图像分类任务的多层字典学习方法,其特征在于:该方法用于提取图像样本中的类别信息,包括以下步骤:
(1)将多层字典之间的依赖关系定义为残差学习,基于多层残差判别字典学习框架来学习多层字典及分类器;
(2)基于步骤(1)学习的多层字典依次计算待分类数据的多轮编码向量,再利用相应的分类器进行分类,加和各分类器预测值得到最终识别结果。
2.根据权利要求1所述的面向图像分类任务的多层字典学习方法,其特征在于:所述步骤(1)中,以迭代的方式串行训练多层字典及与其关联的多层分类器,其中层与层之间有强依赖关系,每层的字典及分类器拟合的目标为前一层字典及分类器的重构残差;其中,第t层字典的重构残差指基于前t层字典计算的t个重构样本的和与原始样本的差,第t层分类器的重构残差指基于前t层分类器计算的t个估计标签的和与真实标签的差。
3.根据权利要求2所述的面向图像分类任务的多层字典学习方法,其特征在于:所述步骤(1)中,对于给定包含N个样本的集合最小化式(1)所示的目标函数联合学习字典和分类器,
其中,第一项为重构误差项,xi为真实样本,为基于字典与稀疏编码得到的重构样本;第二项为分类误差项,yi为样本真实标签,为基于分类器稀疏编码预测的样本标签;l表示误差函数;本方法通过T轮学习,使得重构样本和重构样本标签不断逼近真实样本和标签,具体到第t轮迭代,式(1)展开为以下形式:
4.根据权利要求3所述的面向图像分类任务的多层字典学习方法,其特征在于:所述步骤(1)中,
将式(2)的目标函数写成可求解形式,得到式(3)
其中为第i个训练样本在第t轮迭代的拟合目标;S为样本维度;t为迭代索引,1≤t≤T;表示第t个字典,K为字典原子数量;表示第t个分类器,C为类别数;为第i个样本在第t轮迭代的目标标签向量;为第i个样本在第t轮迭代的稀疏表示向量,训练集的稀疏表示矩阵记为θ为稀疏约束参数。
5.根据权利要求4所述的面向图像分类任务的多层字典学习方法,其特征在于:所述步骤(...
【专利技术属性】
技术研发人员:王立春,李爽,王少帆,孔德慧,尹宝才,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。