一种图像多分辨率字典学习方法及其应用技术

技术编号:19746344 阅读:23 留言:0更新日期:2018-12-12 04:55
本发明专利技术涉及一种图像多分辨率字典学习方法及其应用,所述方法包括如下步骤:步骤1,将多种分辨率图片输入训练模型;步骤2,通过图片训练得出各种分辨率的字典进行学习。本发明专利技术的另一个目的在于将所述图像多分辨率字典学习方法,应用于图像分类和检索,包括如下步骤:S001,输入待分类或检索的图像y;S002,基于多分辨率字典计算图像y的表示系数;S003,计算图像y与训练样例之间的差异度

【技术实现步骤摘要】
一种图像多分辨率字典学习方法及其应用
本专利技术涉及图像处理
,尤其涉及一种图像多分辨率字典学习方法及其应用。
技术介绍
字典学习是进行数据约减的重要手段。原始的大量数据经过字典学习后可得到冗余信息少、原子数远少于原样例数的字典。基于这样的字典,可以得出任一样例的有效的表示,且得出的表示会十分有利于样例的分类等任务。字典学习在广泛存在的图像数据的表示中得到了有效的应用。字典学习算法大致可以分为三类:监督字典学习算法,半监督字典学习算法和无监督字典学习算法。其中,监督词典学习算法,将多分类器训练融入词典学习中,以提高分类性能。这些受监督的字典学习算法在分类任务中取得了良好的性能。然而,在许多模式分类问题中,由于标签数据非常昂贵而且非常耗时,因此可能无法获得大量带标签的数据,而标记的训练数据不足对监督字典学习算法是不利的,计算容易发生错误。半监督的字典学习算法,使用标记的训练样本学习特定类字典,然后用它们来预测未标记训练样本的标签。然而,算法没有考虑标记数据和未标记数据的基本几何结构,并且通常不能保留局部结构,因此获得的字典对于分类任务可能不是最佳的。无监督字典学习算法通常基于训练样本的重建误差进行设计,并通过使用树结构稀疏编码字典的原子之间的依赖关系,难以独立计算且算法关系较为复杂另外,这三种的字典学习算法均假设图像具有单一的分辨率,学习得出的字典往往不能适应实际应用中分辨率可变的情形,需要将每种分辨率的图像中的各个局部块逐个在字典中进行匹配,非常耗时,效率低下,而难以取得图像的鲁棒表示结果,严重影响了字典学习算法的性能以及后续的识别和检测等。为了适应实际中图像的分辨率多变的情况,本专利技术对字典学习方法做了改进,提出多分辨率字典学习方法。
技术实现思路
针对现有技术中存在的缺陷或不足,本专利技术所要解决现有技术中的问题,而提供一种图像多分辨率字典学习方法及其应用,该方法能够结合多种分辨率图像的字典进行学习和有效地促进字典学习算法的鲁棒性和适应性,且算法简单、易于实现,并能有效应用在分类及检索中。为了实现上述目的,本专利技术采取的技术方案为提供一种图像多分辨率字典学习方法,所述方法包括如下步骤:步骤1,将多种分辨率图片输入训练模型;步骤2,通过图片训练得出各种分辨率的字典进行学习。作为本专利技术的进一步改进,所述步骤1中的将多种分辨率图片输入训练模型和所述步骤2中通过图片训练得出各种分辨率的字典进行学习,其过程包括如下步骤:步骤11,通过令每一种分辨率下的图像数量相同且等于N,设有k种分辨率;步骤12,令第一种分辨率下所有图像对应的列矢量组成的矩阵为Y1,第二种所有图像对应的列矢量组成的矩阵为Y2,……,第k种分辨率下所有图像对应的列矢量组成的矩阵为Yk,将每一种分辨率下的所有图像都转换为列矢量组成的矩阵,通过表达公式:输入训练模型,其中,为第j种分辨率下的第s个训练样例,而j=1,…,k,s=1,…,N;步骤13,设定图像多分辨率字典学习的目标函数为:令X=(x1,…,xN),其中x1,…,xN分别为第1至第N个训练样例的表示系数,β=0.0001;步骤14,根据步骤12的设定和步骤13的目标函数求取出字典D1,…,Dk,以进行学习。作为本专利技术的进一步改进,在所述步骤13中x1,…,xN也是字典D1,…,Dk的表示系数。作为本专利技术的进一步改进,在所述步骤14中求取字典D1,…,Dk,需要先求取系数矩阵X,系数矩阵X的求取分为第一次循环计算和第二次或以上循环计算;第一次循环计算时,向循环函数输入的字典为原始字典后通过公式:来计算,其中,为字典D_initk的转置矩阵,I为单位矩阵;第二次或以上循环计算时,向循环函数输入的字典为上一次循环中更新得出的字典,后通过公式来计算,其中,为字典Dk的转置矩阵,I为单位矩阵。作为本专利技术的进一步改进,在第二次或以上循环计算时,得出更新字典的过程是固定输入的系数矩阵X和保持除Dj之外的所有字典不变后,通过公式:Dj=(YjXT)(XXT)-1计算,得到更新字典Dj,其中j=1,…,k。作为本专利技术的进一步改进,所述的原始字典Dinit1,…,Dinitk,是将k种分辨率的图像运用KSVD算法进行训练,得出k种分辨率图像的字典D_init1,…,D_initk,求取D_initi(i=1,…,k)的步骤包括:步骤41,从样本集Yi(i=1,…,k)中随机挑选m个样本,作为D_initi的原子,并将系数矩阵X初始化为零矩阵;步骤42,通过公式计算出每个样本的表示系数x_initj,组成系数矩阵X_init,其中,表示第i组样本中的第j个样本;步骤43,保持系数矩阵X_init不变,通过如下公式:来逐列更新字典,其中,k表示字典D_initi第k列的更新,Yi表示第i组样本,D_initi表示第i组样本对应的字典,代表第i个字典中的第j列,代表系数矩阵X中的第j行;步骤44,再通过公式求出Ek;步骤44,重复步骤42和步骤43,直至ε为模型收敛时允许的最大差值,停止迭代,得到D_initi。本专利技术的另一个目的在于提供一种字典学习方法的应用,该应用是将所述图像多分辨率字典学习方法,应用于图像分类和检索中。作为本专利技术的进一步改进,所述分类或检索的应用,包括如下步骤:S001,输入待分类或检索的图像y;S002,基于多分辨率字典计算图像y的表示系数;S003,计算图像y与训练样例之间的差异度ds;S004,通过差异度ds判断y与哪个训练样本最接近;所述差异度ds通过公式ds=||xd1-xs||+…+||xdk-xs||计算,其中,xd1,…,xdk表示图像y关于字典D1,…,Dk的表示系数,其通过公式来计算,其中k=1,…,N,xs表示第s个训练样例基于多分辨率字典的表示系数;S005,得到最接近的训练样本后输出类标签或输出检索结果。作为本专利技术的进一步改进,所述步骤S102中基于多分辨率字典计算图像y的表示系数,其包括如下步骤:S101,输入k中分辨率的训练图像;S102,通过KSVD算法得到k种分辨率图的初始字典;S103,根据字典,更新系数矩阵;S104,根据系数矩阵,更新字典;S105,判断更新字典是否满足循环停止条件,若满足则步骤S104中的系数矩阵及更新字典为最终的多种分辨率字典以及系数矩阵,输送至步骤S002进行计算;若不满足则返回步骤S103循环更新,直至满足循环停止条件。本专利技术的有益效果是:本专利技术解决了实际生活中不同分辨率尺度图片识别正确率相对较低的问题,提出使用不同分辨率的图像学习多个字典,即每一种分辨率对应一个字典,并融合多字典进行训练;同时为了增强字典对不同分辨率的鲁棒性和适应性,方法要求学习得出的多个字典具有相似的系数矩阵,且算法简单、易于实现,并能有效应用在分类及检索中。附图说明图1是本专利技术提供的图像多分辨率字典学习方法的应用流程图;图2是本专利技术提供的YALEB人脸数据库样本图像集;图3是本专利技术提供的三种分别率分辨率图像;图4是本专利技术提供的应用本专利技术的方法的识别率比较图。具体实施方式下面结合附图说明及具体实施方式对本专利技术进一步说明。本实施例的一种图像多分辨率字典学习方法,该方法包括如下步骤:步骤1,将多种分辨率图片输入训练模型;步骤2,通过图片训练得出各种分辨本文档来自技高网
...

【技术保护点】
1.一种图像多分辨率字典学习方法,其特征在于:所述方法包括如下步骤:步骤1,将多种分辨率图片输入训练模型;步骤2,通过图片训练得出各种分辨率的字典进行学习。

【技术特征摘要】
1.一种图像多分辨率字典学习方法,其特征在于:所述方法包括如下步骤:步骤1,将多种分辨率图片输入训练模型;步骤2,通过图片训练得出各种分辨率的字典进行学习。2.根据权利要求1所述的图像多分辨率字典学习方法,其特征在于:所述步骤1中的将多种分辨率图片输入训练模型和所述步骤2中通过图片训练得出各种分辨率的字典进行学习,其过程包括如下步骤:步骤11,通过令每一种分辨率下的图像数量相同且等于N,设有k种分辨率;步骤12,令第一种分辨率下所有图像对应的列矢量组成的矩阵为Y1,第二种所有图像对应的列矢量组成的矩阵为Y2,第k种分辨率下所有图像对应的列矢量组成的矩阵为Yk,将每一种分辨率下的所有图像都转换为列矢量组成的矩阵,通过表达公式:输入训练模型,其中,为第j种分辨率下的第s个训练样例,且j=1,…,k,s=1,…,N;步骤13,设定图像多分辨率字典学习的目标函数为:令系数矩阵X=(x1,…,xN),其中x1,…,xN分别为第1至第N个训练样例的表示系数,β=0.0001;步骤14,根据步骤12的设定和步骤13的目标函数求取出字典D1,…,Dk,用于进行学习。3.根据权利要求2所述的图像多分辨率字典学习方法,其特征在于:在所述步骤13中x1,…,xN为字典D1,…,Dk的表示系数。4.根据权利要求2所述的图像多分辨率字典学习方法,其特征在于:在所述步骤14中求取字典D1,…,Dk,需要先求取系数矩阵X,系数矩阵X的求取分为第一次循环计算和第二次或以上循环计算;其中,第一次循环计算时,向循环函数输入原始字典后通过公式:计算系数矩阵X,其中,为字典D_initk的转置矩阵,I为单位矩阵;第二次或以上循环计算时,向循环函数输入的字典为上一次循环中更新得出的字典,通过公式计算系数矩阵X,其中,为字典Dk的转置矩阵,I为单位矩阵。5.根据权利要求4所述的图像多分辨率字典学习方法,其特征在于:在第二次或以上循环计算时,得出更新字典的过程是固定输入的系数矩阵X和保持除Dj之外的所有字典不变后,通过公式:Dj=(YjXT)(XXT)-1计算,得到更新字典Dj,其中j=1,…,k。6.根据权利要求4所述的图像多分辨率字典学习方法,其特征在于:所述的原始字典是将k种分辨率的图像运用KS...

【专利技术属性】
技术研发人员:徐勇罗笑玲
申请(专利权)人:哈尔滨工业大学深圳
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1