基于深度迁移字典学习的精细图像分类方法技术

技术编号:30247311 阅读:18 留言:0更新日期:2021-10-09 20:30
本发明专利技术涉及一种基于深度迁移字典学习的精细图像分类方法,其特征在于包括构建深度字典学习模型,学习源领域字典和目标领域字典以提取精细图像的复杂非线性特征,而后在深度字典学习模型的每层中通过梯度下降法对输出层的目标函数进行求解以获得输出层的编码字典和编码系数;并通过求解得到的编码字典和编码系数得出分类器参数进而构建出分类方法模型。本发明专利技术解决了源领域精细图像和目标领域精细图像属于不同分布的问题,从而提高了精细图像的分类性能。的分类性能。的分类性能。

【技术实现步骤摘要】
基于深度迁移字典学习的精细图像分类方法


[0001]本专利技术属于精细图像分类领域,具体是涉及一种基于深度迁移字典学习的精细图像分类方法。

技术介绍

[0002]深度字典学习算法能够提取精细图像的复杂非线性特征,广泛应用于精细图像分类等领域中。但是,目前的深度字典学习算法均属于独立同分布条件下的模式分类问题,该条件在精细图像分类应用中很难满足。通常,精细图像是由不同设备在不同环境下拍摄的反映物体细微差异的图像,它们通常具有多种不同类型的特征分布,导致目前的深度字典学习方法在精细图像分类应用中难以获得满意性能。为此,本专利提出一种半监督深度迁移字典学习模型并应用于精细图像分类系统中,以提高精细图像的分类性能。

技术实现思路

[0003]为了达到上述目的,本专利技术基于深度迁移字典学习的精细图像分类方法,主要包括以下步骤:
[0004]首先,利用合成字典构造深度字典学习模型,并采取梯度下降法更新每层的字典和编码系数;
[0005]其次,利用源领域和目标领域中具有类标的精细图像分别对应学习源领域字典和目标领域字典,并分别提取源领域和目标领域中精细图像的复杂非线性特征;
[0006]第三,在深度字典学习模型的每层中,利用原子和编码系数矩阵的行向量构造自适应最大平均差异模型,以减少源领域和目标领域的分布差异,并采取梯度下降法对输出层的目标函数进行求解,从而获得输出层的编码字典和编码系数;
[0007]第四,从输出层的编码系数矩阵中提取目标领域编码系数,结合目标领域样本的类标矩阵得出分类器参数;
[0008]第五,构造分类方法的模型,利用输出层的目标领域字典及测试样本来计算其对应的编码系数,然后结合分类器参数构造出分类方法的模型;最后,把测试样本输入到分类方法的模型中,从而输出测试样本的类标。
[0009]作为上述方案的进一步改进,所述第三步在深度字典学习模型的每层中,每一层的输出即为下一层的输入,直至对最后一层的输出层的目标函数进行求解,从而获得输出层的编码字典和编码系数。
[0010]作为上述方案的进一步改进,第六步中,所述分类方法的模型是通过分类器参数与测试样本编码系数乘积的数值的最大数值对应的类来作为测试样本的类标的。
[0011]针对深度字典学习方案假设精细图像分类属于同分布模式分类问题,本专利技术提出深度迁移字典学习模型,解决源领域精细图像和目标领域精细图像属于不同分布问题,并利用目标领域中的部分类标数据设计半监督深度迁移字典学习模型,提高精细图像的分类性能。其次,在每层迁移字典学习模型中,利用迁移字典原子及其对应的编码系数矩阵行向
量构造自适应最大平均差异模型,最小化源领域和目标领域的分布差异。本专利技术利用深度字典提取精细图像的复杂非线性特征,并通过构造逐层自适应最大平均差异模型,减少领域差异,提高了深度字典学习算法应用在多领域精细图像分类系统中的性能。
附图说明
[0012]图1为本专利技术的流程示意图。
具体实施方式
[0013]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0014]参照图1,本专利技术基于深度迁移字典学习的精细图像分类方法,主要包括以下步骤:
[0015]首先,利用合成字典构造深度字典学习模型,并采取梯度下降法更新每层的字典和编码系数;
[0016]其次,利用源领域和目标领域中具有类标的精细图像分别对应学习源领域字典和目标领域字典,并分别提取源领域和目标领域中精细图像的复杂非线性特征;
[0017]第三,在深度字典学习模型的每层中,利用原子和编码系数矩阵的行向量构造自适应最大平均差异模型,以减少源领域和目标领域的分布差异,并采取梯度下降法对输出层的目标函数进行求解,从而获得输出层的编码字典和编码系数;
[0018]第四,从输出层的编码系数矩阵中提取目标领域编码系数,结合目标领域样本的类标矩阵得出分类器参数;
[0019]第五,构造分类方法的模型,利用输出层的目标领域字典及测试样本来计算其对应的编码系数,然后结合分类器参数构造出分类方法的模型;最后,把测试样本输入到分类方法的模型中,从而输出测试样本的类标。
[0020]所述第三步在深度字典学习模型的每层中,每一层的输出即为下一层的输入,直至对最后一层的输出层的目标函数进行求解,从而获得输出层的编码字典和编码系数。而在第六步中,所述分类方法的模型是通过分类器参数与测试样本编码系数乘积的数值的最大数值对应的类来作为测试样本的类标的。
[0021]参照图1,在算法方面,假设为源领域已知类标训练精细图像样本,为目标领域中已知类标样本,m是样本的维数,n和b分别是源领域和目标领域中已知类标样本个数。是第l层字典,其中和分别是利用源领域样本和目标领域样本学习的第l层字典。是第l层编码系数,其中和分别是利用源领域样本和目标领域样本学习的第l层编码系数。
[0022]深度迁移字典学习模型构造如下:
[0023]第一步:把源领域带类标精细图像F
s
和F
t
作为深度迁移字典学习模型的输入。
[0024]第二步:第1层深度迁移字典构造如下:
[0025][0026]其中第一项是源领域数据重构项,第二项是目标领域数据重构项,第三项是自适应最大平均差异项,其构造方法如下:
[0027][0028]其中,表示源字典中第i个原子对应的编码系数矩阵行向量,表示目标字典中第j个原子对应的编码系数矩阵行向量,是编码系数矩阵的转置矩阵。T是矩阵,其元素计算如下:
[0029][0030]其中m
s
和m
t
是源领域字典和目标领域中的原子个数,它们均等于对应领域带类标样本个数。
[0031]第三步:第l+1层(输出层)深度迁移字典构造如下:
[0032][0033]其中,第一项是源领域数据重构项,第二项是目标领域数据重构项,第三项是最大平均差异项,其构造方法如公式(2)。另外,和分别是第l层源领域编码系数和目标领域编码系数,和分别是第l+1层源领域字典和目标领域字典,是第l+1层编码系数矩阵。
[0034]参照图1,在算法更新方面,由于深度迁移字典学习模型的每层具有相似的目标函数,为了减少计算复杂度,第l层的目标函数优化如下:
[0035][0036]其中,是第l

1层编码系数矩阵,当l=1时,1层编码系数矩阵,当l=1时,是第l字典,T是矩阵,利用公式(2)构造。因此,算法的更新如下步骤如下:
[0037](1)更新第l层字典如下:
[0038][0039](2)更新第l层字典如下:
[0040][0041]参照图1,在分类方法方面,利用输出层目标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于深度迁移字典学习的精细图像分类方法,其特征在于,主要包括以下步骤:首先,利用合成字典构造深度字典学习模型,并采取梯度下降法更新每层的字典和编码系数;其次,利用源领域和目标领域中具有类标的精细图像分别对应学习源领域字典和目标领域字典,并分别提取源领域和目标领域中精细图像的复杂非线性特征;第三,在深度字典学习模型的每层中,利用原子和编码系数矩阵的行向量构造自适应最大平均差异模型,以减少源领域和目标领域的分布差异,并采取梯度下降法对输出层的目标函数进行求解,从而获得输出层的编码字典和编码系数;第四,从输出层的编码系数矩阵中提取目标领域编码系数,结合目标领域样本的类标矩阵得出分类器参数;第五,构造...

【专利技术属性】
技术研发人员:李争名
申请(专利权)人:广东技术师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1