一种领域自适应迁移特征方法及系统技术方案

技术编号:22330856 阅读:50 留言:0更新日期:2019-10-19 12:25
本发明专利技术提供了一种领域自适应迁移特征方法及系统,所述方法包括:步骤S1、基于源域和目标域为MMD矩阵和类内/类间离散度设初值,并设置最大迭代次数;步骤S2、基于所述MMD矩阵和类内/类间离散度优化源分类器,并基于优化后的源分类器确定目标数据对应的伪标签;步骤S3、基于所述源域、目标域以及目标数据对应的伪标签,获得目标分类器,并基于所述目标分类器细化目标数据对应的伪标签;步骤S4、根据细化后的伪标签更新MMD矩阵和类内/类间离散度,重复执行步骤S2和步骤S3直到达到所述最大迭代次数,将所述目标数据对应的伪标签设定为目标数据对应的标签。本发明专利技术提供的方法提高了目标域识别的准确率。

【技术实现步骤摘要】
一种领域自适应迁移特征方法及系统
本专利技术涉及图像处理领域,具体涉及一种领域自适应迁移特征方法及系统。
技术介绍
目前,对齐源域和目标域的域分布和类分布,进而进行目标域识别技术,是通过引进目标域伪标签,进行域之间的类分布匹配,同时进行了域分布匹配,通过寻求两个域的域分布适应和类分布适应达到提高目标识别表现的效果。以JDA为例,JDA通过源分类器预测目标域伪标签,通过最小化表征源域和目标域分布差异的距离度量MMD,同时匹配源域和目标域之间的域分布和类分布后进行目标域识别。但JDA通过最小化MMD学习到的特征已经被扭曲,很有可能会出现失真的现象,而特征失真可能会较大地损失从源域转移到目标域的内在类别结构信息,从而降低目标域识别的准确率。同时目标域伪标签仅由训练出的源分类器预测,而以这种方式训练出的源分类器可能过度拟合源域分布。由于存在不可避免的域移位,导致与源域不相似的目标数据将被错误地推断,因而,错误的伪标签可能会降低类分布的对齐程度,并导致负转移。以LSC为例,LSC利用目标域伪标签,通过对齐源域和目标域之间的域分布和类分布,学习到域不变特征,在整个特征提取过程结束后使用经典标签传播技术{LP}来精确化目标伪标签,在一个框架中同时优化特征学习和精细化目标伪标签,实现迭代学习过程中相互促进提高最终性能的目的。但与JDA一样,因为通过最小化表征源域和目标域分布差异的距离度量学习到的特征已经被扭曲,从而降低目标识别的准确率;并且目标伪标签信息仅考虑了目标域的结构一致性,忽视了源域与目标域之间的标签一致性信息。
技术实现思路
为了解决现有技术中所存在的上述不足,本专利技术提供一种领域自适应迁移特征方法及系统。本专利技术提供的技术方案是:一种领域自适应迁移特征方法,包括:步骤S1、基于源域和目标域为MMD矩阵和类内/类间离散度设初值,并设置最大迭代次数;步骤S2、基于所述MMD矩阵和类内/类间离散度优化源分类器,并基于优化后的源分类器确定目标数据对应的伪标签;步骤S3、基于所述源域、目标域以及目标数据对应的伪标签,获得目标分类器,并基于所述目标分类器细化目标数据对应的伪标签;步骤S4、根据细化后的伪标签更新MMD矩阵和类内/类间离散度,重复执行步骤S2和步骤S3直到达到所述最大迭代次数,将所述目标数据对应的伪标签设定为目标数据对应的标签;其中,所述源域包括多个源数据,所述源数据包括图像和图像对应的标签;所述目标域包括多个目标数据,所述目标数据包括图像。优选的,所述基于所述MMD矩阵和类内/类间离散度优化源分类器,并基于优化后的源分类器确定目标数据对应的伪标签,包括:基于所述MMD矩阵和类内/类间离散度构建所述源域和目标域在转移特征学习过程中的损失项;对所述损失项求最优解,获得线性域不变投影;基于所述线性域不变投影获得源数据和目标数据的投影;基于源数据的投影和所述源数据对应的标签训练得到源数据分类器;基于所述目标数据的投影和所述源数据分类器确定目标数据对应的伪标签。优选的,所述损失项,如下式所示:式中:J:损失项;Jmmd:MMD损失;Jdistance:源域和目标域的整体距离损失项;P:线性域不变投影;α:第一权衡参数,β:第二权衡参数;F:Frobenius范数。优选的,所述损失项的最优解,如下式所示:式中:W:MMD矩阵;M:类内/类间离散度;X:源域和目标域样本的特征矩阵;XT:X的转置矩阵;Im:m阶单位矩阵;H:中心矩;对角矩阵;P:线性域不变投影;α:第一权衡参数,β:第二权衡参数;其中:所述MMD矩阵W,如下式所示:式中:Wc:第c类的类条件MMD矩阵;C:源域的类数量;所有第c类源数据的个数;所有伪第c类目标数据的个数;长度为ns的列向量,若源域第i个样本标签为c,则第i个元素为1,否则为0;长度为nt的列向量,若目标域第i个样本伪标签为c,则第i个元素为1,否则为0;所述类内/类间离散度M,如下式所示:M=Msame-Mdiff=diag(Ms,same,Mt,same)-diag(Ms,diff,Mt,diff)式中:Msame:源域和目标域中同类最远样本对之间的距离矩阵;Mdiff:源域和目标域中不同类最近样本对之间的距离矩阵;Ms,same:源域中同类最远样本对之间的距离矩阵;Mt,same:目标域中同类最远样本对之间的距离矩阵;Ms,diff:源域中不同类最近样本对之间的距离矩阵;Mt,diff:目标域中不同类最近样本对之间的距离矩阵。优选的,所述基于所述源域、目标域以及目标数据对应的伪标签,获得目标分类器,包括:分别基于源域的标签和目标域的伪标签之间一致性,以及目标域内伪标签的一致性构建权重矩阵和图拉普拉斯矩阵;基于所述权重矩阵和图拉普拉斯矩阵,构建细化标签方程;对所述细化标签方程求解获得细化标签的最优解,并基于细化标签的最优解获得目标域分类器。优选的,所述细化标签方程,如下式所示:式中:Ft:各目标数据的实际标签;Fs:源分类器对各目标数据预测的伪标签;Λ:权重矩阵;ρ:第四权衡参数;L:目标数据的图拉普拉斯矩阵;Ft的转置矩阵。优选的,所述细化标签的最优解,如下式所示:式中:w*:细化标签的最优解;Λ:权重矩阵;ρ:第四权衡参数;L:目标数据的图拉普拉斯矩阵:Zt:目标数据的投影;Fs:源分类器对各目标数据预测的伪标签;Zt的转置矩阵。优选的,所述目标域分类器,如下式所示:ft(zti)=(w*)Tzti式中:ft(zti):目标域分类器对目标数据zti的标签进行预测;w*:细化标签的最优解。基于同一专利技术构思,本专利技术还提供了一种领域自适应迁移特征系统,包括:初始模块,用于基于源域和目标域为MMD矩阵和类内/类间离散度设初值,并设置最大迭代次数;判别转移特征学习模块,用于基于所述MMD矩阵和类内/类间离散度优化源分类器,并基于优化后的源分类器确定目标数据对应的伪标签;标签一致性模块,用于基于所述源域、目标域以及目标数据对应的伪标签,获得目标分类器,并基于所述目标分类器细化目标数据对应的伪标签;迭代求解模块,用于根据细化后的伪标签更新MMD矩阵和类内/类间离散度,重复执行步骤S2和步骤S3直到达到所述最大迭代次数,将所述目标数据对应的伪标签设定为目标数据对应的标签;其中,所述源域包括多个源数据,所述源数据包括图像和图像对应的标签;所述目标域包括多个目标数据,所述目标数据包括图像。优选的,所述判别转移特征学习模块,包括:构建损失项单元,用于基于所述MMD矩阵和类内/类间离散度构建所述源域和目标域在转移特征学习过程中的损失项;求解损失项单元,用于对所述损失项求最优解,获得线性域不变投影;投影单元,用于基于所述线性域不变投影获得源数据和目标数据的投影;训练单元,用于基于源数据的投影和所述源数据对应的标签训练得到源数据分类器;确定伪标签单元,用于基于所述目标数据的投影和所述源数据分类器确定目标数据对应的伪标签。与最接近的现有技术相比,本专利技术提供的技术方案具有以下有益效果:本专利技术提供的技术方案,基于源域和目标域为MMD矩阵和类内/类间离散度设初值,并设置最大迭代次数;在每次迭代过程中,基于所述MMD矩阵和类内/类间离散度优化源分类器,并基于优化后的源分类器确定目标数据对应的伪标签,同时利用所述本文档来自技高网...

【技术保护点】
1.一种领域自适应迁移特征方法,其特征在于,包括:步骤S1、基于源域和目标域为MMD矩阵和类内/类间离散度设初值,并设置最大迭代次数;步骤S2、基于所述MMD矩阵和类内/类间离散度优化源分类器,并基于优化后的源分类器确定目标数据对应的伪标签;步骤S3、基于所述源域、目标域以及目标数据对应的伪标签,获得目标分类器,并基于所述目标分类器细化目标数据对应的伪标签;步骤S4、根据细化后的伪标签更新MMD矩阵和类内/类间离散度,重复执行步骤S2和步骤S3直到达到所述最大迭代次数,将所述目标数据对应的伪标签设定为目标数据对应的标签;其中,所述源域包括多个源数据,所述源数据包括图像和图像对应的标签;所述目标域包括多个目标数据,所述目标数据包括图像。

【技术特征摘要】
1.一种领域自适应迁移特征方法,其特征在于,包括:步骤S1、基于源域和目标域为MMD矩阵和类内/类间离散度设初值,并设置最大迭代次数;步骤S2、基于所述MMD矩阵和类内/类间离散度优化源分类器,并基于优化后的源分类器确定目标数据对应的伪标签;步骤S3、基于所述源域、目标域以及目标数据对应的伪标签,获得目标分类器,并基于所述目标分类器细化目标数据对应的伪标签;步骤S4、根据细化后的伪标签更新MMD矩阵和类内/类间离散度,重复执行步骤S2和步骤S3直到达到所述最大迭代次数,将所述目标数据对应的伪标签设定为目标数据对应的标签;其中,所述源域包括多个源数据,所述源数据包括图像和图像对应的标签;所述目标域包括多个目标数据,所述目标数据包括图像。2.如权利要求1所述的方法,其特征在于,所述基于所述MMD矩阵和类内/类间离散度优化源分类器,并基于优化后的源分类器确定目标数据对应的伪标签,包括:基于所述MMD矩阵和类内/类间离散度构建所述源域和目标域在转移特征学习过程中的损失项;对所述损失项求最优解,获得线性域不变投影;基于所述线性域不变投影获得源数据和目标数据的投影;基于源数据的投影和所述源数据对应的标签训练得到源数据分类器;基于所述目标数据的投影和所述源数据分类器确定目标数据对应的伪标签。3.如权利要求2所述的方法,其特征在于,所述损失项,如下式所示:式中:J:损失项;Jmmd:MMD损失;Jdistance:源域和目标域的整体距离损失项;P:线性域不变投影;α:第一权衡参数,β:第二权衡参数;F:Frobenius范数。4.如权利要求2所述的方法,其特征在于,所述损失项的最优解,如下式所示:(X(W+αM)XT+βIm)P=XHXTPθ式中:W:MMD矩阵;M:类内/类间离散度;X:源域和目标域样本的特征矩阵;XT:X的转置矩阵;Im:m阶单位矩阵;H:中心矩;θ:对角矩阵;P:线性域不变投影;α:第一权衡参数,β:第二权衡参数;其中:所述MMD矩阵W,如下式所示:式中:Wc:第c类的类条件MMD矩阵;C:源域的类数量;所有第c类源数据的个数;所有伪第c类目标数据的个数;长度为ns的列向量,若源域第i个样本标签为c,则第i个元素为1,否则为0;长度为nt的列向量,若目标域第i个样本伪标签为c,则第i个元素为1,否则为0;所述类内/类间离散度M,如下式所示:M=Msame-Mdiff=diag(Ms,same,Mt,same)-diag(Ms,diff,Mt,diff)式中:Msame:源域和目标域中同类最远样本对之间的距离矩阵;Mdiff:源域和目标域中不同类最近样本对之间的距离矩阵;Ms,same:源域中同类最远样本对之间的距离矩阵;Mt,same:目标域中同...

【专利技术属性】
技术研发人员:李爽刘驰
申请(专利权)人:北京理工大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1