一种基于混合度量的特征分布度量方法技术

技术编号:37045837 阅读:35 留言:0更新日期:2023-03-29 19:24
一种基于混合度量的特征分布度量方法,为解决在图像分类时深度迁移学习方法的迁移学习模型无法对目标域数据准确标注的问题。将图片分为源域和目标域;利用源域中的图片对迁移学习模型进行训练,得到模型;计算分类损失;计算域间特征边缘分布差异的一、二、三阶统计量距离,再加权组合得到域间特征边缘分布的混合度量;获取目标域软标签,利用软标签计算目标域特征的初始软质心,再使用余弦相似度得目标域特征的伪标签;计算域间特征的条件分布差异的一、二、三阶统计量距离,再加权组合得到域间特征条件分布的混合度量;将二者混合度量相加得域间特征统计量距离;计算迁移学习模型总体损失函数,更新模型;预测测试样本,得到种类预测概率。测概率。测概率。

【技术实现步骤摘要】
一种基于混合度量的特征分布度量方法


[0001]本专利技术涉及一种特征分布度量方法,具体涉及一种基于域间特征边缘分布和域间特征条件分布的特征分布度量方法,属于图片分类领域。

技术介绍

[0002]随着信息技术与互联网的发展,社交网络、视频监控等领域每时每刻产生海量图像数据,呈现爆炸式增长。图像分类是计算机视觉中最为重要的一类任务,其目标是为图像赋予相应的语义标签。随着机器学习和计算机视觉技术的发展,使用计算机来完成基于图像内容的自动识别与分类成为研究热点。近年来,深度学习网络在图像分类上取得很大突破,通过输入大量的有标注训练数据对网络训练,可以获得性能强大的深度学习网络模型,进而对测试数据进行标注。然而,现有的深度学习方法的识别性能需要满足以下两个基本假设:首先,深度学习模型的训练依赖足够数量的有标注训练样本,样本的数量越大,质量越高,训练出的深度学习模型泛化能力越强。其次,训练数据与测试数据需满足独立同分布,当训练数据与测试数据存在分布差异时,会导致深度学习模型性能显著下降。在实际应用中,上述两个假设通常无法满足,导致无法建立可靠的深度学习模本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于混合度量的特征分布度量方法,其特征在于:它包括以下步骤:S1、获取一定数量的图片,将图片分为训练样本和测试样本,训练样本作为源域,测试样本作为目标域;S2、构建迁移学习模型,利用源域中的图片对迁移学习模型进行训练,输出图片中物体种类的预测概率,直至loss损失不变,得到训练好的迁移学习模型;S3、根据训练好的迁移学习模型计算源域数据的分类损失;S4、利用最大均值差异计算域间特征边缘分布差异的一阶统计量距离;S5、利用相关性对齐方法计算域间特征边缘分布差异的二阶统计量距离;S6、利用高阶矩匹配方法计算域间特征边缘分布差异的三阶统计量距离;S7、将一阶统计量距离、二阶统计量距离、三阶统计量距离加权组合,得到域间特征边缘分布的混合统计量距离;S8、获取目标域软标签,并利用软标签计算目标域特征的初始软质心,再使用余弦相似度作为距离度量的k

means算法获得目标域特征的伪标签S9、利用目标域伪标签与最大均值差异计算域间特征的条件分布差异的一阶统计量距离;S10、利用目标域伪标签与相关性对齐方法计算域间特征的条件分布差异的二阶统计量距离;S11、利用目标域伪标签与高阶矩匹配方法计算域间特征的条件分布差异的三阶统计量距离;S12、将一阶统计量距离、二阶统计量距离、三阶统计量距离加权组合,得到域间特征条件分布的混合统计量距离;S13、将S7得到的域间特征边缘分布的混合统计量距离与S12得到的域间特征条件分布的混合统计量距离相加,得到域间特征统计量距离;S14、根据S3中源域数据的分类损失和S13中域间特征统计量距离计算迁移学习模型总体损失函数,并更新迁移学习模型参数,得到新的迁移学习模型;S15、利用新的新的迁移学习模型对测试样本进行预测,得到测试样本对应的种类的预测概率。2.根据权利要求1中所述的一种基于混合度量的特征分布度量方法,其特征在于:S2中迁移学习模型依次包括特征提取器和分类器,特征提取器依次包括输入层、卷积层、池化层、四个残差卷积模块、瓶颈层及特征归一化层;分类器依次包括两层全连接层。3.根据权利要求2中所述的一种基于混合度量的特征分布度量方法,其特征在于:S3中根据训练好的迁移学习模型计算源域数据的分类损失,具体过程为:其中,表示源域数据的分类损失,J(
·
)表示交叉熵损失函数,n
s
表示源域的样本数量,x
s
与y
s
分别表示源域样本特征向量与对应的标签,i=1,2,3,

,n
s
。4.根据权利要求3中所述的一种基于混合度量的特征分布度量方法,其特征在于:S7中将一阶统计量距离、二阶统计量距离、三阶统计量距离加权组合,得到域间特征边缘分布的混合统计量距离,具体过程为:
一阶统计量距离:其中,域间特征为源域特征h
s
与目标域特征h
t
之间的特征;n
s
与n
t
表示h
s
与h
t
中样本的数量,j=1,2,3,

,n
t
;k(
·
,
·
)是高斯核函数,因此有)是高斯核函数,因此有γ是带宽参数,i

...

【专利技术属性】
技术研发人员:何鸣张耘王红滨王勇周连科王念滨孙彧
申请(专利权)人:哈尔滨工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1