基于区分置信度水平的可迁移图像识别方法及系统技术方案

技术编号:30179483 阅读:23 留言:0更新日期:2021-09-25 15:41
本发明专利技术公开了一种基于区分置信度水平的可迁移图像识别方法及系统,其首先采用源域数据训练得到源域预训练模型,利用源域模型训练得到的参数作为目标域模型的特征提取参数和分类参数,使目标域模型基于源域模型的训练参数从目标域数据中选出伪标签可信样本,并利用选出的可信样本为不可信样本赋予伪标签和权重,有效地降低了当前所有目标域图像伪标签的不确定性;最后通过带有伪标签的目标域数据和源域数据一起训练优化目标域模型,使最终得到的目标域模型的目标图像识别性能得到了极大提高,能够进行快速的迁移和有效的图像识别工作;并有效减少对于目标图像识别的标注,大量减少人力物力。减少人力物力。减少人力物力。

【技术实现步骤摘要】
基于区分置信度水平的可迁移图像识别方法及系统


[0001]本专利技术涉及图像分类识别
,尤其是涉及一种基于区分置信度水平的可迁移图像识别方法及系统。

技术介绍

[0002]可迁移的图像识别是指在进行图像识别时,利用分布相似但不同的已标注图像来指导当前无标签的图像进行准确识别的技术。大数据时代下,分析数据中隐含的价值信息来指导人们的生活和生产已成为一个良性的发展趋势。但在现实场景下,收集到大量无标签的数据非常容易,而在某些任务上进行准确的人工标注是非常耗时耗力的,比如对大规模的传感器图像的准确标注。在这种限制下,我们可以借助已有标注图像,利用标注图像和欲识别图像分布之间的相似性,指导当前图像识别的任务。例如,当两个不同的传感器A和B采集相同任务的图像时,且传感器A的图像(一般称为源域图像)已被标注,由于传感器A和B中采集的图像类别相同,传感器B可以借助传感器A已经标注数据进行有效的图像识别,而不用为传感器B得到的数据进行大规模的标注。但是由于传感器A和B设备内部构造等的不同,两者收集到的图像数据存在着分布差异,那么如何在图像分布差异存在的情况下,实现对传感器B收集到的图像(一般称为目标域图像)进行准确识别是当前可迁移图像识别问题中的一个难点。传统方法:在传感器收集的数据上进行准确的标注,重新训练一个模型,将模型用以图像识别任务,但是此过程产生昂贵人力浪费,且在大数据背景下,对所有收集到的数据进行准确的人工标注极其不现实。
[0003]目前,解决可迁移图像识别方法的主要分为以下四种类型:(1)基于图像样本重要性估计的图像识别方法,基本思想是假设源域图像和目标域图像的分布之间存在着交集,通过计算源域图像样本点与重叠分布的距离估计源域图像样本中的重要性,优化加权后的损失函数;(2)基于高阶矩匹配的方法,其核心思路是试图最小化源域的图像分布和目标域图像分布之间的高维统计量差异;(3)基于伪标签的方法试图给目标域每个图像先赋予伪标签,并筛选可信图像样本实现模型的监督训练;(4)基于对抗训练的方法,通过引入域判别器来区分图像样本是来自源域图像还是目标域图像,并在此过程中学习有效的特征表示,以此实现对目标域图像的准确识别。
[0004]其主要体现在以下两点:(1)在已有标注的源域图像上训练可以有效识别源域图像的模型(2)最小化源域图像分布和目标域图像分布之间的差距。这些方法的重心并未放在目标域图像上,即使基于伪标签技术也只用到了部分的目标域样本,但被标注为不可信的目标图像数据在模型的训练中还是丢弃了,而这些被过滤掉的图像极有可能是进行有效图像识别的关键,故如何降低这部分样本的不确定性,并将其用到模型的训练中,是有效提升图像识别性能的核心。

技术实现思路

[0005]本专利技术的目的在于克服上述技术不足,提出一种基于区分置信度水平的可迁移图像识别方法及系统,其能有效降低目标域图像样本伪标签的不确定性,将其用于模型的训练中,而不是仅仅选择可信伪标签标签的目标域样本用以训练。
[0006]为达到上述技术目的,本专利技术的技术方案第一方面提供一种基于区分置信度水平的可迁移图像识别方法,其包括如下步骤:S1、采用源域数据对基础训练模型进行训练,得到源域预训练模型,S2、利用源域预训练模型的参数初始化目标域模型的特征提取参数和分类参数;S3、利用初始化的目标域模型为全体目标域数据赋予伪标签,将每一类伪标签中具有较小信息熵的部分样本标注为高置信度样本,并将每一类伪标签中剩余具有较大信息熵的部分样本标注为低置信度样本;S4、计算低置信度样本的图像特征和所有类伪标签的类原型之间的距离,将距离最小的类原型的类别标签赋给低置信度样本;S5、综合计算源域数据的交叉熵损失函数以及目标域伪标签数据的交叉熵损失函数,将计算得到的总损失函数对目标域模型进行优化;S6、迭代步骤S2至S5,利用带有伪标签的目标域数据和源域数据不断迭代训练优化目标域模型。
[0007]本专利技术第二方面提供一种基于区分置信度水平的可迁移图像识别系统,其包括如下功能模块:预训练模块,用于采用源域数据对基础训练模型进行训练,得到源域预训练模型;初始化模块,用于利用源域预训练模型的参数初始化目标域模型的特征提取参数和分类参数;样本分类模块,用于利用初始化的目标域模型为全体目标域数据赋予伪标签,将每一类伪标签中具有较小信息熵的部分样本标注为高置信度样本,并将每一类伪标签中剩余具有较大信息熵的部分样本标注为低置信度样本;标签赋予模块,用于计算低置信度样本的图像特征和所有类伪标签的类原型之间的距离,将距离最小的类原型的类别标签赋给低置信度样本;损失优化模块,用于综合计算源域数据的交叉熵损失函数以及目标域伪标签数据的交叉熵损失函数,将计算得到的总损失函数对目标域模型进行优化;迭代优化模块,用于通过初始化模块、样本分类模块、标签赋予模块、损失优化模块形成迭代优化回路,利用带有伪标签的目标域数据和源域数据不断迭代训练优化目标域模型。
[0008]本专利技术第三方面提供一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述一种基于区分置信度水平的可迁移图像识别方法的步骤。
[0009]本专利技术第四方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述一种基于区分置信度水平的可迁移图像识别方法的步骤。
[0010]与现有技术相比,本专利技术利用源域模型训练得到的参数作为目标域模型的特征提
取参数和分类参数,使目标域模型基于源域模型的训练参数从目标域数据中选出伪标签可信样本,并利用选出的可信样本为不可信样本赋予伪标签和权重,有效地降低了当前所有目标域图像伪标签的不确定性;最后通过带有伪标签的目标域数据和源域数据一起训练优化目标域模型,使最终得到的目标域模型的目标图像识别性能得到了极大提高,能够进行快速的迁移和有效的图像识别工作;并有效减少对于目标图像识别的标注,大量减少人力物力。
[0011]其以往的方法相比,将所有不确定性已经大幅度降低的目标域图像都用于模型的训练,而不是使用部分可信数据,目标域在训练中的权重占比增加,使得最终的图像识别模型的性能更偏向于目标图像的识别,有效地提高目标图像识别的性能。
附图说明
[0012]图1是本专利技术实施例所述的基于区分置信度水平的可迁移图像识别方法的流程框图;图2是图1中步骤S3的分步骤流程框图;图3是图1中步骤S4的分步骤流程框图;图4是图1中步骤S5的分步骤流程框图;图5是本专利技术实施例所述的基于区分置信度水平的可迁移图像识别系统的模块框图。
具体实施方式
[0013]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0014]基于上述内容,本专利技术实施例提供一种基于区分置信度水平的可迁移图像识别方法,如图1所示,其包括如下步骤:S1、采用源域数据对基本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于区分置信度水平的可迁移图像识别方法,其特征在于,包括如下步骤:S1、采用源域数据对基础训练模型进行训练,得到源域预训练模型,S2、利用源域预训练模型的参数初始化目标域模型的特征提取参数和分类参数;S3、利用初始化的目标域模型为全体目标域数据赋予伪标签,将每一类伪标签中具有较小信息熵的部分样本标注为高置信度样本,并将每一类伪标签中剩余具有较大信息熵的部分样本标注为低置信度样本;S4、计算低置信度样本的图像特征和所有类伪标签的类原型之间的距离,将距离最小的类原型的类别标签赋给低置信度样本;S5、综合计算源域数据的交叉熵损失函数以及目标域伪标签数据的交叉熵损失函数,将计算得到的总损失函数对目标域模型进行优化;S6、迭代步骤S2至S5,利用带有伪标签的目标域数据和源域数据不断迭代训练优化目标域模型。2.根据权利要求1所述基于区分置信度水平的可迁移图像识别方法,其特征在于,所述步骤S3包括如下分步骤:S31、利用初始化的目标域模型为全体目标域数据赋予伪标签;S32、计算每一个样本的信息熵,利用伪标签将所有样本分为不同类别;S33、在每一个类别中对该类的所有样本的信息熵进行排序,将每一类别中信息熵较小的部分样本标注为高置信度样本,将剩余部分信息熵较大的样本标注为低置信度样本。3.根据权利要求1所述基于区分置信度水平的可迁移图像识别方法,其特征在于,所述步骤S4包括如下分步骤:S41、对高置信度样本的特征进行求均值得到高置信度样本的特征均值;S42、将每一类的高置信度样本的特征均值作为该类的类原型;S43、计算低置信度样本与每一类伪标签的类原型之间的距离,将距离最小的类原型的标签赋予给所述低置信度样本。4.根据权利要求1所述基于区分置信度水平的可迁移图像识别方法,其特征在于,所述步骤S5包括如下分步骤:S51、利用赋予伪标签的目标域样本对目标域模型进行自监督训练,并计算目标域伪标签数据的自监督损失函数;S52、利用源域数据对目标域模型进行训练,并计算源域数据的交叉熵损失函数;S53、根据目标域伪标签数据的自监督损失函数和源域数据的交叉熵损失函数综合计算得到的总损失函数;S54、利用总损失函数对目标域模型进行优化。5.根据权利要求2所述基于区分置信度水平的可迁...

【专利技术属性】
技术研发人员:张凯王帆王潇涵孔妍张梅玉杨光远
申请(专利权)人:广东众聚人工智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1