基于区分置信度水平的可迁移图像识别方法及系统技术方案

技术编号：30179483 阅读：23 留言：0更新日期：2021-09-25 15:41

本发明专利技术公开了一种基于区分置信度水平的可迁移图像识别方法及系统，其首先采用源域数据训练得到源域预训练模型，利用源域模型训练得到的参数作为目标域模型的特征提取参数和分类参数，使目标域模型基于源域模型的训练参数从目标域数据中选出伪标签可信样本，并利用选出的可信样本为不可信样本赋予伪标签和权重，有效地降低了当前所有目标域图像伪标签的不确定性；最后通过带有伪标签的目标域数据和源域数据一起训练优化目标域模型，使最终得到的目标域模型的目标图像识别性能得到了极大提高，能够进行快速的迁移和有效的图像识别工作；并有效减少对于目标图像识别的标注，大量减少人力物力。减少人力物力。减少人力物力。

全部详细技术资料下载

【技术实现步骤摘要】
基于区分置信度水平的可迁移图像识别方法及系统

[0001]本专利技术涉及图像分类识别
，尤其是涉及一种基于区分置信度水平的可迁移图像识别方法及系统。

技术介绍

[0002]可迁移的图像识别是指在进行图像识别时，利用分布相似但不同的已标注图像来指导当前无标签的图像进行准确识别的技术。大数据时代下，分析数据中隐含的价值信息来指导人们的生活和生产已成为一个良性的发展趋势。但在现实场景下，收集到大量无标签的数据非常容易，而在某些任务上进行准确的人工标注是非常耗时耗力的，比如对大规模的传感器图像的准确标注。在这种限制下，我们可以借助已有标注图像，利用标注图像和欲识别图像分布之间的相似性，指导当前图像识别的任务。例如，当两个不同的传感器A和B采集相同任务的图像时，且传感器A的图像（一般称为源域图像）已被标注，由于传感器A和B中采集的图像类别相同，传感器B可以借助传感器A已经标注数据进行有效的图像识别，而不用为传感器B得到的数据进行大规模的标注。但是由于传感器A和B设备内部构造等的不同，两者收集到的图像数据存在着分布差异，那么如何在图像分布差异存在的情况下，实现对传感器B收集到的图像（一般称为目标域图像）进行准确识别是当前可迁移图像识别问题中的一个难点。传统方法：在传感器收集的数据上进行准确的标注，重新训练一个模型，将模型用以图像识别任务，但是此过程产生昂贵人力浪费，且在大数据背景下，对所有收集到的数据进行准确的人工标注极其不现实。
[0003]目前，解决可迁移图像识别方法的主要分为以下四种类型：（1）基于图像样本重...

【技术保护点】

【技术特征摘要】
1.一种基于区分置信度水平的可迁移图像识别方法，其特征在于，包括如下步骤：S1、采用源域数据对基础训练模型进行训练，得到源域预训练模型，S2、利用源域预训练模型的参数初始化目标域模型的特征提取参数和分类参数；S3、利用初始化的目标域模型为全体目标域数据赋予伪标签，将每一类伪标签中具有较小信息熵的部分样本标注为高置信度样本，并将每一类伪标签中剩余具有较大信息熵的部分样本标注为低置信度样本；S4、计算低置信度样本的图像特征和所有类伪标签的类原型之间的距离，将距离最小的类原型的类别标签赋给低置信度样本；S5、综合计算源域数据的交叉熵损失函数以及目标域伪标签数据的交叉熵损失函数，将计算得到的总损失函数对目标域模型进行优化；S6、迭代步骤S2至S5,利用带有伪标签的目标域数据和源域数据不断迭代训练优化目标域模型。2.根据权利要求1所述基于区分置信度水平的可迁移图像识别方法，其特征在于，所述步骤S3包括如下分步骤：S31、利用初始化的目标域模型为全体目标域数据赋予伪标签；S32、计算每一个样本的信息熵，利用伪标签将所有样本分为不同类别；S33、在每一个类别中对该类的所有样本的信息熵进行排序，将每一类别中信息熵较小的部分样本标注为高置信度样本，将剩余部分信息熵较大的样本标注为低置信度样本。3.根据权利要求1所述基于区分置信度水平的可迁移图像识别方法，其特征在于，所述步骤S4包括如下分步骤：S41、对高置信度样本的特征进行求均值得到高置信度样本的特征均值；S42、将每一类的高置信度样本的特征均值作为该类的类原型；S43、计算低置信度样本与每一类伪标签的类原型之间的距离，将距离最小的类原型的标签赋予给所述低置信度样本。4.根据权利要求1所述基于区分置信度水平的可迁移图像识别方法，其特征在于，所述步骤S5包括如下分步骤：S51、利用赋予伪标签的目标域样本对目标域模型进行自监督训练，并计算目标域伪标签数据的自监督损失函数；S52、利用源域数据对目标域模型进行训练，并计算源域数据的交叉熵损失函数；S53、根据目标域伪标签数据的自监督损失函数和源域数据的交叉熵损失函数综合计算得到的总损失函数；S54、利用总损失函数对目标域模型进行优化。5.根据权利要求2所述基于区分置信度水平的可迁...

【专利技术属性】
技术研发人员：张凯，王帆，王潇涵，孔妍，张梅玉，杨光远，
申请(专利权)人：广东众聚人工智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人