一种数据处理方法和相关装置制造方法及图纸

技术编号：37173361 阅读：9 留言：0更新日期：2023-04-20 22:43

本申请公开了一种数据处理方法和相关装置，获取由源域的标注图像样本和目标域的无标注图像样本构成的训练样本矩阵，标注图像样本的样本标签用于标识标注图像样本的类别信息，根据训练样本矩阵对初始领域对齐矩阵、初始全局相似矩阵和初始预测标签矩阵进行更新，得到目标对齐矩阵、目标全局相似矩阵和目标预测标签矩阵，根据训练样本矩阵、目标对齐矩阵、目标全局相似矩阵、目标预测标签矩阵与源域样本标签矩阵构建检查参数，若检查参数不满足第一收敛条件，进行迭代更新直至满足第一收敛条件，认为完成训练得到目标域的图像识别模型。利用标签传播能够使得源域的标注图像样本能够用于目标域的图像识别中，提高目标域的图像识别模型的训练效率。模型的训练效率。模型的训练效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法和相关装置

[0001]本申请涉及数据处理
，特别是涉及一种数据处理方法和相关装置。

技术介绍

[0002]随着人工智能的快速发展，机器学习被广泛应用于各个领域中。具体可以是基于机器学习的方式进行模型训练得到能够适用于目标域的目标模型，后续可以使用目标模型处理目标域中的相关业务。比如，训练得到的目标模型为图像识别模型，后续可以用于对目标域中的图像进行识别处理等。
[0003]针对一个领域下的图像识别需求，需要训练得到针对该领域的图像识别模型，而模型训练需要依赖大量的标注样本。一般，通过人工对全新领域中的样本数据进行标记，得到对应的标签，从而构建出能够用于模型训练的标注样本。
[0004]然而，这种依赖人工标记的方式，会耗费大量时间和成本，尤其是针对一个全新领域时，降低了全新领域中图像识别模型的训练效率。

技术实现思路

[0005]为了解决上述技术问题，本申请提供了一种数据处理方法和相关装置，能够提高目标域的图像识别模型的训练效率。
[0006]本申请实施例公开了如下技术方案：
[0007]一方面，本申请实施例提供了一种数据处理方法，所述方法包括：
[0008]获取训练样本矩阵、初始领域对齐矩阵、初始全局相似矩阵和初始预测标签矩阵；所述训练样本矩阵包括源域的标注图像样本和目标域的无标注图像样本，所述标注图像样本的样本标签用于标识所述标注图像样本的类别信息；
[0009]根据所述训练样本矩阵，分别对所述初始领域对齐矩阵、所述初始全局相似...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，其特征在于，所述方法包括：获取训练样本矩阵、初始领域对齐矩阵、初始全局相似矩阵和初始预测标签矩阵；所述训练样本矩阵包括源域的标注图像样本和目标域的无标注图像样本，所述标注图像样本的样本标签用于标识所述标注图像样本的类别信息；根据所述训练样本矩阵，分别对所述初始领域对齐矩阵、所述初始全局相似矩阵和所述初始预测标签矩阵进行更新，得到目标对齐矩阵、目标全局相似矩阵和目标预测标签矩阵；所述目标对齐矩阵用于标识所述源域与所述目标域之间的领域对齐结果，所述目标全局相似矩阵用于标识所述训练样本之间的全局结构相似度，所述目标预测标签矩阵用于标识所述训练样本矩阵中的图像样本的预测类别信息；根据所述训练样本矩阵、所述目标对齐矩阵、所述目标全局相似矩阵、所述目标预测标签矩阵与源域样本标签矩阵构建检查参数；所述源域样本标签矩阵是根据所述源域的标注图像样本的样本标签构建的；若所述检查参数不满足第一收敛条件，分别对所述目标对齐矩阵、所述目标全局相似矩阵和所述目标预测标签矩阵进行迭代更新，直至所述检查参数满足所述第一收敛条件。2.根据权利要求1所述的方法，其特征在于，所述分别对所述目标对齐矩阵、所述目标全局相似矩阵和所述目标预测标签矩阵进行迭代更新，包括：获取所述目标预测标签矩阵中预测概率大于预设概率的预测标签作为保留标签，获取修正参数；根据所述保留标签和所述修正参数对所述目标预测标签矩阵进行修正，得到修正后的目标预测标签矩阵；分别对所述目标对齐矩阵、所述目标全局相似矩阵和所述修正后的目标预测标签矩阵进行迭代更新。3.根据权利要求2所述的方法，其特征在于，所述方法还包括：获取所述训练样本矩阵包括的训练样本的数量，获取所述保留标签的数量；计算所述保留标签的数量与所述训练样本的数量的比值；若所述比值不满足第二收敛条件，分别对所述目标对齐矩阵、所述目标全局相似矩阵和所述修正后的目标预测标签矩阵进行迭代更新，直至所述比值满足所述第二收敛条件。4.根据权利要求3所述的方法，其特征在于，所述方法还包括：若所述检查参数满足所述第一收敛条件且所述比值满足所述第二收敛条件，结束迭代；输出最后一次迭代更新得到的目标对齐矩阵、目标全局相似矩阵和目标预测标签矩阵。5.根据权利要求4所述的方法，其特征在于，所述方法还包括：当结束迭代时，根据最后一次迭代对应的模型参数确定目标域图像识别模型；获取所述目标域的待识别图像样本；通过所述目标域...

【专利技术属性】
技术研发人员：周翊航，
申请(专利权)人：中国农业银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人