一种目标域模型训练方法、系统、设备和存储介质技术方案

技术编号：41533603 阅读：18 留言：0更新日期：2024-06-03 23:10

本申请实施例公开了一种目标域模型训练方法、系统、设备和存储介质，所述方法包括：基于源域样本集训练得到源域模型；所述源域样本集为目标用户群在数据库中所有交易平台的历史数据；调用所述源域模型根据目标域样本集得到带权重的目标域数据；所述目标域样本集为所述目标用户群在目标交易平台的历史数据；基于所述带权重的目标域数据训练得到初始目标域模型；调用所述初始目标域模型根据所述源域样本集得到带权重的源域数据；基于所述带权重的源域数据和所述带权重的目标域数据训练得到目标域模型。利用源域模型的隐式知识来提高目标域数据的可靠性，有效利用源域数据的知识，解决目标域样本数量少的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本申请实施例涉及机器学习，具体涉及一种目标域模型训练方法、系统、设备和存储介质。

技术介绍

1、传统的机器学习预测方法并没有摆脱训练数据和测试数据独立同分布的约束条件，使得机器学习方法必须在样本数据独立同分布的前提假设条件下执行，然而随着现实应用中大数据的普及，这种前提假设很难适应数据智能时代的发展。针对因训练样本稀缺导致的机器学习方法不适应跨领域学习，以及训练样本的采集和标注耗费代价昂贵的问题，并且不可靠的标签会影响模型的准确性和可靠性。可用于建模的有标签样本数量有限，这使得在建立准确且泛化能力强的模型时变得困难。

技术实现思路

1、为此，本申请实施例提供一种目标域模型训练方法、系统、设备和存储介质，运用模型迁移的思想，将源域(高可靠数据域)数据训练出的源域模型迁移至目标域(低可靠数据域)中，利用源域模型的隐式知识来提高目标域数据的综合可靠性，从而提高目标域数据的预测能力；进一步在上述模型迁移的基础上进行样本迁移，将符合目标域分布规律的源域数据(多样本数据域)迁移至目标域(少样本数据域)...

【技术保护点】

1.一种目标域模型训练方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述调用所述源域模型根据目标域样本集得到带权重的目标域数据，包括：

3.如权利要求2所述的方法，其特征在于，所述根据每个目标域样本的标签的概率计算每个目标域样本的权重，包括：

4.如权利要求1所述的方法，其特征在于，所述调用所述初始目标域模型根据所述源域样本集得到带权重的源域数据，包括：

5.如权利要求4所述的方法，其特征在于，所述根据所述源域样本集合的标签的概率计算每个源域样本的权重，包括：

6.如权利要求1所述的方法，其特征在于，...

【技术特征摘要】

1.一种目标域模型训练方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述调用所述源域模型根据目标域样本集得到带权重的目标域数据，包括：

3.如权利要求2所述的方法，其特征在于，所述根据每个目标域样本的标签的概率计算每个目标域样本的权重，包括：

4.如权利要求1所述的方法，其特征在于，所述调用所述初始目标域模型根据所述源域样本集得到带权重的源域数据，包括：

5.如权利要求4所述的方法，其特征在于，所述根据所述源域样本集合的标签的概率计算每个源域样本的权重，包括：

6.如权利要求1所述的方法，其特征在于，所述基于所述带权重的源域...

【专利技术属性】
技术研发人员：张含，陈曙东，佟达，胡晓琛，
申请(专利权)人：中国科学院微电子研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人