【技术实现步骤摘要】
本申请实施例涉及机器学习,具体涉及一种目标域模型训练方法、系统、设备和存储介质。
技术介绍
1、传统的机器学习预测方法并没有摆脱训练数据和测试数据独立同分布的约束条件,使得机器学习方法必须在样本数据独立同分布的前提假设条件下执行,然而随着现实应用中大数据的普及,这种前提假设很难适应数据智能时代的发展。针对因训练样本稀缺导致的机器学习方法不适应跨领域学习,以及训练样本的采集和标注耗费代价昂贵的问题,并且不可靠的标签会影响模型的准确性和可靠性。可用于建模的有标签样本数量有限,这使得在建立准确且泛化能力强的模型时变得困难。
技术实现思路
1、为此,本申请实施例提供一种目标域模型训练方法、系统、设备和存储介质,运用模型迁移的思想,将源域(高可靠数据域)数据训练出的源域模型迁移至目标域(低可靠数据域)中,利用源域模型的隐式知识来提高目标域数据的综合可靠性,从而提高目标域数据的预测能力;进一步在上述模型迁移的基础上进行样本迁移,将符合目标域分布规律的源域数据(多样本数据域)迁移至目标域(少样本数据域)
...【技术保护点】
1.一种目标域模型训练方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述调用所述源域模型根据目标域样本集得到带权重的目标域数据,包括:
3.如权利要求2所述的方法,其特征在于,所述根据每个目标域样本的标签的概率计算每个目标域样本的权重,包括:
4.如权利要求1所述的方法,其特征在于,所述调用所述初始目标域模型根据所述源域样本集得到带权重的源域数据,包括:
5.如权利要求4所述的方法,其特征在于,所述根据所述源域样本集合的标签的概率计算每个源域样本的权重,包括:
6.如权利要求1所述
...【技术特征摘要】
1.一种目标域模型训练方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述调用所述源域模型根据目标域样本集得到带权重的目标域数据,包括:
3.如权利要求2所述的方法,其特征在于,所述根据每个目标域样本的标签的概率计算每个目标域样本的权重,包括:
4.如权利要求1所述的方法,其特征在于,所述调用所述初始目标域模型根据所述源域样本集得到带权重的源域数据,包括:
5.如权利要求4所述的方法,其特征在于,所述根据所述源域样本集合的标签的概率计算每个源域样本的权重,包括:
6.如权利要求1所述的方法,其特征在于,所述基于所述带权重的源域...
【专利技术属性】
技术研发人员:张含,陈曙东,佟达,胡晓琛,
申请(专利权)人:中国科学院微电子研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。