一种模型确定方法、装置及计算机可读存储介质制造方法及图纸

技术编号:40001617 阅读:36 留言:0更新日期:2024-01-09 03:46
本申请提供了一种模型确定方法、装置及计算机可读存储介质,该方法包括:获取M个训练任务分别对应的多个训练样本,M≥2;通过初始多场景模型包括的特征提取子模型确定第i个训练任务对应的多个训练样本分别对应的数据集特征,M≥i≥1;根据第i个训练任务对应的多个训练样本和该多个训练样本分别对应的数据集特征,通过初始多场景模型包括的预测子模型,确定第i个训练任务对应的多个训练样本分别对应的预测结果;生成第i个训练任务对应的子模型损失函数;通过M个训练任务分别对应的子模型损失函数,对初始多场景模型进行训练的内外循环,得到多场景模型。通过上述方法,能够提高应用于多个应用场景的多场景模型的准确率。

【技术实现步骤摘要】

本申请属于数据处理领域,具体涉及一种模型确定方法、装置及计算机可读存储介质


技术介绍

1、本部分旨在为权利要求书中陈述的本申请的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

2、人类具有凭借先前的知识快速适应新场景的能力,例如,婴儿只需见过几次猫或狗就能认出它们,只需有限的行走练习就能学会跑步。相比之下,模型则通常需要大量的样本来学习应用于特定的应用场景,并且缺乏相应的泛化能力。

3、对此,相关技术中提出了模型无关元学习(model-agnostic meta-learning,maml)来弥补模型训练需要大量样本和泛化能力较差的不足,具体的,maml不是通过大量的样本来提升模型在某个特定的应用场景的能力,而是通过来自于不同数据集的少量的样本来提升模型在一系列应用场景的能力,例如,与只能应用于语音识别的语音识别模型或者与只能应用于图像识别的图像识别模型相比,通过maml可以在来自于不同数据集的少量样本的训练下得到能够应用于语音识别和图像识别等一系列应用场景的多场景识别模型。

4、虽然相关技本文档来自技高网...

【技术保护点】

1.一种模型确定方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,当所述预测子模型包括K个卷积层时,其中,K为整数,K≥2,所述根据所述第i个训练任务对应的多个训练样本和所述多个训练样本分别对应的数据集特征,通过所述初始多场景模型中的预测子模型,确定所述第i个训练任务对应的多个训练样本分别对应的预测结果,包括:

3.根据权利要求1所述的方法,其特征在于,所述特征提取子模型与所述预测子模型具有相同的模型架构。

4.根据权利要求1所述的方法,其特征在于,所述根据所述第i个训练任务对应的多个训练样本和所述多个训练样本分别对应的数据集特征,通...

【技术特征摘要】

1.一种模型确定方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,当所述预测子模型包括k个卷积层时,其中,k为整数,k≥2,所述根据所述第i个训练任务对应的多个训练样本和所述多个训练样本分别对应的数据集特征,通过所述初始多场景模型中的预测子模型,确定所述第i个训练任务对应的多个训练样本分别对应的预测结果,包括:

3.根据权利要求1所述的方法,其特征在于,所述特征提取子模型与所述预测子模型具有相同的模型架构。

4.根据权利要求1所述的方法,其特征在于,所述根据所述第i个训练任务对应的多个训练样本和所述多个训练样本分别对应的数据集特征,通过所述初始多场景模型中的预测子模型,确定所述第i个训练任务对应的多个训练样本分别对应的预测结果,包括:

5.根据权利要求1所述的方法,其特征在于,所述通过所述m个训练任务分别对应的子模型损失函数和外循环学习率,对所述初始多场景模型进行训练的内循环和...

【专利技术属性】
技术研发人员:张子立郭延斌陈孟唐真周之敏徐波鲁明明
申请(专利权)人:中国银联股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1