获取样本的方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:40460201 阅读:18 留言:0更新日期:2024-02-22 23:15
本申请适用于计算机领域,尤其涉及一种获取样本的方法、装置、设备及计算机可读存储介质。其中,所述方法包括:根据待训练模型的训练回合数信息,确定每个训练回合对应的模型训练样本数据源的目标数量;在所述每个训练回合,利用所述目标数量个所述模型训练样本数据源提供的模型训练样本,对所述待训练模型进行优化;针对所述每个训练回合,根据所述目标数量和预设规则,在多个模型训练样本数据源中,确定提供模型训练样本的目标数据源;获取所述目标数据源提供的模型训练样本;使用所述模型训练样本,训练所述待训练模型。本申请实施例能够提高模型训练效率。

【技术实现步骤摘要】

本申请属于计算机,尤其涉及一种获取样本的方法、装置、设备及计算机可读存储介质


技术介绍

1、随着机器学习和边缘计算技术的不断发展,移动设备上的联邦学习成为一种重要的模型训练方法。在实际应用中,模型训练样本数据源为联邦学习的模型训练提供样本数据,这些模型训练样本数据源可能是客户端,客户端将本地数据提供给待训练模型以作为模型训练的样本数据。然而,客户端的本地数据集分布通常是非平衡的,一些客户端的数据样本量较大,而另一些客户端的本地数据样本量较小。

2、此外,模型训练是一个多回合迭代优化的过程,需要合理选取每一个回合的客户端,即数据源,从而优化模型训练的效率与最终的模型测试精度。


技术实现思路

1、本申请实施例提供了一种获取样本的方法、装置、设备及计算机可读存储介质,能够提供模型训练效率。

2、第一方面,本申请实施例提供了一种获取样本的方法,包括:

3、根据待训练模型的训练回合数信息,确定每个训练回合对应的模型训练样本数据源的目标数量;在每个训练回合,利用目标数量个模型训练样本本文档来自技高网...

【技术保护点】

1.一种获取样本的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,每个训练回合对应的模型训练样本数据源的数量,随着所述训练回合累计数量的增加而增加。

3.根据权利要求2所述的方法,其特征在于,所述根据待训练模型的训练回合数信息,确定每个训练回合对应的模型训练样本数据源的目标数量,包括:

4.根据权利要求1所述的方法,其特征在于,所述预设规则为:针对每个训练回合,优先选择模型训练样本数据量多且被选为目标数据源的次数少的模型训练样本数据源,为所述训练回合的目标数据源。

5.根据权利要求1-4中任意一项所述的方法,其特征在于,...

【技术特征摘要】

1.一种获取样本的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,每个训练回合对应的模型训练样本数据源的数量,随着所述训练回合累计数量的增加而增加。

3.根据权利要求2所述的方法,其特征在于,所述根据待训练模型的训练回合数信息,确定每个训练回合对应的模型训练样本数据源的目标数量,包括:

4.根据权利要求1所述的方法,其特征在于,所述预设规则为:针对每个训练回合,优先选择模型训练样本数据量多且被选为目标数据源的次数少的模型训练样本数据源,为所述训练回合的目标数据源。

5.根据权利要求1-4中任意一项所述的方法,其特征在于,所述针对所述每个训练回合,根据所述目标数量和预设规则,在多个模型训练样本数据源中,确定提供模型训练样本的目标数据源,包括:

6.根据权利要求5所述的方法,其特征在于,所述确定...

【专利技术属性】
技术研发人员:杨海良崔来中明中行
申请(专利权)人:人工智能与数字经济广东省实验室深圳
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1