评估模型训练方法技术

技术编号:39725587 阅读:10 留言:0更新日期:2023-12-17 23:30
本申请涉及一种评估模型训练方法

【技术实现步骤摘要】
评估模型训练方法、装置及电子设备


[0001]本申请涉及计算机及通信
,具体而言,涉及一种评估模型训练方法

装置及电子设备


技术介绍

[0002]联邦学习
(federated learning)
是指通过联合不同的参与者进行机器学习的方法

在联邦学习中,参与者并不需要向其它参与者和协调者,或者聚合服务器暴露自己拥有的数据,因而联邦学习可以很好地保护用户隐私和保障数据安全

[0003]大模型时代,模型具有强大且多样性的功能,一方面,大模型具有自然语言理解和生成的基本能力
(
多模态
)
,具有各个领域的基本知识和通识;另一方面,通过对大模型微调,可以使其具备特定领域的特定能力

因此,如何对大模型的能力进行评估成为一个重要问题

特定的大模型
(

GPT

3/4
为例
)
,常被用于对大模型的开放式问题进行评估,并且已被证明具有一定的有效性

但是,普通的大模型在对开放式问题评估方面效果较差

在大模型联邦场景下,不论是联邦评估还是联邦训练场景,由于大模型使用场景及目标任务通常是开放式问题,如何对单个模型或者训练后的全局模型的通用能力或特定场景能力进行评估是一个棘手问题


技术实现思路

[0004]本申请的实施例提供了一种评估模型训练方法

装置及电子设备,进而可以提高评估模型的准确性

[0005]本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得

[0006]根据本申请实施例的一个方面,提供了一种评估模型训练方法,所述方法包括:
[0007]获取基于横向联邦学习训练得到的多个参与方本地模型;
[0008]从所述多个参与方本地模型中选取两个模型作为比赛模型,并从剩下的参与方本地模型中选择部分或全部模型作为裁判模型;
[0009]基于所述比赛模型和所述裁判模型对目标问题进行评估,得到与所述目标问题对应的评估结果,所述评估结果用于评估所述比赛模型针对目标问题对应答案的准确性;
[0010]基于所述评估结果,选择相应的目标问题以及与所述目标问题对应的答案加入评估数据训练集,并根据所述评估数据训练集训练得到评估模型

[0011]根据本申请实施例的一个方面,提供了一种评估模型训练装置,所述装置包括:
[0012]获取模块,用于获取基于横向联邦学习训练得到的多个参与方本地模型;
[0013]选择模块,用于从所述多个参与方本地模型中选取两个模型作为比赛模型,并从剩下的参与方本地模型中选择部分或全部模型作为裁判模型;
[0014]评估模块,用于基于所述比赛模型和所述裁判模型对目标问题进行评估,得到与所述目标问题对应的评估结果,所述评估结果用于评估所述比赛模型针对目标问题对应答
案的准确性;
[0015]训练模块,用于基于所述评估结果,选择相应的目标问题以及与所述目标问题对应的答案加入评估数据训练集,并根据所述评估数据训练集训练得到评估模型

[0016]在本申请的一些实施例中,基于以上技术方案,所述获取模块还用于,接收来自不同参与方在本地模型更新后的模型参数;将不同参与方更新后的模型参数进行融合,得到全局模型参数;将所述全局模型参数分发给各个参与方,以使所述各个参与方根据所述全局模型参数作为本地模型的最新模型参数进行训练,得到多个参与方本地模型

[0017]在本申请的一些实施例中,基于以上技术方案,所述比赛模型包括第一比赛模型和第二比赛模型;所述评估模块还用于,将所述目标问题分别输入至所述第一比赛模型和所述第二比赛模型,通过所述第一比赛模型得到与所述目标问题对应的第一答案,通过所述第二比赛模型得到与所述目标问题对应的第二答案;将所述目标问题

与所述目标问题对应的第一答案以及与所述目标问题对应的第二答案发送至所述裁判模型,以使所述裁判模型对所述第一答案和所述第二答案进行评估,得到与所述目标问题对应的评估结果

[0018]在本申请的一些实施例中,基于以上技术方案,所述裁判模型的数量有多个;所述评估模块还用于,将所述目标问题

与所述目标问题对应的第一答案以及与所述目标问题对应的第二答案均发送至多个所述裁判模型,得到各个裁判模型对应的评估结果;从所述各个裁判模型对应的评估结果中根据筛选指标对评估结果进行筛选,得到与所述目标问题对应的评估结果

[0019]在本申请的一些实施例中,基于以上技术方案,所述评估模块还用于,从所述各个裁判模型对应的评估结果中根据各个裁判模型的预设权重值对评估结果进行筛选,得到第一评估结果;从所述各个裁判模型对应的评估结果中根据有效评估结果比例对评估结果进行筛选,得到第二评估结果;从所述各个裁判模型对应的评估结果中根据模型的胜负比例对评估结果进行筛选,得到第三评估结果;根据所述第一评估结果

所述第二评估结果以及所述第三评估结果,得到与所述目标问题对应的评估结果

[0020]在本申请的一些实施例中,基于以上技术方案,所述评估模块还用于,从所述各个裁判模型对应的评估结果中选择有效的评估结果,得到有效评估结果;根据所述有效评估结果的数量与所述裁判模型的数量,计算有效评估结果比例;将所述有效评估结果比例超过设定的第一比例阈值对应的评估结果作为所述第二评估结果

[0021]在本申请的一些实施例中,基于以上技术方案,所述评估模块还用于,根据所述各个裁判模型对应的评估结果确定第一比赛模型评估结果的正确数量或者所述第二比赛模型评估结果的正确数量;计算所述第一比赛模型评估结果与总评估结果的比例,或者计算所述第二比赛模型评估结果与总评估结果的比例;将计算得到的比例超过设定的第二比例阈值对应的评估结果作为所述第三评估结果

[0022]在本申请的一些实施例中,基于以上技术方案,所述训练模块还用于,根据所述评估结果选择相应的目标问题以及与所述目标问题对应的答案作为评估数据训练集,基于所述评估数据训练集对各个参与方训练个性化评估模型;或者基于所述评估数据训练集和全局模型训练得到全局评估模型

[0023]根据本申请实施例的一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例中所述的评估模型训练方法

[0024]根据本申请实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个计算机程序,当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述电子设备实现如上述实施例中所述的评估模型训练方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种评估模型训练方法,应用于服务器,其特征在于,所述方法包括:获取基于横向联邦学习训练得到的多个参与方本地模型;从所述多个参与方本地模型中选取两个模型作为比赛模型,并从剩下的参与方本地模型中选择部分或全部模型作为裁判模型;基于所述比赛模型和所述裁判模型对目标问题进行评估,得到与所述目标问题对应的评估结果,所述评估结果用于评估所述比赛模型针对目标问题对应答案的准确性;基于所述评估结果,选择相应的目标问题以及与所述目标问题对应的答案加入评估数据训练集,并根据所述评估数据训练集训练得到评估模型
。2.
根据权利要求1所述的评估模型训练方法,其特征在于,所述获取基于横向联邦学习训练得到的多个参与方本地模型,包括:接收来自不同参与方在本地模型更新后的模型参数;将不同参与方更新后的模型参数进行融合,得到全局模型参数;将所述全局模型参数分发给各个参与方,以使所述各个参与方根据所述全局模型参数作为本地模型的最新模型参数进行训练,得到多个参与方本地模型
。3.
根据权利要求1所述的评估模型训练方法,其特征在于,所述比赛模型包括第一比赛模型和第二比赛模型;基于所述比赛模型和所述裁判模型对目标问题进行评估,得到与所述目标问题对应的评估结果,包括:将所述目标问题分别输入至所述第一比赛模型和所述第二比赛模型,通过所述第一比赛模型得到与所述目标问题对应的第一答案,通过所述第二比赛模型得到与所述目标问题对应的第二答案;将所述目标问题

与所述目标问题对应的第一答案以及与所述目标问题对应的第二答案发送至所述裁判模型,以使所述裁判模型对所述第一答案和所述第二答案进行评估,得到与所述目标问题对应的评估结果
。4.
根据权利要求3所述的评估模型训练方法,其特征在于,所述裁判模型的数量有多个;所述将所述目标问题

与所述目标问题对应的第一答案以及与所述目标问题对应的第二答案发送至所述裁判模型,以使所述裁判模型对所述第一答案和所述第二答案进行评估,得到与所述目标问题对应的评估结果,包括:将所述目标问题

与所述目标问题对应的第一答案以及与所述目标问题对应的第二答案均发送至多个所述裁判模型,得到各个裁判模型对应的评估结果;从所述各个裁判模型对应的评估结果中根据筛选指标对评估结果进行筛选,得到与所述目标问题对应的评估结果
。5.
根据权利要求4所述的评估模型训练方法,其特征在于,从所述各个裁判模型对应的评估结果中根据筛选指标对评估结果进行筛选,得到与所述目标问题对应的评估结果,包括:从所述各个裁判模型对应的评估结果中根据各个裁判模型的预设权重值对评估结果进行筛选,得到第一评估结果;从所述各个裁判模型对应的评估结果...

【专利技术属性】
技术研发人员:何元钦范力欣
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1