【技术实现步骤摘要】
一种数据恢复方法、装置、电子设备及存储介质
[0001]本公开涉及计算机
,尤其涉及深度学习、模型训练
,具体涉及一种数据恢复方法、装置、电子设备及存储介质。
技术介绍
[0002]联邦学习是一个机器学习框架,能够实现在训练参与方的数据不暴露的情况下,进行数据使用和机器学习建模。
[0003]通过联邦学习的方式训练一个可用的联邦模型,通常需要较大的数据量以及较高的训练轮次。在联邦模型训练时,经常会因为网络问题、机器故障问题等出现训练中断,而当联邦模型训练中断时,通常会导致联邦模型的模型数据丢失,需要对联邦模型进行重新训练。
技术实现思路
[0004]本公开提供了一种数据恢复方法、装置、电子设备及存储介质。
[0005]根据本公开的第一方面,提供了一种数据恢复方法,所述方法包括:
[0006]当达到指定时机时,生成处于训练过程的待训练子模型的快照数据;其中,所述待训练子模型为联邦模型中由训练参与方所训练的部分模型,所述指定时机为:基于所述待训练子模型的训练轮次所设定的周期性时 ...
【技术保护点】
【技术特征摘要】
1.一种数据恢复方法,所述方法包括:当达到指定时机时,生成处于训练过程的待训练子模型的快照数据;其中,所述待训练子模型为联邦模型中由训练参与方所训练的部分模型,所述指定时机为:基于所述待训练子模型的训练轮次所设定的周期性时机;当满足预定的模型数据恢复条件时,从所生成的快照数据中,选取待利用的目标快照数据;将所述目标快照数据所表征的模型中间结果数据,加载在所述待训练子模型,得到数据恢复为目标模型数据的待训练子模型;其中,所述目标模型数据为从目标训练时机进行训练时所需利用的模型数据,所述目标训练时机为:基于所述目标快照数据生成时所述待训练子模型所处的训练时机确定得到。2.根据权利要求1所述的方法,其中,所述当满足预定的模型数据恢复条件时,从所生成的快照数据中,选取待利用的目标快照数据,包括:当所述待训练子模型的训练过程产生中断且中断结束时,从所生成的快照数据中,选取待利用的目标快照数据。3.根据权利要求1所述的方法,其中,所述从所生成的快照数据中,选取待利用的目标快照数据,包括:从所生成的快照数据中,选取生成时间最晚的快照数据,得到待利用的目标快照数据。4.根据权利要求1
‑
3任一项所述的方法,其中,所述基于所述待训练子模型的训练轮次所设定的周期性时机,包括:所述训练轮次的结束时机。5.根据权利要求4所述的方法,其中,所述快照数据中记录有第一训练状态数据;其中,所述第一训练状态数据用于表征生成所述快照数据时所述待训练子模型所处的训练轮次;基于所述目标快照数据生成时所述待训练子模型所处的训练时机,确定目标训练时机的方式包括:将所述目标快照数据中的第一训练状态数据表征的训练轮次的下一轮次,确定为目标训练时机。6.根据权利要求1
‑
3任一项所述的方法,其中,所述基于所述待训练子模型的训练轮次所设定的周期性时机,包括:所述训练轮次中的训练阶段的结束时机。7.根据权利要求6所述的方法,其中,所述快照数据中记录有第二训练状态数据;其中,所述第二训练状态数据用于表征生成所述快照数据时所述待训练子模型所处训练轮次以及所处训练阶段;基于所述目标快照数据生成时所述待训练子模型所处的训练时机,确定目标训练时机的方式,包括:确定所述目标快照数...
【专利技术属性】
技术研发人员:张梦,尉乃升,王艺,岳洪达,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。