【技术实现步骤摘要】
共享编码器生成方法、装置及电子设备
[0001]本申请涉及计算机
,尤其涉及大数据
,提出一种共享编码器生成方法、装置及电子设备。
技术介绍
[0002]预训练模型已经在计算机视觉、自然语言处理等领域中的应用实践被证明有效,在大数据下进行一次预训练再根据具体任务进行模型参数微调,已经成为一种流行的做法。
[0003]但是,相关技术中,多领域训练语料的获取难度大、成本高,从而导致预训练模型的实现难度大。
技术实现思路
[0004]本申请提出的共享编码器生成方法、装置及电子设备,用于解决相关技术中,多领域训练语料的获取难度大、成本高,从而导致预训练模型的实现难度大的问题。
[0005]本申请一方面实施例提出的共享编码器生成方法,包括:主节点向各子节点发送共享编码器训练指令,所述训练指令中包括待训练的目标共享编码器类型,以使每个子节点根据目标共享编码器的类型获取训练样本;在获取到各子节点返回的确认消息后,向各子节点发送待训练的目标共享编码器的初始参数集,以使各子节点利用各自的训练样本对所述目标共享编码器的初始参数集进行训练;获取各子节点返回的目标共享编码器的更新参数集;根据第一预设规则及各子节点返回的目标共享编码器的更新参数集,确定所述目标共享编码器对应的目标参数集。
[0006]本申请另一方面实施例提出的共享编码器生成方法,包括:第二子节点获取主节点发送的共享编码器训练指令,所述训练指令中包括待训练的目标共享编码器类型;确定包含与所述目标共享编码器类型匹配的训练样本后, ...
【技术保护点】
【技术特征摘要】
1.一种共享编码器生成方法,其特征在于,包括:主节点向各子节点发送共享编码器训练指令,所述训练指令中包括待训练的目标共享编码器类型,以使每个子节点根据目标共享编码器的类型获取训练样本;在获取到各子节点返回的确认消息后,向各子节点发送待训练的目标共享编码器的初始参数集,以使各子节点利用各自的训练样本对所述目标共享编码器的初始参数集进行训练;获取各子节点返回的目标共享编码器的更新参数集;根据第一预设规则及各子节点返回的目标共享编码器的更新参数集,确定所述目标共享编码器对应的目标参数集;将所述目标共享编码器对应的目标参数集分别发送给每个子节点,以使每个子节点基于所述目标共享编码器对应的目标参数集,对所述目标共享编码器继续进行训练;获取第一子节点再次返回的目标共享编码器参数集;根据已获取的所述第一子节点返回目标共享编码器参数集的次数,确定所述第一子节点当前的权重值;依据所述第一预设规则,根据所述第一子节点当前的权重值及当前再次返回的目标共享编码器参数集,对所述目标共享编码器对应的目标参数集进行更新。2.如权利要求1所述的方法,其特征在于,所述主节点向各子节点发送共享编码器训练指令之前,还包括:所述主节点获取到至少一个子节点发送的获取目标共享编码器的请求;或者,所述主节点获取到至少一个子节点发送的目标共享编码器更新请求,所述更新请求中包括所述目标共享编码器的标识。3.如权利要求1或2所述的方法,其特征在于,所述向各子节点发送待训练的目标共享编码器的初始参数集之前,还包括:依据第二预设规则,生成所述待训练的目标共享编码器。4.一种共享编码器生成方法,其特征在于,包括:第二子节点获取主节点发送的共享编码器训练指令,所述训练指令中包括待训练的目标共享编码器类型;确定包含与所述目标共享编码器类型匹配的训练样本后,向所述主节点返回确认消息;获取所述主节点发送的目标共享编码器的初始参数集;利用与所述目标共享编码器类型匹配的训练样本,进行模型训练,确定所述目标共享编码器的更新参数集;向所述主节点返回所述目标共享编码器的更新参数集;所述向所述主节点返回确认消息之后,还包括:获取所述主节点返回的目标共享编码器参数更新规则;所述向所述主节点返回所述目标共享编码器的更新参数集,包括:在确定当前满足所述更新规则时,向所述主节点返回所述目标共享编码器的更新参数集。
5.如权利要求4所述的方法,其特征在于,所述利用与所述目标共享编码器类型匹配的训练样本,进行模型训练之后,还包括:确定与所述目标共享编码器对应的私有编码器及私有解码器。6.一种共享编码器生成装置,其特征在于,包括:第一发送模块,用于主节点向各子节点发送共享编码器训练指令,所述训练指令中包括待训练的目标共享编码器类型,以使每个子节点根据目标共享编码器的类型获取训练样本;第二发送模块,用于在获取到各子节点返回的确认消息后,向各子节点发送待训练的目标共享编码器的初始参数...
【专利技术属性】
技术研发人员:董大祥,张文慧,吴志华,于佃海,马艳军,王海峰,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。