共享编码器生成方法、装置及电子设备制造方法及图纸

技术编号:36428334 阅读:21 留言:0更新日期:2023-01-20 22:39
本申请提出一种共享编码器生成方法、装置及电子设备,属于计算机技术领域。其中,该方法包括:主节点向各子节点发送共享编码器训练指令,以使每个子节点根据训练指令中包括的目标共享编码器的类型获取训练样本;在获取到各子节点返回的确认消息后,向各子节点发送待训练的目标共享编码器的初始参数集,以使各子节点利用各自的训练样本对所述目标共享编码器的初始参数集进行训练;获取各子节点返回的目标共享编码器的更新参数集;根据第一预设规则及各子节点返回的目标共享编码器的更新参数集,确定目标共享编码器对应的目标参数集。由此,通过这种共享编码器生成方法,降低了多领域训练语料的获取难度和成本,提高了共享编码器的性能。性能。性能。

【技术实现步骤摘要】
共享编码器生成方法、装置及电子设备


[0001]本申请涉及计算机
,尤其涉及大数据
,提出一种共享编码器生成方法、装置及电子设备。

技术介绍

[0002]预训练模型已经在计算机视觉、自然语言处理等领域中的应用实践被证明有效,在大数据下进行一次预训练再根据具体任务进行模型参数微调,已经成为一种流行的做法。
[0003]但是,相关技术中,多领域训练语料的获取难度大、成本高,从而导致预训练模型的实现难度大。

技术实现思路

[0004]本申请提出的共享编码器生成方法、装置及电子设备,用于解决相关技术中,多领域训练语料的获取难度大、成本高,从而导致预训练模型的实现难度大的问题。
[0005]本申请一方面实施例提出的共享编码器生成方法,包括:主节点向各子节点发送共享编码器训练指令,所述训练指令中包括待训练的目标共享编码器类型,以使每个子节点根据目标共享编码器的类型获取训练样本;在获取到各子节点返回的确认消息后,向各子节点发送待训练的目标共享编码器的初始参数集,以使各子节点利用各自的训练样本对所述目标共享编码器的初始参数集进行训练;获取各子节点返回的目标共享编码器的更新参数集;根据第一预设规则及各子节点返回的目标共享编码器的更新参数集,确定所述目标共享编码器对应的目标参数集。
[0006]本申请另一方面实施例提出的共享编码器生成方法,包括:第二子节点获取主节点发送的共享编码器训练指令,所述训练指令中包括待训练的目标共享编码器类型;确定包含与所述目标共享编码器类型匹配的训练样本后,向所述主节点返回确认消息;获取所述主节点发送的目标共享编码器的初始参数集;利用与所述目标共享编码器类型匹配的训练样本,进行模型训练,确定所述目标共享编码器的更新参数集;向所述主节点返回所述目标共享编码器的更新参数集。
[0007]本申请再一方面实施例提出的共享编码器生成装置,包括:第一发送模块,用于主节点向各子节点发送共享编码器训练指令,所述训练指令中包括待训练的目标共享编码器类型,以使每个子节点根据目标共享编码器的类型获取训练样本;第二发送模块,用于在获取到各子节点返回的确认消息后,向各子节点发送待训练的目标共享编码器的初始参数集,以使各子节点利用各自的训练样本对所述目标共享编码器的初始参数集进行训练;第一获取模块,用于获取各子节点返回的目标共享编码器的更新参数集;第一确定模块,用于根据第一预设规则及各子节点返回的目标共享编码器的更新参数集,确定所述目标共享编码器对应的目标参数集。
[0008]本申请又一方面实施例提出的共享编码器生成装置,第一获取模块,用于第二子
节点获取主节点发送的共享编码器训练指令,所述训练指令中包括待训练的目标共享编码器类型;第一返回模块,用于确定包含与所述目标共享编码器类型匹配的训练样本后,向所述主节点返回确认消息;第二获取模块,用于获取所述主节点发送的目标共享编码器的初始参数集;第一确定模块,用于利用与所述目标共享编码器类型匹配的训练样本,进行模型训练,确定所述目标共享编码器的更新参数集;第二返回模块,用于向所述主节点返回所述目标共享编码器的更新参数集。
[0009]本申请又一方面实施例提出的电子设备,其包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如前所述的共享编码器生成方法。
[0010]本申请另一方面实施例提出的存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行如前所述的共享编码器生成方法。
[0011]上述申请中的任一个实施例具有如下优点或有益效果:通过主节点组织各子节点利用私有训练样本对目标共享编码器进行训练,以根据各子节点对目标共享编码器的训练结果,确定目标共享编码器的目标参数集,从而不仅实现了多领域训练语料的共享,降低了多领域训练语料的获取难度和成本,而且提高了共享编码器的性能。因为采用了通过主节点向各子节点发送共享编码器训练指令,以使每个子节点根据训练指令中包括的目标共享编码器的类型获取训练样本,并在获取到各子节点返回的确认消息后,向各子节点发送待训练的目标共享编码器的初始参数集,以使各子节点利用各自的训练样本对目标共享编码器的初始参数集进行训练,之后获取各子节点返回的目标共享编码器的更新参数集,进而根据第一预设规则及各子节点返回的目标共享编码器的更新参数集,确定目标共享编码器对应的目标参数集,所以克服了多领域训练语料的获取难度大、成本高,预训练模型的实现难度大的问题,实现了多领域训练语料的共享,降低了多领域训练语料的获取难度和成本,而且提高了共享编码器的性能。
[0012]上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
[0013]附图用于更好地理解本方案,不构成对本申请的限定。其中:
[0014]图1为本申请实施例所提供的一种共享编码器生成方法的流程示意图;
[0015]图2为本申请实施例所提供的另一种共享编码器生成方法的流程示意图;
[0016]图3为本申请实施例所提供的再一种共享编码器生成方法的流程示意图;
[0017]图4为本申请实施例所提供的又一种共享编码器生成方法的流程示意图;
[0018]图5为本申请实施例所提供的又一种共享编码器生成方法的流程示意图;
[0019]图6为本申请实施例提供的一种共享编码器生成装置的结构示意图;
[0020]图7为本申请实施例提供的又一种共享编码器生成装置的结构示意图;
[0021]图8为本申请实施例提供的电子设备的结构示意图。
具体实施方式
[0022]以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种
细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0023]本申请实施例针对相关技术中,多领域训练语料的获取难度大、成本高,从而导致预训练模型的实现难度大的问题,提出一种共享编码器生成方法。
[0024]下面参考附图对本申请提供的共享编码器生成方法、装置、电子设备及存储介质进行详细描述。
[0025]下面分别以主节点侧、子节点侧为例,对本申请实施例提供的共享编码器生成方法进行详细说明。
[0026]首先以主节点侧为例,对本申请实施例提供的共享编码器生成方法进行详细说明。
[0027]下面结合图1,对本申请实施例提供的共享编码器生成方法进行详细说明。
[0028]图1为本申请实施例所提供的一种共享编码器生成方法的流程示意图,该方法应用于主节点。
[0029]如图1所示,该共享编码器生成方法,包括以下步骤:
[0030]步骤101,主节点向本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种共享编码器生成方法,其特征在于,包括:主节点向各子节点发送共享编码器训练指令,所述训练指令中包括待训练的目标共享编码器类型,以使每个子节点根据目标共享编码器的类型获取训练样本;在获取到各子节点返回的确认消息后,向各子节点发送待训练的目标共享编码器的初始参数集,以使各子节点利用各自的训练样本对所述目标共享编码器的初始参数集进行训练;获取各子节点返回的目标共享编码器的更新参数集;根据第一预设规则及各子节点返回的目标共享编码器的更新参数集,确定所述目标共享编码器对应的目标参数集;将所述目标共享编码器对应的目标参数集分别发送给每个子节点,以使每个子节点基于所述目标共享编码器对应的目标参数集,对所述目标共享编码器继续进行训练;获取第一子节点再次返回的目标共享编码器参数集;根据已获取的所述第一子节点返回目标共享编码器参数集的次数,确定所述第一子节点当前的权重值;依据所述第一预设规则,根据所述第一子节点当前的权重值及当前再次返回的目标共享编码器参数集,对所述目标共享编码器对应的目标参数集进行更新。2.如权利要求1所述的方法,其特征在于,所述主节点向各子节点发送共享编码器训练指令之前,还包括:所述主节点获取到至少一个子节点发送的获取目标共享编码器的请求;或者,所述主节点获取到至少一个子节点发送的目标共享编码器更新请求,所述更新请求中包括所述目标共享编码器的标识。3.如权利要求1或2所述的方法,其特征在于,所述向各子节点发送待训练的目标共享编码器的初始参数集之前,还包括:依据第二预设规则,生成所述待训练的目标共享编码器。4.一种共享编码器生成方法,其特征在于,包括:第二子节点获取主节点发送的共享编码器训练指令,所述训练指令中包括待训练的目标共享编码器类型;确定包含与所述目标共享编码器类型匹配的训练样本后,向所述主节点返回确认消息;获取所述主节点发送的目标共享编码器的初始参数集;利用与所述目标共享编码器类型匹配的训练样本,进行模型训练,确定所述目标共享编码器的更新参数集;向所述主节点返回所述目标共享编码器的更新参数集;所述向所述主节点返回确认消息之后,还包括:获取所述主节点返回的目标共享编码器参数更新规则;所述向所述主节点返回所述目标共享编码器的更新参数集,包括:在确定当前满足所述更新规则时,向所述主节点返回所述目标共享编码器的更新参数集。
5.如权利要求4所述的方法,其特征在于,所述利用与所述目标共享编码器类型匹配的训练样本,进行模型训练之后,还包括:确定与所述目标共享编码器对应的私有编码器及私有解码器。6.一种共享编码器生成装置,其特征在于,包括:第一发送模块,用于主节点向各子节点发送共享编码器训练指令,所述训练指令中包括待训练的目标共享编码器类型,以使每个子节点根据目标共享编码器的类型获取训练样本;第二发送模块,用于在获取到各子节点返回的确认消息后,向各子节点发送待训练的目标共享编码器的初始参数...

【专利技术属性】
技术研发人员:董大祥张文慧吴志华于佃海马艳军王海峰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利