【技术实现步骤摘要】
模型构建方法、装置、电子设备和存储介质
[0001]本专利技术涉及数据处理领域,尤其涉及一种模型构建方法、装置、电子设备和存储介质。
技术介绍
[0002]联邦学习(federated learning)是指通过联合不同的参与方(participant或party,也称为数据拥有者(data owner)或客户(client))进行机器学习的方法。在联邦学习中,各参与方并不需要向其它参与方和协调者(coordinator,也称为参数服务器(parameter server)或聚合服务器(aggregation server))暴露自己拥有的数据,因而可以很好地保护用户隐私和保障数据安全。
[0003]其中,纵向联邦学习是在各参与方的用户重叠较多,而数据特征重叠较少的情况下,取出各参与方之间相同用户对应的那部分数据进行联合机器学习训练。
[0004]在传统的纵向联邦学习过程中,采用的样本数据的时间维度单一,导致模型在上线后稳定性偏低,生命周期较短。
技术实现思路
[0005]本专利技术的主要目的 ...
【技术保护点】
【技术特征摘要】
1.一种模型构建方法,其特征在于,应用于纵向联邦学习的第一参与方,所述方法包括:确定第一样本;所述第一样本中包括对齐的用户身份加密数据、标签加密数据和日期数据;根据所述第一样本,确定若干份第一回溯样本,同一用户身份加密数据在不同第一回溯样本中对应的日期数据不同;向第二参与方发送若干份所述第一回溯样本,以使所述第二参与方联合所述第一参与方,基于若干份所述第一回溯样本和所述第二参与方本地的对应日期的若干份第二回溯样本,进行建模,生成目标模型;所述第二回溯样本中包括对齐的用户身份加密数据和若干特征加密数据。2.根据权利要求1所述的方法,其特征在于,还包括:确定第二参与方的数据的最早可回溯日期;根据所述最早可回溯日期,确定时间因子;所述时间因子包括若干个单位时间;所述根据所述第一样本,确定若干份第一回溯样本,同一用户身份加密数据在不同第一回溯样本中对应的日期数据不同,包括:根据所述第一样本,结合所述时间因子,确定若干份第一回溯样本,同一用户身份加密数据在不同第一回溯样本中对应的日期数据不同。3.根据权利要求2所述的方法,其特征在于,所述时间因子为k,所述时间因子包括(k
‑
1)个月,k为正整数;所述根据所述第一样本,结合所述时间因子,确定若干份第一回溯样本,同一用户身份加密数据在不同第一回溯样本中对应的日期数据不同,包括:根据所述第一样本中的日期数据,结合时间因子,确定第i个第一回溯样本中的日期数据为第一样本中的日期数据
‑
(i
‑
1),i为小于等于k的正整数。4.根据权利要求1
‑
3任一项所述的方法,其特征在于,所述向第二参与方发送若干份所述第一回溯样本,以使所述第二参与方联合所述第一参与方,基于若干份所述第一回溯样本和所述第二参与方本地的对应日期的若干份第二回溯样本,进行建模,生成目标模型,包括:向第二参与方发送若干份所述第一回溯样本,以使所述第二参与方针对每一第一回溯样本,根据所述第一回溯样本的日期数据,从所述第二参与方的本地数据中确定对应日期的第二回溯样本;针对每一第一回溯样本,确定初始子模型;针对每一第一回溯样本,联合所述第二参与方,基于所述第一回溯样本和所述第一回溯样本对应的第二回溯样本,对所述初始子模型进行训练,生成子模型;结合若干所述子模型,生成目标模型。5.根据权利要求4所述的方法,其特征在于,还包括:向第二参与方发送每个子模型对应的权重,以使所述第二参与方结合若干所述子模型,以及每个子模型对应的权重,生成目标模型。6.根据权利要求1
‑
3任一项所述的方法,其特征在于,所述确定第一样本,包括:向第二参与方发送第一原始样本,所述第一原始样本中包括用户身份加密数据、标签
加密数据和日期数据,以使所述第二参与方根据所述第一原始样本和第二参与方的本地数据,进行样本对齐,确定对齐的用户身份加密数据;所述本地数据中包括用户身份数据和若干特征加密数据;根据所述对齐的用户身份加密数据,从所述第一原始样本中确定第一样本。7.一种模型构建方法,其特征在于,应用于纵向联邦学习的第二参与方,所述方法包括:接收第一参与方发送的若干份第一回溯样本;所述若干份第一回溯样本是所述第一参与方在确定第一样本后,根据所述第一样本确定的;所述第一样本中包括对齐的用户身份加密数据、标签加密数据和日期数据;同一用户身份加密数据在不同第一回溯样本中对应的日期数据不同;联合所述第一参与方...
【专利技术属性】
技术研发人员:吴博峰,周瀚池,吴翟宁,梁议丹,
申请(专利权)人:深圳前海微众银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。