【技术实现步骤摘要】
模型构建及任务处理方法、装置、设备、系统和存储介质
[0001]本专利技术实施例涉及联邦学习
,尤其涉及一种模型构建及任务处理方法
、
装置
、
设备
、
系统和存储介质
。
技术介绍
[0002]依据联邦学习的应用场景和参与方持有数据的重叠程度,联邦学习被分为横向联邦学习
、
纵向联邦学习以及联邦迁移学习
。
其中,纵向联邦学习应用场景广泛,主要应对多个参与方的用户重叠部分较大
、
而数据特征重叠部分较小的情况
。
在纵向联邦学习的应用场景中,通常由一方
(
称为需求方
)
提供标签信息,其他方
(
称为协作方
)
提供特征信息,需求方希望通过与协作方的合作进而建立纵向联邦树模型,通过引入多种维度的用户数据来实现数据赋能
、
降低风险等目的
。
[0003]在实现本专利技术的过程中,专利技术人发现,目前的纵向联邦建模方法,标签
、
特征在各参与方之间容易泄露,无法保证联邦建模过程中的数据安全
。
技术实现思路
[0004]本专利技术实施例提供一种模型构建及任务处理方法
、
装置
、
设备
、
系统和存储介质,能够保证联邦建模过程中的数据安全
。
[0005]第一方面,本专利技术实施例提供的联邦树 ...
【技术保护点】
【技术特征摘要】
1.
一种联邦树模型构建方法,其特征在于,所述方法包括:获取训练样本集,所述训练样本集中每个样本包括样本特征和样本标签,所述样本特征包括第一样本特征和第二样本特征,所述第一样本特征来自需求方设备,所述第二样本特征来自协作方设备;根据所述第一样本特征和所述样本标签生成第一标签聚合信息;将所述样本标签加密得到加密样本标签,并向所述协作方设备发送所述加密样本标签,以使得所述协作方设备根据所述加密样本标签和所述第二样本特征生成第二标签聚合信息;根据所述第一标签聚合信息和所述第二标签聚合信息确定联邦树模型的各节点的节点分裂特征;按照所述节点分裂特征对所述每个样本进行分裂,并根据分裂结果构建所述联邦树模型
。2.
根据权利要求1所述的方法,其特征在于,所述获取训练样本集,包括:对所述需求方设备提供的建模数据和所述协作方设备提供的建模数据隐私求交,得到原始样本集;从所述原始样本集中采集样本,得到所述训练样本集
。3.
根据权利要求1所述的方法,其特征在于,所述根据所述第一样本特征和所述样本标签生成第一标签聚合信息,包括:将所述第一样本特征分桶,得到所述第一样本特征的分桶标签;将所述样本标签向量化,得到标签指示向量;根据所述第一样本特征的分桶标签和所述标签指示向量生成所述第一标签聚合信息
。4.
根据权利要求3所述的方法,其特征在于,所述将所述第一样本特征分桶,得到所述第一样本特征的分桶标签,包括:确定所述第一样本特征的取值范围;根据所述第一样本特征的取值范围对所述第一样本特征分桶,得到所述第一样本特征的分桶标签
。5.
根据权利要求3所述的方法,其特征在于,所述联邦树模型为联邦分类树模型,所述将所述样本标签向量化,得到标签指示向量,包括:对所述样本标签进行独热编码,得到所述标签指示向量
。6.
根据权利要求3所述的方法,其特征在于,所述联邦树模型为联邦回归树模型,所述将所述样本标签向量化,得到标签指示向量,包括:对所述样本标签进行指数运算,得到所述标签指示向量
。7.
根据权利要求3至6任一项所述的方法,其特征在于,所述根据所述第一样本特征的分桶标签和所述标签指示向量生成所述第一标签聚合信息,包括:根据所述第一样本特征的分桶标签分别将所述标签指示向量的每个维度数据累加,得到所述第一标签聚合信息
。8.
根据权利要求3所述的方法,其特征在于,所述将所述样本标签加密得到加密样本标签,包括:采用加法同态加密算法对所述标签指示向量加密,得到加密样本标签
。
9.
根据权利要求1所述的方法,其特征在于,所述联邦树模型为联邦分类树模型,所述根据所述第一标签聚合信息和所述第二标签聚合信息确定所述联邦树模型的各节点的节点分裂特征,包括:根据所述第一标签聚合信息计算所述第一样本特征的基尼增益,并根据所述第二标签聚合信息计算所述第二样本特征的基尼增益;从所述第一样本特征和所述第二样本特征中抽取目标样本特征;根据所述目标样本特征的基尼增益确定所述联邦树模型的各节点的节点分裂特征
。10.
根据权利要求1所述的方法,其特征在于,所述联邦树模型为联邦回归树模型,所述根据所述第一标签聚合信息和所述第二标签聚合信息确定所述联邦树模型的各节点的节点分裂特征,包括:...
【专利技术属性】
技术研发人员:谷清水,彭春华,雍兴辉,刘涛,关诚,
申请(专利权)人:北京京东世纪贸易有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。