用于联邦特征工程的数据处理方法、装置、设备以及介质制造方法及图纸

技术编号:31091805 阅读:37 留言:0更新日期:2021-12-01 12:55
本公开提供了用于联邦特征工程的数据处理方法、装置、设备以及介质,涉及深度学习领域。具体实现方案为:接收业务方发送的样本数据的第一样本标识、与第一样本标识对应的密文标签以及接收数据方发送的样本数据的第二样本标识;根据第一样本标识以及第二样本标识,确定目标样本标识发送给数据方;根据密文标签以及目标样本标识,确定出目标密文标签发送给数据方;响应于接收到数据方基于目标样本标识以及目标密文标签进行特征分桶后计算得到的各分桶的第一标签之和以及第二标签之和,基于目标密文标签、各分桶的第一标签之和以及第二标签之和,计算以及输出目标样本标识对应的参数。本实现方式可以提高数据共享过程中的安全性。性。性。

【技术实现步骤摘要】
用于联邦特征工程的数据处理方法、装置、设备以及介质


[0001]本公开涉及计算机
,具体涉及深度学习、数据处理领域,尤其涉及用于联邦特征工程的数据处理方法、装置、设备以及介质。

技术介绍

[0002]为了解决数据孤岛及数据隐私安全的问题,目前主流方法是运用联邦学习将不同的数据联合训练,得到更好的模型以解决实际问题。联邦学习根据数据的分布情况分为横向联邦学习、纵向联邦学习、以及迁移学习。其中,纵向联邦学习应用较广。例如在金融场景中,银行等金融机构中含有信贷标签,而电商平台有用户的消费数据,双方用户存在交集,银行可以利用电商的数据进行信贷风险预测,但双方不能进行数据共享,这时纵向联邦学习可以用来解决这类问题。

技术实现思路

[0003]本公开提供了一种用于联邦特征工程的数据处理方法、装置、设备以及介质。
[0004]根据第一方面,提供了一种用于联邦特征工程的数据处理方法,包括:接收业务方发送的样本数据的第一样本标识、与第一样本标识对应的密文标签以及接收数据方发送的样本数据的第二样本标识,密文标签包括第一标签和第二标签;本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于联邦特征工程的数据处理方法,应用于第三方,包括:接收业务方发送的样本数据的第一样本标识、与所述第一样本标识对应的密文标签以及接收数据方发送的样本数据的第二样本标识,所述密文标签包括第一标签和第二标签;根据所述第一样本标识以及所述第二样本标识,确定目标样本标识发送给所述数据方;根据所述密文标签以及所述目标样本标识,确定出目标密文标签发送给所述数据方;响应于接收到所述数据方基于所述目标样本标识以及所述目标密文标签进行特征分桶后计算得到的各分桶的第一标签之和以及第二标签之和,基于所述目标密文标签、各分桶的第一标签之和以及第二标签之和,计算以及输出所述目标样本标识对应的参数。2.根据权利要求1所述的方法,其中,所述根据所述第一样本标识以及所述第二样本标识,确定目标样本标识发送给所述数据方,包括:对所述第一样本标识以及所述第二样本标识进行对齐,确定所述业务方和所述数据方共有的样本标识为目标样本标识发送给所述数据方。3.根据权利要求1所述的方法,其中,所述基于所述目标密文标签、各分桶的第一标签之和以及第二标签之和,计算以及输出所述目标样本标识对应的参数,包括:根据所述目标密文标签,确定正标签之和以及负标签之和;根据各分桶的第一标签之和以及第二标签之和,确定各分桶的正标签数量和负标签数量;根据所述正标签之和、所述负标签之和以及各分桶的正标签数量和负标签数量,计算以及输出所述目标样本标识对应的参数。4.根据权利要求3所述的方法,其中,所述根据所述目标密文标签,确定正标签之和以及负标签之和,包括:确定所述目标密文标签中第一标签之和以及第二标签之和;分别将所述第一标签之和与随机生成的第一掩码相加、所述第二标签之和与随机生成的第二掩码相加,将得到的两个和值加密后发送给所述业务方;接收所述业务方对加密后的两个和值进行解密得到的第一数据,根据所述第一数据以及所述第一掩码、所述第二掩码,确定正标签之和以及负标签之和。5.根据权利要求3所述的方法,其中,所述根据各分桶的第一标签之和以及第二标签之和,确定各分桶的正标签数量和负标签数量,包括:分别将各分桶的第一标签之和与随机生成的第三掩码相加、将各分桶的第二标签之和与随机生成的第四掩码相加,对得到的两个和值加密后发送给所述业务方;接收所述业务方针对加密后的两个和值解密后得到的第二数据,根据所述第二数据以及所述第三掩码、所述第四掩码,确定各分桶的正标签数量和负标签数量。6.根据权利要求3所述的方法,其中,所述根据所述正标签之和、所述负标签之和以及各分桶的正标签数量和负标签数量,计算以及输出所述目标样本标识对应的参数,包括:根据所述正标签之和、所述负标签之和、各分桶的正标签数量和负标签数量以及预先设置的至少两个参数,计算以及输出所述目标样本标识对应的参数。7.根据权利要求1

6任一项所述的方法,其中,所述计算以及输出所述目标样本标识对应的参数,包括:
将计算得到的至少一个参数输出给所述数据方。8.根据权利要求4或5所述的方法,其中,所述方法还包括:接收所述业务方发送的公钥;利用所述公钥进行加密,以供所述业务方根据与所述公钥配对的私钥进行解密。9.一种用于联邦特征工程的数据处理装置,包括:数据接收单元,被配置成接收业务方发送的样本数据的第一样本标识、与所述第一样本标识对应的密文标签以及接收数据方发送的样本数据的第二样本标识...

【专利技术属性】
技术研发人员:尹靖雯孙中伟张钧皓曹雨晨姬艳鑫张新刘永平宋红花赵国梁
申请(专利权)人:京东科技信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1