System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及人工智能,尤其涉及一种单方样本保护方法、装置、设备及存储介质。
技术介绍
1、在联邦学习技术的应用场景中,时常会出现有两方用户需要进行双方联合建模训练一个模型的情景,中间不乏出现需要提前做样本对齐,然后在对齐后的交集样本上进行模型训练步骤,类似这些步骤中,如这种方式在处理样本对齐的过程中,由于需要双方数据参与,又不存在有效的保护机制保护双方数据的隐私信息,导致双方数据存在隐私暴露的问题。
2、上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
1、本专利技术的主要目的在于提供一种单方样本保护方法、装置、设备及存储介质,旨在解决现有技术联邦学习过程中数据隐私安全性低的技术问题。
2、为实现上述目的,本专利技术提供了一种单方样本保护方法,所述方法包括以下步骤:
3、获取待保护的第一样本数据集;
4、根据所述第一样本数据集生成隐匿查询指令,并将所述隐匿查询指令发送至第二终端,并获得所述第二终端根据所述隐匿查询指令返回的目标索引值,所述目标索引值与第二样本数据集中的样本条目一一对应,所述第二样本数据集存储于第二终端中;
5、根据所述第一样本数据集以及目标索引值生成交集样本数据集;
6、根据所述交集样本数据集训练第一终端的联邦模型。
7、可选的,所述根据所述交集样本数据集训练第一终端的联邦模型,包括:
8、获取第二样本数据集中样本条目对应的内积
9、根据所述第一内积和、第二内积以及第一标签值训练第一终端的联邦模型,根据所述交集样本数据集确定所述交集样本数据集中样本条目的第一内积和、第一索引值以及对应的第一标签值,所述第一索引值为目标索引值中的一条索引值;
10、根据所述第一索引值从样本条目对应的内积和数组中确定第二内积和;
11、根据所述第一内积和、第二内积以及第一标签值训练第一终端的联邦模型。
12、可选的,所述根据所述第一内积和、第二内积以及第一标签值训练第一终端的联邦模型,包括:
13、获取第一终端的第一模型权重以及第二终端的第二模型权重;
14、根据所述第一内积和与第二内积和确定样本预测结果;
15、根据样本预测结果与第一标签值计算样本残差;
16、根据所述样本残差更新第一模型权重,完成所述第一终端的联邦模型训练。
17、可选的,所述方法还包括:
18、根据第二样本数据集中样本条目对应的内积和数组生成目标数组,所述目标数组的长度与内积和数组一致;
19、根据第一索引值将样本残差填充目标数组,得到残差数组;
20、将所述残差数组发送至安全计算平台,以使所述安全计算平台根据所述残差数组和样本特征确定权重调整参数,并将权重调整参数发送至第二终端,完成第二终端的联邦模型训练。
21、此外,为实现上述目的,本专利技术还提供了一种单方样本保护方法,所述方法包括以下步骤:
22、获取待标记第二样本数据集以及序列号集;
23、根据所述序列号集对待标记第二样本数据集中的样本条目添加索引值,得到第二样本数据集,所述索引值与第二样本数据集中的样本条目一一对应;
24、响应第一终端的隐匿查询请求,根据所述隐匿查询请求隐匿查询第二样本数据集,得到目标索引值;
25、将所述目标索引值发送至第一终端。
26、可选的,所述方法还包括:
27、根据所述第二样本数据集确定样本特征;
28、将所述样本特征发送至安全计算平台,以使所述安全计算平台根据所述样本特征和残差数组返回权重调整参数;
29、根据所述权重调整参数更新第二模型权重,完成所述第二终端的联邦模型的训练。
30、此外,为实现上述目的,本专利技术还提出一种单方样本保护装置,所述单方样本保护装置包括:
31、第一获取模块,用于获取待保护的第一样本数据集;
32、处理模块,用于根据所述第一样本数据集生成隐匿查询指令,并将所述隐匿查询指令发送至第二终端,并获得所述第二终端根据所述隐匿查询指令返回的目标索引值,所述目标索引值与第二样本数据集中的样本条目一一对应,所述第二样本数据集存储于第二终端中;
33、所述处理模块,还用于根据所述第一样本数据集以及目标索引值生成交集样本数据集;
34、训练模块,用于根据所述交集样本数据集训练第一终端的联邦模型。
35、此外,为实现上述目的,本专利技术还提出一种单方样本保护装置,所述单方样本保护装置包括:
36、第二获取模块,用于获取待标记第二样本数据集以及序列号集;
37、第二处理模块,用于根据所述序列号集对待标记第二样本数据集中的样本条目添加索引值,得到第二样本数据集,所述索引值与第二样本数据集中的样本条目一一对应;
38、所述第二处理模块,还用于响应第一终端的隐匿查询请求,根据所述隐匿查询请求隐匿查询第二样本数据集,得到目标索引值;
39、所述第二处理模块,还用于将所述目标索引值发送至第一终端。
40、此外,为实现上述目的,本专利技术还提出一种单方样本保护设备,所述单方样本保护设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的单方样本保护程序,所述单方样本保护程序配置为实现如上文所述的单方样本保护方法的步骤。
41、此外,为实现上述目的,本专利技术还提出一种存储介质,所述存储介质上存储有单方样本保护程序,所述单方样本保护程序被处理器执行时实现如上文所述的单方样本保护方法的步骤。
42、本专利技术获取待保护的第一样本数据集;根据所述第一样本数据集生成隐匿查询指令,并将所述隐匿查询指令发送至第二终端,并获得所述第二终端根据所述隐匿查询指令返回的目标索引值,所述目标索引值与第二样本数据集中的样本条目一一对应,所述第二样本数据集存储于第二终端中;根据所述第一样本数据集以及目标索引值生成交集样本数据集;根据所述交集样本数据集训练第一终端的联邦模型。通过上述方式,利用隐匿查询和索引值保护第一终端中确定的交集样本无法被第二终端获取的同时,完成数据对齐,在本地即可完成进行联邦模型训练,避免隐私暴露和计算量大的问题,提高了数据安全性。
本文档来自技高网...【技术保护点】
1.一种单方样本保护方法,其特征在于,应用于第一终端,所述单方样本保护方法包括:
2.如权利要求1所述的方法,其特征在于,所述根据所述交集样本数据集训练第一终端的联邦模型,包括:
3.如权利要求2所述的方法,其特征在于,所述根据所述第一内积和、第二内积以及第一标签值训练第一终端的联邦模型,包括:
4.如权利要求3所述的方法,其特征在于,所述方法还包括:
5.一种单方样本保护方法,其特征在于,应用于第二终端,所述单方样本保护方法包括:
6.如权利要求5所述的方法,其特征在于,所述方法还包括:
7.一种单方样本保护装置,其特征在于,所述单方样本保护装置包括:
8.一种单方样本保护装置,其特征在于,所述单方样本保护装置包括:
9.一种单方样本保护设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的单方样本保护程序,所述单方样本保护程序配置为实现如权利要求1至4或5-6中任一项所述的单方样本保护方法的步骤。
10.一种存储介质,其特征在于,所述
...【技术特征摘要】
1.一种单方样本保护方法,其特征在于,应用于第一终端,所述单方样本保护方法包括:
2.如权利要求1所述的方法,其特征在于,所述根据所述交集样本数据集训练第一终端的联邦模型,包括:
3.如权利要求2所述的方法,其特征在于,所述根据所述第一内积和、第二内积以及第一标签值训练第一终端的联邦模型,包括:
4.如权利要求3所述的方法,其特征在于,所述方法还包括:
5.一种单方样本保护方法,其特征在于,应用于第二终端,所述单方样本保护方法包括:
6.如权利要求5所述的方法,其特征在于,所述方法还包括:
<...【专利技术属性】
技术研发人员:倪高伟,孙苑苑,樊巧云,赵雨,帅敏,
申请(专利权)人:中国移动通信集团江苏有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。