多方联合信息价值计算方法、相关设备及存储介质技术

技术编号:33251404 阅读:30 留言:0更新日期:2022-04-27 18:14
本申请公开一种多方联合信息价值计算方法、相关设备及存储介质,方法包括:第一参与方获取M个样本的标签密文信息,任一样本的标签密文信息是由第二参与方基于同态加密算法和任一样本的标签信息确定的;根据每个分箱中的各个特征数据对应的样本的标签密文信息,确定每个分箱的样本分布密文信息;在同态加密算法的密文空间中,对每个分箱的样本分布密文信息进行秘密分享处理,得到目标秘密分享结果;使第二参与方根据目标秘密分享结果对应的解密结果计算每个分箱的证据权重,并根据每个分箱的证据权重生成目标密文信息;根据第二参与方发送的目标密文信息确定目标特征变量的信息价值,这样可有效避免相关信息泄露,提升信息安全性。安全性。安全性。

【技术实现步骤摘要】
多方联合信息价值计算方法、相关设备及存储介质


[0001]本申请涉及互联网
,具体涉及计算机
,尤其涉及一种多方联合信息价值计算方法、相关设备及存储介质。

技术介绍

[0002]随着人工智能(Artificial Intelligence,AI)技术的发展,联邦学习(Federated Learning)技术被提出;所谓的联邦学习技术是指:在不需要各方数据出域的情况下,通过至少两个参与方协作完成机器学习模型的训练任务或推理任务的技术。目前,在基于联邦学习技术执行机器学习模型的训练任务时,通常会对参与建模的特征变量进行筛选以提升机器学习模型(例如逻辑回归(Logistic Regression, LR)模型)的稳定性。具体的,可以先计算参与建模的各个特征变量的信息价值(information value,IV),所谓的信息价值可用于衡量特征变量对于标签信息的预测能力或者特征变量对模型的重要性;然后,可选取IV值较大的特征变量来参与建模,从而提升机器学习模型的稳定性。
[0003]由于通过IV值筛选特征变量是一种有监督的特征选择本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多方联合信息价值计算方法,其特征在于,所述方法由参与联邦学习的第一参与方执行,所述第一参与方持有目标特征变量对应的特征集,所述特征集包括M个样本中的每个样本的特征数据,所述联邦学习的第二参与方持有所述每个样本的标签信息,M为正整数;所述方法包括:获取所述M个样本的标签密文信息,任一样本的标签密文信息是由所述第二参与方基于同态加密算法和所述任一样本的标签信息确定的;在对所述特征集进行分箱处理后,根据每个分箱中的各个特征数据对应的样本的标签密文信息,确定所述每个分箱的样本分布密文信息;其中,任一分箱的样本分布密文信息与计算所述任一分箱的证据权重所需的参数相关;在所述同态加密算法的密文空间中,对所述每个分箱的样本分布密文信息进行秘密分享处理,得到目标秘密分享结果;将所述目标秘密分享结果发送给所述第二参与方,使所述第二参与方根据所述目标秘密分享结果对应的解密结果计算所述每个分箱的证据权重,并根据所述每个分箱的证据权重生成目标密文信息;接收所述第二参与方发送的所述目标密文信息,并根据所述目标密文信息确定所述目标特征变量的信息价值。2.如权利要求1所述的方法,其特征在于,所述特征集被划分至K个分箱中,K为正整数;计算任一分箱的证据权重所需的参数包括正样本比例和负样本比例,每个样本的标签密文信息包括第一标签密文和第二标签密文;所述根据每个分箱中的各个特征数据对应的样本的标签密文信息,确定所述每个分箱的样本分布密文信息,包括:对所述K个分箱中的第k个分箱中的各个特征数据对应的样本的标签密文信息中的第一标签密文进行加法运算,得到所述第k个分箱的第一分布密文,所述第一分布密文与计算所述第k个分箱的证据权重所需的正样本比例相关;其中,k∈[1,K];对所述第k个分箱中的各个特征数据对应的样本的标签密文信息中的第二标签密文进行加法运算,得到所述第k个分箱的第二分布密文,所述第二分布密文与计算所述第k个分箱的证据权重所需的负样本比例相关;将所述第k个分箱的第一分布密文和相应的第二分布密文,作为所述第k个分箱的样本分布密文信息。3.如权利要求1所述的方法,其特征在于,所述特征集被划分至K个分箱中,K为正整数;所述在所述同态加密算法的密文空间中,对所述每个分箱的样本分布密文信息进行秘密分享处理,得到目标秘密分享结果,包括:生成用于乘法秘密分享处理的目标随机数;在所述同态加密算法的密文空间中,采用所述目标随机数对第k个分箱的样本分布密文信息进行乘法秘密分享处理,得到所述第k个分箱的乘法秘密分享结果;其中,k∈[1,K],K个分箱中的各个分箱的乘法秘密分享结果构成目标秘密分享结果。4.如权利要求3所述的方法,其特征在于,所述第k个分箱的样本分布密文信息包括第一分布密文和第二分布密文,所述目标随机数包括第一随机数和第二随机数;所述在所述同态加密算法的密文空间中,采用所述目标随机数对第k个分箱的样本分
布密文信息进行乘法秘密分享处理,得到所述第k个分箱的乘法秘密分享结果,包括:在所述同态加密算法的密文空间中,采用所述第一随机数对所述第k个分箱的第一分布密文进行乘法运算,得到第一乘法运算结果;在所述同态加密算法的密文空间中,采用所述第二随机数对所述第k个分箱的第二分布密文进行乘法运算,得到第二乘法运算结果;采用所述第一乘法运算结果和所述第二乘法运算结果,构建所述第k个分箱的乘法秘密分享结果。5.如权利要求4所述的方法,其特征在于,所述方法还包括:对所述第一随机数和所述第二随机数之间的比值进行对数运算,得到所述第k个分箱对应的随机数对数运算结果;将所述随机数对数运算结果发送给所述第二参与方,使所述第二参与方根据所述随机数对数运算结果以及所述目标秘密分享结果对应的解密结果,计算所述第k个分箱的证据权重。6.如权利要求1所述的方法,其特征在于,所述方法还包括:分别生成每个分箱对应的第三随机数;采用所述每个分箱对应的第三随机数,分别对所述每个分箱的样本分布密文信息进行加法秘密分享处理,得到所述每个分箱的加法秘密分享结果;根据所述每个分箱的加法秘密分享结果,生成所述每个分箱的权重系数参考信息;将所述每个分箱的权重系数参考信息发送给所述第二参与方,使所述第二参与方根据所述每个分箱的权重系数参考信息以及所述每个分箱的证据权重,生成目标密文信息,使得所述目标密文信息对应的解密结果与所述目标特征变量的信息价值相关。7.如权利要求6所述的方法,其特征在于,所述特征集被划分至K个分箱中,K为正整数;第k个分箱的样本分布密文信息包括第一分布密文和第二密文信息,k∈[1,K];所述采用所述每个分箱对应的第三随机数,分别对所述每个分箱的样本分布密文信息进行加法秘密分享处理,得到所述每个分箱的加法秘密分享结果,包括:对所述第k个分箱的样本分布密文信息中的第一分布密文和相应的第二分布密文进行差值运算,得到差值运算结果;将所述差值运算结果与所述第k个分箱对应的第三随机数之间的差值,作为所述第k个分箱的第一秘密分片;以及将所述第k个分箱对应的第三随机数,作为所述第k个分箱的第二秘密分片;采用所述第k个分箱的第一秘密分片和所述第k个分箱的第二秘密分片,构建所述第k个分箱的加法秘密分享结果。8.如权利要求7所述的方法,其特征在于,所述根据所述每个分箱的加法秘密分享结果,生成所述每个分箱的权重系数参考信息,包括:对所述第k个分箱的加法秘密分享结果中的第二秘密分片进行同态加密处理,得到所述第二秘密分片的密文信息;采用所述第k个分箱的加法秘密分享结果中的第一秘密分片,以及所述第二秘密分片的密文信息,构建所述第k个分箱的权重系数参考信息。9.如权利要求6所述的方法,其特征在于,所述根据所述目标密文信息确定所述目标特
征变量的信息价值,包括:对所述目标密文信息进行解密处理,得到所述目标密文信息对应的解密结果;根据所述目标密文信息对应的解密结果,确定所述目标特征变量的信息价值。10.如权利要求9所述的方法,其特征在于,所述任一样本的标签密文信息是基于同态加密算法、所述任一样本的标签信息以及数值转换因子确定的;其中,所述目标密文信息对应的解密结果,与采用所述数值转换因子乘以所述目标特征变量的信息价值的结果相同;所述根据所述目标密文信息对应的解密结果,确定所述目标特征变量的信息价值,包括:采用所述目标密文信息对应的解密结果除以所述数值转换因子,得到所述目标特征变量的信息价值。11.如权利要求1所述的方法,其特征在于,所述目标密文信息包括所述每个分箱的权重密文,所述每个分箱的权重密文是对所述每个分箱的证据权重进行同态加密处理得到的;所述根据所述目标密文信息确定所述目标特征变量的信息价值,包括:根据所述每个分箱的权重密文和所述每个分箱的样本分布密文信息,计算所述目标特征变量的信息价值密文信息;生成噪声参数,并采用所述噪声参数对所述信息价值密文信息进行加噪处理,得到加噪后的信息价值密文信息;将所述加噪后的信息价值密文信息发送给所述第二参与方,使所述第二参与方对所述加噪后的信息价值密文信息进行解密处理,得到信息价值解密信息;接收所述第二参与方发送的所述信息价值解密信息,并根据所述噪声参数对所述信息价值解密信息进行去噪处理,以得到所述目标特征变量的信息价值。12.如权利要求11所述的方法,其特征在于,所述特征集被划分至K个分箱中,K为正整数;其中,每个分箱的样本分布密文信息包括:第一分布密文和第二分布密文;所述根据所述每个分箱的权重密文和所述每个分箱的样本分布密文信息,计算所述目标特征变量的信息价值密文信息,包括:将所述每个分箱的样本分布密文信息中的第一分布密文和第二分布密文之间的差值,确定所述每个分箱的权重系数密文信息;采用所述每个分箱的权重系数密文信息,对所述每个分箱的权重密文进行加权求和,得到所述目标特征变量的信息价值密文信息。13.如权利要求11所述的方法,其特征在于,所述采用所述噪声参数对所述信息价值密文信息进行加噪处理,得到加噪后的信息价值密文信息,包括:对所述噪声参数和所述信息价值密文信息进行求和处理,并将求和处理的结果作为加噪后的信息价值密文信息;所述根据所述噪声参数对所述信息价值解密信息进行去噪处理,以得到所述目标特征变量的信息价值,包括:计算所述信息价值解密信息和所述噪声参数之间的差值,并根据所述信息价值解密信息和所述噪声参数之间的差值,确定所述目标特征变量的信息价值。14.一种多方联合信息价值计算方法,其特征在于,所述方法由参与联邦学习的第二参与方执行,所述联邦学习的第一参与方持有目标特征变量对应的特征集,所述特征集包括M个样本中的每个样本的特征数据,所述第二参与方持有所述每个样本的标签信息,M为正整数;所述方法包括:
接收所述第一参与方发送的目标秘密分享结果,所述目标秘密分享结果是由所述第一参与方在同态加密算法的密文空间中,对所述特征集对应的每个分箱的样本分布密文信息进行秘密分享处理得到的;其中,任一分箱的样本分布密文信息与计算所述任一分箱的证据权重所需的参数相关;所述每个分箱的样本分布密文信息是由所述第一参与方根据每个分箱中的各个特征数据对应的样本的标签密文信息确定的,任一样本的标签密文信息是由所述第二参与方基于同态加密算法和所述任一样本的标签信息确定的;根据所述目标秘密分享结果对应的解密结果计算所述每个分箱的证据权重,并根据所述每个分箱的证据权重生成目标密文信息;将所述目标密文信息发送给所述第一参与方,使所述第一参与方根据所述目标密文信息确定所述目标特征变量的信息价值。15.如权利要求14所述的方法,其特征在于,所述方法还包括:基于同态加密算法和所述每...

【专利技术属性】
技术研发人员:程勇蒋杰刘煜宏陈鹏陶阳宇
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1