全流程加密的数据价值评估方法、系统及电子设备技术方案

技术编号:34461100 阅读:15 留言:0更新日期:2022-08-06 17:22
本公开提供一种全流程加密的数据价值评估方法,包括基于秘密分享协议确定数据提供方对应的第一隐私数据和数据使用方对应的第二隐私数据的联邦数据集;通过数据提供方对应的第一密钥和数据使用方对应的第二密钥,对联邦数据集进行特征分箱,确定联邦数据集的正样本和负样本;根据联邦数据集的正样本和负样本,在同时确定第一密钥和第二密钥的情况下,确定正样本和负样本的样本浓度;综合正样本和负样本的样本浓度,第一隐私数据与第二隐私数据,通过预先构建的数据价值评估模型,确定第一隐私数据对第二隐私数据的数据价值。本公开的方法能够在少量样本的情况下即可完成数据价值评估,可以同时保证在恶意环境下的安全性和计算速度。算速度。算速度。

【技术实现步骤摘要】
全流程加密的数据价值评估方法、系统及电子设备


[0001]本公开涉及隐私计算
,尤其涉及一种全流程加密的数据价值评估方法、系统及电子设备。

技术介绍

[0002]目前的隐私计算系统是基于“诚实可信”的模式下开展建设的,主要保证数据不出域,并且在安全的环境下进行计算,但是对于可能存在的恶意攻击,并没有完全纳入考虑,并且由于攻击手段无法枚举,因此无法从技术体系上完全规避安全隐患,因此其目前主要用于合作双方进入项目合作之后的场景落地。
[0003]如果需要完全规避安全隐患,只有对隐私计算的全环节、全方位实现全面的安全管控,但是这会大大降低隐私计算执行的速度,从而导致无法在具体项目中落地。
[0004]在目前的隐私计算应用场景中,数据使用方期望在正式进入隐私计算联合项目之前可以提前评估数据提供方的数据对自身的具体业务的效果增益,由于传统的隐私计算平台的安全性在恶意环境下,可能存在安全隐患,对于数据提供方来说,在项目合作之前的商务对接阶段,数据提供方不愿意通过隐私计算平台为数据使用方提供数据价值评估的通道。
[0005]公开于本申请
技术介绍
部分的信息仅仅旨在加深对本申请的一般
技术介绍
的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。

技术实现思路

[0006]本公开实施例提供一种全流程加密的数据价值评估方法、系统及电子设备,能够在少量样本的情况下即可完成数据价值评估,可以同时保证在恶意环境下的安全性和计算速度。
[0007]本公开实施例的第一方面,
[0008]提供一种全流程加密的数据价值评估方法,其特征在于,所述方法用于所述数据提供方和所述数据使用方,包括:
[0009]基于秘密分享协议确定数据提供方对应的第一隐私数据和数据使用方对应的第二隐私数据的联邦数据集;
[0010]通过所述数据提供方对应的第一密钥和所述数据使用方对应的第二密钥,对所述联邦数据集进行特征分箱,确定所述联邦数据集的正样本和负样本;
[0011]根据所述联邦数据集的正样本和负样本,在同时确定所述第一密钥和所述第二密钥的情况下,确定所述正样本和所述负样本的样本浓度;
[0012]综合所述正样本和所述负样本的样本浓度,所述第一隐私数据与所述第二隐私数据,通过预先构建的数据价值评估模型,确定所述第一隐私数据对所述第二隐私数据的数据价值,其中,所述数据价值评估模型基于神经网络构建,用于确定隐私数据与数据使用场
景的匹配度。
[0013]在一种可选的实施方式中,
[0014]所述基于秘密分享协议确定数据提供方对应的第一隐私数据和数据使用方对应的第二隐私数据的联邦数据集的方法包括:
[0015]所述数据提供方利用预先确定的第一密钥对第一隐私数据进行数据加密;
[0016]所述数据使用方利用预先确定的第二密钥对第二隐私数据进行数据加密;
[0017]根据第一密钥、第二密钥以及秘密分享乘法协议,确定所述第一隐私数据与所述第二隐私数据的联邦数据集。
[0018]在一种可选的实施方式中,
[0019]在确定所述第一隐私数据与所述第二隐私数据的联邦数据集之后,所述方法还包括:
[0020]基于所述第一隐私数据、所述第二隐私,以及所述联邦数据集,确定所述第一隐私数据和/或所述第二隐私数据的样本覆盖度,其中,
[0021]所述样本覆盖度用于指示所述第一隐私数据和/或所述第二隐私数据与所述联邦数据集的数据关联度;
[0022]将所述样本覆盖度通过不经意传输方式传输至所述数据提供方和所述数据使用方。
[0023]在一种可选的实施方式中,
[0024]所述通过所述数据提供方对应的第一密钥和所述数据使用方对应的第二密钥,对所述联邦数据集进行特征分箱的方法包括:
[0025]通过所述数据提供方对应的第一密钥确定所述第一密钥与所述联邦数据集的样本的第一关联度;
[0026]通过所述数据使用方对应的第二密钥确定所述第二密钥与所述联邦数据集的样本的第二关联度;
[0027]分别按照所述第一关联度和所述第二关联度的关联紧密程度对所述联邦数据集进行特征分箱。
[0028]在一种可选的实施方式中,
[0029]在确定所述正样本和所述负样本的样本浓度之前,所述方法还包括:
[0030]结合预先获取的历史数据,针对第一隐私数据对应的第一过滤策略,确定第一过滤结果;
[0031]结合预先获取的历史数据,针对第二隐私数据对应的第二过滤策略,确定第二过滤结果;
[0032]基于所述第一过滤结果和所述第二过滤结果,筛选所述联邦数据集不符合预设过滤条件的样本。
[0033]在一种可选的实施方式中,
[0034]通过预先构建的数据价值评估模型,确定所述第一隐私数据对所述第二隐私数据的数据价值的方法包括:
[0035]通过预先构建的数据价值评估模型,确定所述第一隐私数据对应的第一逻辑值;
[0036]通过预先构建的数据价值评估模型,确定所述第二隐私数据对应的第二逻辑值;
[0037]基于所述正样本和所述负样本的样本浓度,分别为所述第一逻辑值分配第一权重值,为所述第二逻辑值分配第二权重值;
[0038]基于所述第一逻辑值、所述第一权重值,以及所述第一隐私数据,确定第一信息价值指标;
[0039]基于所述第二逻辑值、所述第二权重值,以及所述第二隐私数据,确定第二信息价值指标;
[0040]根据所述第一信息价值指标和所述第二信息价值指标的匹配度,确定所述第一隐私数据对所述第二隐私数据的数据价值,其中,
[0041]所述数据价值用于指示所述第一隐私数据在所述第二隐私数据适用场景的匹配度。
[0042]本公开实施例的第二方面,
[0043]提供一种全流程加密的数据价值评估方法,所述方法用于所述数据提供方,包括:
[0044]基于秘密分享协议确定数据提供方对应的第一隐私数据和数据使用方对应的第二隐私数据的联邦数据集;
[0045]通过所述数据提供方对应的第一密钥,对所述联邦数据集进行特征分箱,确定所述联邦数据集的正样本和负样本;
[0046]根据所述联邦数据集的正样本和负样本,接收到所述数据使用方提供的第二密钥的情况下,确定所述正样本和所述负样本的样本浓度;
[0047]综合所述正样本和所述负样本的样本浓度,所述第一隐私数据与所述第二隐私数据,通过预先构建的数据价值评估模型,确定所述第一隐私数据对所述第二隐私数据的数据价值,其中,所述数据价值评估模型基于神经网络构建,用于确定隐私数据与数据使用场景的匹配度。
[0048]本公开实施例的第三方面,
[0049]提供一种全流程加密的数据价值评估方法,所述方法用于所述数据使用方,包括:
[0050]基于秘密分享协议确定数据提供方对应的第一隐私数据和数据使用方对应的第二隐私数据的联邦数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种全流程加密的数据价值评估方法,其特征在于,所述方法用于数据提供方和数据使用方,包括:基于秘密分享协议确定数据提供方对应的第一隐私数据和数据使用方对应的第二隐私数据的联邦数据集;通过所述数据提供方对应的第一密钥和所述数据使用方对应的第二密钥,对所述联邦数据集进行特征分箱,确定所述联邦数据集的正样本和负样本;根据所述联邦数据集的正样本和负样本,在同时确定所述第一密钥和所述第二密钥的情况下,确定所述正样本和所述负样本的样本浓度;综合所述正样本和所述负样本的样本浓度,所述第一隐私数据与所述第二隐私数据,通过预先构建的数据价值评估模型,确定所述第一隐私数据对所述第二隐私数据的数据价值,其中,所述数据价值评估模型基于神经网络构建,用于确定隐私数据与数据使用场景的匹配度。2.根据权利要求1所述的全流程加密的数据价值评估方法,其特征在于,所述基于秘密分享协议确定数据提供方对应的第一隐私数据和数据使用方对应的第二隐私数据的联邦数据集的方法包括:所述数据提供方利用预先确定的第一密钥对第一隐私数据进行数据加密;所述数据使用方利用预先确定的第二密钥对第二隐私数据进行数据加密;根据第一密钥、第二密钥以及秘密分享乘法协议,确定所述第一隐私数据与所述第二隐私数据的联邦数据集。3.根据权利要求2所述的全流程加密的数据价值评估方法,其特征在于,在确定所述第一隐私数据与所述第二隐私数据的联邦数据集之后,所述方法还包括:基于所述第一隐私数据、所述第二隐私数据,以及所述联邦数据集,确定所述第一隐私数据和/或所述第二隐私数据的样本覆盖度,其中,所述样本覆盖度用于指示所述第一隐私数据和/或所述第二隐私数据与所述联邦数据集的数据关联度;将所述样本覆盖度通过不经意传输方式传输至所述数据提供方和所述数据使用方。4.根据权利要求1所述的全流程加密的数据价值评估方法,其特征在于,所述通过所述数据提供方对应的第一密钥和所述数据使用方对应的第二密钥,对所述联邦数据集进行特征分箱的方法包括:通过所述数据提供方对应的第一密钥确定所述第一密钥与所述联邦数据集的样本的第一关联度;通过所述数据使用方对应的第二密钥确定所述第二密钥与所述联邦数据集的样本的第二关联度;分别按照所述第一关联度和所述第二关联度的关联紧密程度对所述联邦数据集进行特征分箱。5.根据权利要求1所述的全流程加密的数据价值评估方法,其特征在于,在确定所述正样本和所述负样本的样本浓度之前,所述方法还包括:结合预先获取的历史数据,针对第一隐私数据对应的第一过滤策略,确定第一过滤结果;
结合预先获取的历史数据,针对第二隐私数据对应的第二过滤策略,确定第二过滤结果;基于所述第一过滤结果和所述第二过滤结果,筛选所述联邦数据集不符合预设过滤条件的样本。6.根据权利要求1所述的全流程加密的数据价值评估方法,其特征在于,通过预先构建的数据价值评估模型,确定所述第一隐私数据对所述第二隐私数据的数据价值的方法包括:通过预先构建的数据价值评估模型,确定所述第一隐私数据对应的第一逻辑值;通过预先构建的数据价值评估模型,确定所述第二隐私数据对应的第二逻辑值;基于所述正样本和所述负样本的样本浓度,分别为所述...

【专利技术属性】
技术研发人员:伍清华刘登涛毛仁歆马煜翔裴阳
申请(专利权)人:蓝象智联杭州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1