一种基于隐私保护的数据共享方法及装置制造方法及图纸

技术编号:37804538 阅读:11 留言:0更新日期:2023-06-09 09:34
本公开的实施例涉及在隐私保护前提下用于数据共享的方法、节点、分布式系统和存储介质,涉及计算机领域。根据该方法,从包括隐私数据和第一非隐私数据的本地数据,获取隐私数据,第一非隐私数据与隐私数据相关联;生成隐私数据的哈希值;生成用于本地数据的本地标识符与哈希值之间的第一关联;生成用于在分布式系统中索引哈希值的全局标识符,分布式系统与当前节点相关联;生成全局标识符与哈希值之间的第二关联;以及向分布式系统中的其他节点发送第二关联,以在分布式系统中存储第二关联,以用于第一非隐私数据的连接共享。由此,能够在保护本地隐私数据的前提下,安全地进行非隐私数据的共享。私数据的共享。私数据的共享。

【技术实现步骤摘要】
一种基于隐私保护的数据共享方法及装置


[0001]本公开的实施例总体涉及计算机领域,具体涉及在隐私保护前提下用于数据共享的方法、数据提供节点、数据使用节点、分布式系统和计算机存储介质。

技术介绍

[0002]在人工智能时代,数据成为一种重要的战略资源。国家和企业基于战略及安全需要,对数据隐私的保护也变得越来越严格。另外一方面,数据分析及人工智能模型训练又往往需要大量的数据。如何能在保护数据隐私的前提下进行数据分析及人工智能模型训练成为当前计算机领域的一个非常重要的研究方向。

技术实现思路

[0003]提供了一种用于数据共享的方法、数据提供节点、数据使用节点、分布式系统以及计算机存储介质,能够在保护本地隐私数据的前提下,安全地进行非隐私数据的共享。
[0004]根据本公开的第一方面,提供了一种用于数据共享的方法。该方法包括:从包括隐私数据和第一非隐私数据的本地数据,获取隐私数据,第一非隐私数据与隐私数据相关联;生成隐私数据的哈希值;生成用于本地数据的本地标识符与哈希值之间的第一关联;生成用于在分布式系统中索引哈希值的全局标识符,分布式系统与当前节点相关联;生成全局标识符与哈希值之间的第二关联;以及向分布式系统中的其他节点发送第二关联,以在分布式系统中存储第二关联,以用于第一非隐私数据的连接共享。
[0005]根据本公开的第二方面,提供了一种用于数据共享的方法。该方法包括:基于分布式系统中存储的联合元数据,生成数据条件信息,联合元数据至少包括全局标识符和多项非隐私数据的多项属性信息之间的关联,全局标识符与隐私数据的哈希值相关联,隐私数据与多项非隐私数据相关联,多项非隐私数据位于分布式系统中的多个数据提供节点;向多个数据提供节点发送数据请求,数据请求包括数据条件信息;以及从多个数据提供节点中的至少一个数据提供节点接收与数据条件信息相匹配的至少一项非隐私数据。
[0006]根据本公开的第三方面,提供了一种数据提供节点。该数据提供节点包括:至少一个处理器,以及与至少一个处理器通信连接的存储器,其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行根据第一方面所述的方法。
[0007]根据本公开的第四方面,提供了一种数据使用节点。该数据使用节点包括:至少一个处理器,以及与至少一个处理器通信连接的存储器,其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行根据第二方面所述的方法。
[0008]根据本公开的第五方面,提供了一种分布式系统。该分布式系统包括:多个根据本公开的第三方面所述的数据提供节点数据提供节点;以及根据本公开的第四方面所述的数据使用节点。
[0009]在本公开的第六方面中,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现根据本公开的第一方面或第二方面所述的方法。
[0010]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0011]结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标注表示相同或相似的元素。
[0012]图1是根据本公开的实施例的分布式系统100的示意图。
[0013]图2是根据本公开的实施例的用于数据共享的方法200的示意图。
[0014]图3是根据本公开的实施例的用于数据共享的方法300的示意图。
[0015]图4是根据本公开的实施例的用于数据共享的方法400的示意图。
[0016]图5是根据本公开的实施例的用于数据共享的方法500的示意图。
[0017]图6是根据本公开的实施例的用于数据共享的方法600的示意图。
[0018]图7是根据本公开的实施例的用于数据共享的方法700的示意图。
[0019]图8是用来实现本公开实施例的用于数据共享的方法的电子设备的框图。
具体实施方式
[0020]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0021]在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
[0022]如上所述,在实际的数据分析及人工智能模型训练任务中,往往需要使用到不同节点或区域(包括个人、公司或国家)的数据。根据数据安全法,各个节点或区域的与个人身份相关的隐私数据是不能离开本节点或区域的。一般信息系统设计中,节点或区域中的本地数据可以通过本地标识码(LID,Local ID)进行查询和提取。每个LID往往用于唯一标识数据中不同的个体,包括但不局限于病人编号及客户编号等等。由于不同节点或区域的系统设计中LID的生成方法往往不一致,对于相同个体在不同的节点或区域的本地数据的LID往往是不同的。
[0023]此外,各个节点或区域之间由于数据隐私保护需求,无法直接共享所有的源数据。在数据分析和人工智能模型的训练中,往往希望将不同节点或区域的数据进行关联,从而提高数据分析和模型训练的数据覆盖度和结果准确度。如何能够在保护隐私数据的前提下,关联及共享不同区域的非隐私数据内容,来进行相关的数据分析及人工智能模型训练,是一个非常重要的问题。
[0024]为了至少部分地解决上述问题以及其他潜在问题中的一个或者多个,本公开的示例实施例提出了一种用于数据共享的方案。在该方案中,数据提供节点从包括隐私数据和第一非隐私数据的本地数据获取隐私数据,第一非隐私数据与隐私数据相关联。数据提供节点生成隐私数据的哈希值,以及生成用于本地数据的本地标识符与哈希值之间的第一关联。数据提供节点生成用于在分布式系统中索引哈希值的全局标识符,分布式系统与当前节点相关联,以及生成全局标识符与哈希值之间的第二关联。随后,数据提供节点向分布式系统中的其他节点发送第二关联,以在分布式系统中存储第二关联,以用于第一非隐私数据的连接共享。以此方式,能够通过本地存储的、本地数据的本地标识符与隐私数据的哈希值之间的第一关联以及在分布式系统中存储的、全局标识符与隐私数据的哈希值之间的第二关联,能够在保护本地隐私数据的前提下,安全地进行非隐私数据的共享。此外,在分布式系统中存储的全局标识符与隐私数据的哈希值之间的第二关联,也便于将分布式系统中的不同节点处的不本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于数据共享的方法,包括:从包括隐私数据和第一非隐私数据的本地数据获取所述隐私数据,所述第一非隐私数据与所述隐私数据相关联;生成所述隐私数据的哈希值;生成用于所述本地数据的本地标识符与所述哈希值之间的第一关联;生成用于在分布式系统中索引所述哈希值的全局标识符,所述分布式系统与当前节点相关联;生成所述全局标识符与所述哈希值之间的第二关联;以及向所述分布式系统中的其他节点发送所述第二关联,以在所述分布式系统中存储所述第二关联,以用于所述第一非隐私数据的连接共享。2.根据权利要求1所述的方法,还包括:从当前节点获取所述第一非隐私数据的第一属性信息;从所述分布式系统中的一个或多个另外数据提供节点获取一项或多项第二非隐私数据的一项或多项第二属性信息,所述一项或多项第二非隐私数据与所述隐私数据相关联;基于所述第二关联,生成联合元数据,所述联合元数据至少包括所述全局标识符、所述第一属性信息和所述一项或多项第二属性信息之间的关联;以及向所述分布式系统中的所述其他节点发送所述联合元数据,以在所述分布式系统中存储所述联合元数据,以用于所述第一非隐私数据和所述一项或多项第二非隐私数据的连接共享。3.根据权利要求2所述的方法,还包括:接收来自所述分布式系统中的数据使用节点的数据请求,所述数据请求包括数据条件信息,所述数据条件信息基于所述联合元数据而被生成;获取与所述数据条件信息相匹配的第一非隐私数据;以及向所述数据使用节点发送所获取的第一非隐私数据。4.根据权利要求3所述的方法,还包括:从所述一个或多个另外数据提供节点中的至少一个另外数据提供节点获取所述一项或多项第二非隐私数据中的至少一项第二非隐私数据的至少一项第二属性信息,所述至少一项第二非隐私数据与所述数据条件信息相匹配;基于所述第二关联,生成所述全局标识符、所述第一属性信息和所述至少一项第二属性信息之间的第三关联;以及向所述分布式系统中的其他节点发送所述第三关联,以在所述分布式系统中存储所述第三关联,以便于所述数据使用节点基于所述第三关联,将从当前节点获取的第一非隐私数据以及从所述至少一个另外数据提供节点获取的所述至少一项第二非隐私数据进行关联。5.根据权利要求3或4所述的方法,其中所述数据请求还包括所述数据使用节点的节点地址,以及获取与所述数据条件信息相匹配的第一非隐私数据包括:确定所述节点地址与预设节点地址是否匹配;以及如果确定所述节点地址与所述预设节点地址匹配,则获取与所述数据条件信息相匹配的第一非隐私数据。
6.根据权利要求3或4所述的方法,其中所述分布式系统包括区块链系统,以及接收来自数据使用节点的数据请求包括接收来自所述数据使用节点的第一智能合约,所述第一智能合约包括所述数据条件信息。7.根据权利要求6所述的方法,其中所述第一智能合约还包括用于数据共享的激励机制信息,以及获取与所述数据条件信息相匹配的第一非隐私数据包括:确定所述本地数据中是否存在与所述数据条件信息相匹配的第一非隐私数据;如果确定所述本地数据中存在与所述数据条件信息相匹配的第一非隐私数据,则确定所述激励机制信息是否通过评估;如果确定所述激励机制信息通过评估,则生成并在所述区块链系统中部署第二智能合约,所述第二智能合约包括所述数据条件信息、所述激励机制信息、所述数据使用节点的节点地址和数字钱包地址以及当前节点的节点地址和数字钱包地址;以及如果确定所述第二智能合约被部署在所述区块链系统中,则获取与所述数据条件信息相匹配的第一...

【专利技术属性】
技术研发人员:庞严
申请(专利权)人:重庆新国大研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1