一种基于契约理论的安全的数据共享激励方法技术

技术编号:19343190 阅读:23 留言:0更新日期:2018-11-07 14:16
本发明专利技术公开了一种基于契约理论的安全的数据共享激励方法,该方法采用差分隐私对数据持有者进行隐私保护,保证了数据源端的隐私安全性;引入竞争力作为数据共享的交易参数,使得数据持有者在共享数据后获得竞争力,即技术进步,消除了数据持有者的竞争力担忧;采用契约理论解决数据需求者和数据持有者之间的信息不对称,设计最佳契约使得数据参与者受益。为方便实施,本发明专利技术还公开了一种离散化的最佳契约设计方法。本发明专利技术能使数据共享参与者在保证隐私安全的基础上通过竞争力激励进行数据共享,达到数据持有者和数据需求者的双赢。

A secure data sharing incentive method based on contract theory

The invention discloses a secure data sharing incentive method based on contract theory, which uses differential privacy to protect the privacy of data holders, guarantees the privacy security of data source, and introduces competitiveness as the transaction parameter of data sharing, so that data holders can gain competitiveness after sharing data. That is, technological progress, eliminating the competitiveness concerns of data holders; using contract theory to solve the information asymmetry between data demanders and data holders, designing the best contract to benefit data participants. In order to facilitate implementation, the invention also discloses a discrete optimal contract design method. The invention enables data sharing participants to share data through competitive incentives on the basis of ensuring privacy and security, and achieves a win-win situation for data holders and data demanders.

【技术实现步骤摘要】
一种基于契约理论的安全的数据共享激励方法
本专利技术涉及数据共享的激励机制
,具体涉及具有竞争性关系的组织之间基于契约理论的安全的数据共享激励方法,运用本专利技术在数据共享中有利于保护隐私安全,避免了第三方隐私保护所带来的可能隐私风险。
技术介绍
随着大数据时代和人工智能时代的到来,以数据为基础的算法和技术蓬勃发展,催生出了众多基于数据驱动的服务,如推荐服务、语音识别、图像识别等,深刻地影响和变革着经济社会生活的方方面面。这些智能服务是组织机构通过收集数据和分析数据而提供的,其服务质量依赖于大量的高质量数据。然而,现实中并不是每个组织机构都能掌握大量数据,相反的,单个组织掌握的数据有限,更多的数据是通过收集和共享获得,进而提供多样化的智能服务。随着数据共享有效提升服务质量和改善人们生活水平,数据服务发展出现新态势,即从单个组织收集和处理数据发展到多个组织共享数据来提供服务。但是在数据共享的发展趋势下,组织机构也可能拒绝分享其数据,尤其是存在竞争关系的组织之间。其主要原因是竞争性组织之间存在竞争力担忧。其原因主要有以下两个方面:1)一方面是竞争性组织之间存在竞争力担忧。组织机构担心数据共享可能会改进竞争对手的服务质量,提升对手的竞争力,使对手在数据共享中受益。而本方却无法从中获益,反而可能因竞争对手的服务质量提升而造成自身用户流失,导致业务量下降,在日趋激烈的商业竞争中,这是本方不愿意看到的。例如,新药研发以及医疗相关的领域本应是数据共享和协作的重要领域,对治病救人,提升健康意义重大。但是由于利益的驱使,担心对手研发出下一代超级新药,很多医疗机构不愿意分享他们的数据。2)另一方面是数据共享的安全性不足,即隐私安全性得不到保证。在共享和使用数据的过程中,数据不可避免地暴露在外,造成隐私泄露的巨大风险,可能使组织机构因此蒙受损失。隐私安全事件频发,更加剧了人们对隐私安全的担忧。例如Netflix公司曾举办过一个预测算法的比赛,比赛要求在公开数据上推测用户的电影评分。Netflix把数据中唯一识别用户的信息抹去,认为就能保证用户的隐私。但是后来被人通过关联公开数据和IMDb(互联网电影数据库)网站上公开的纪录识别出匿名后用户的身份。最后导致Netflix不得不因为隐私原因宣布停止这项比赛,并因此受到高达九百万美元的罚款。现有激励机制研究多以主从合作式的数据收集为模型,竞争性组织机构之间的数据共享鲜有研究。在合作式数据收集中,数据需求者和数据持有者具有较强合作关系,这种数据共享的方法不符合具有竞争性关系组织之间的特点。针对隐私保护,学术界提出了多种保护隐私的方法和技术,例如匿名化、椭圆曲线加密算法、代理重加密、区块链和差分隐私等。虽然这些隐私保护方法在不同程度上保证了数据的安全性,但是过度的隐私保护会降低数据的价值。如何在隐私保护与数据价值之间达成一种权衡,既能保证用户的隐私安全又获得较高的数据价值仍然有待研究。因此,具有竞争关系的组织数据共享中,如何让参与者相信通过共享数据可以得到比不共享数据更好的结果,消除竞争力担忧,激励他们共享数据同时保证隐私安全,是目前需要本领域技术人员迫切解决的一个技术问题。
技术实现思路
为了解决现有技术的不足,本专利技术提供了一种基于契约理论的安全的数据共享激励方法,在数据持有者端采用差分隐私技术保护隐私安全,并引入竞争力作为数据共享的激励参数,由于数据需求者和数据持有者之间存在信息不对称,采用契约理论构建使得数据共享参与者都受益的长期承诺的最佳契约,从而在保证隐私安全的基础上,达成数据共享。为了实现上述目的,本专利技术的技术方案如下:一种基于契约理论的安全的数据共享激励方法,包括以下步骤:1)在数据持有者端引入差分隐私技术,作为隐私安全保护机制;2)构建数据共享网络,并引入竞争力作为数据共享交易的激励参数,建立数据需求者和数据持有者的效用函数;3)基于数据共享网络,将数据需求者和数据持有者映射成契约双方,采用契约理论解决数据需求者和数据持有者之间的信息不对称问题;4)基于步骤3)设计得到最佳契约,并基于最佳契约实施安全数据共享激励机制,达成数据共享效用目标。进一步的,所述步骤1)中,设有随机算法M,PM为M所有可能的输出构成的集合,对于任意两个邻近数据集D和D'以及PM的任何子集SM,若算法M满足Pr[M(D)∈SM]≤exp(ε)×Pr[M(D')∈SM]则称算法M提供ε-差分隐私保护,其中参数ε称为隐私保护预算,隐私保护预算表示隐私的保护程度,ε越小隐私保护程度越高。进一步的,所述步骤2)中,数据共享交易为具有竞争性关系的两者之间的数据和竞争力的交易,即数据持有者共享数据给数据需求者,并从数据需求者处获得竞争力。进一步的,所述步骤2)中,竞争力具有如下特征:(1)竞争力是数据共享和数据处理后的技术进步能力;(2)数据的竞争力由竞争力因子度量,即若数据持有者掌握数据q,则其潜在竞争力为γq,其中γ为竞争力因子;(3)数据的竞争力因子受数据市场供求关系影响,即相同的数据,在数据短缺的时候具有更高的竞争力因子,进而拥有更高的效用。进一步的,所述步骤2)中,数据需求者从数据持有者处得到数据q,由于数据q经过差分隐私技术处理,因此其价值量G为:G=ωlog(1+αεq)其中,ω是数据价值权重值,α是数据效用参数,ε是差分隐私参数,数据需求者获得数据,需支付竞争力给数据提供者,因此,数据需求者的效用函数为:UD(ε)=G-γ=ωlog(1+αεq)-γ其中γ是数据需求者为数据q支付的竞争力因子。进一步的,对于有N个数据持有者参与共享的共享网络中,数据持有者的差分隐私参数其概率分布函数为f(ε),则数据需求者的总体效用函数为:其中,所述数据持有者的具体差分隐私参数ε对数据需求者是不可知的,概率分布f(ε)为已知。进一步的,所述步骤2)中,数据持有者在共享数据中经过差分隐私技术处理分享数据q,并获得竞争力补偿,因此,数据持有者的效用函数为:u=γ-cεq其中γ是获得的竞争力,c为损失系数,ε是差分隐私参数,q是分享的数据。进一步的,所述步骤3)中,采用契约理论解决信息不对称的具体过程包括:3-1)建立契约模型{(γ(ε),q(ε))},其中(γ(ε),q(ε))是数据需求者为具有隐私参数ε的数据持有者设计的契约;3-2)将契约(γ(ε),q(ε))带入数据持有者的效用函数中,得到契约条件下,具有隐私参数ε的数据持有者的效用函数;3-3)采用激励相容约束和个体理性约束构建契约成立条件;3-4)根据契约成立条件优化数据需求者的总体效用函数。进一步的,所述步骤4)中,最佳契约的设计具体包括:4-1)简化激励相容约束条件和个体理性约束条件;4-2)根据简化后的约束条件简化优化后的数据需求者的总体效用函数;4-3)采用庞特里亚金最大值原理对简化后总体效用函数进行求解,通过汉密尔顿函数获得最佳契约的数据函数和竞争力函数。进一步的,所述步骤4)中,基于最佳契约的安全数据共享激励机制的实施步骤包括:4-1)数据需求者发出数据共享需求,并计算最佳的契约{(γ*(ε),q*(ε))};4-2)数据需求者广播该组契约{(γ*(ε),q*(ε))}到各数据持有者;4-3)数据持有者收到契约后,选择最大化自身效益的本文档来自技高网
...

【技术保护点】
1.一种基于契约理论的安全的数据共享激励方法,其特征在于,包括以下步骤:1)在数据持有者端引入差分隐私技术,作为隐私安全保护机制;2)构建数据共享网络,并引入竞争力作为数据共享交易的激励参数,建立数据需求者和数据持有者的效用函数;3)基于数据共享网络,将数据需求者和数据持有者映射成契约双方,采用契约理论解决数据需求者和数据持有者之间的信息不对称问题;4)基于步骤3)设计得到最佳契约,并基于最佳契约实施安全数据共享激励机制,达成数据共享效用目标。

【技术特征摘要】
1.一种基于契约理论的安全的数据共享激励方法,其特征在于,包括以下步骤:1)在数据持有者端引入差分隐私技术,作为隐私安全保护机制;2)构建数据共享网络,并引入竞争力作为数据共享交易的激励参数,建立数据需求者和数据持有者的效用函数;3)基于数据共享网络,将数据需求者和数据持有者映射成契约双方,采用契约理论解决数据需求者和数据持有者之间的信息不对称问题;4)基于步骤3)设计得到最佳契约,并基于最佳契约实施安全数据共享激励机制,达成数据共享效用目标。2.如权利要求1所述的一种基于契约理论的安全的数据共享激励方法,其特征在于,所述步骤1)中,设有随机算法M,PM为M所有可能的输出构成的集合,对于任意两个邻近数据集D和D'以及PM的任何子集SM,若算法M满足Pr[M(D)∈SM]≤exp(ε)×Pr[M(D')∈SM]则称算法M提供ε-差分隐私保护,其中参数ε称为隐私保护预算,隐私保护预算表示隐私的保护程度,ε越小隐私保护程度越高。3.如权利要求1所述的一种基于契约理论的安全的数据共享激励方法,其特征在于,所述步骤2)中,数据共享交易为具有竞争性关系的两者之间的数据和竞争力的交易,即数据持有者共享数据给数据需求者,并从数据需求者处获得竞争力。4.如权利要求1所述的一种基于契约理论的安全的数据共享激励方法,其特征在于,所述步骤2)中,竞争力具有如下特征:(1)竞争力是数据共享和数据处理后的技术进步能力;(2)数据的竞争力由竞争力因子度量;(3)数据的竞争力因子受数据市场供求关系影响。5.如权利要求1所述的一种基于契约理论的安全的数据共享激励方法,其特征在于,所述步骤2)中,数据需求者从数据持有者处得到数据q,由于数据q经过差分隐私技术处理,因此其价值量G为:G=ωlog(1+αεq)其中,ω是数据价值权重值,α是数据效用参数,ε是差分隐私参数,数据需求者获得数据,需支付竞争力给数据提供者,因此,数据需求者的效用函数为:UD(ε)=G-γ=ωlog(1+αεq)-γ其中γ是数据需求者为数据q支付的竞争力因子。6.如权利要求5所述的一种基于契约理论的安全的数据共享激励方法,其...

【专利技术属性】
技术研发人员:郭秉义田杰邓小芳
申请(专利权)人:山东师范大学
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1