当前位置: 首页 > 专利查询>重庆大学专利>正文

一种基于差异化隐私泄露风险的数据商品动态定价方法技术

技术编号:38713120 阅读:11 留言:0更新日期:2023-09-08 14:55
本发明专利技术涉及一种基于差异化隐私泄露风险的数据商品动态定价方法,属于数据共享领域,包括以下步骤:S1:构造数据属性矩阵,数据所有者使用本地化差分隐私对属性数据进行扰动,并上传至中心节点计算条件概率;S2:数据所有者分析数据之间的隐私关联,基于信息熵理论计算自定义隐私泄露风险动态概率;S3:基于隐私泄露风险动态评估系数设计定价策略,结合无套利等定价基础理论定价。本发明专利技术解决了在数据交易过程中不同的交易方式导致的动态隐私泄露问题,并利用无套利定价原则,对数据商品进行合理定价。理定价。理定价。

【技术实现步骤摘要】
一种基于差异化隐私泄露风险的数据商品动态定价方法


[0001]本专利技术属于数据共享领域,涉及一种基于差异化隐私泄露风险的数据商品动态定价方法。

技术介绍

[0002]当今社会,个人数据作为包含用户隐私信息的一种重要资产,已被广泛应用于征信系统、商品推荐、健康评估等领域,具有巨大的商业价值。这使得个人数据逐渐成为一种可交易的商品,对于想要利用这些数据来进行分析并提供商业服务的企业来说,个人数据具有重要价值,可以提高企业的竞争力。然而,大多数企业很难合法地获取足够的个人数据,因此需要向数据交易平台购买满足其需求的个人数据。
[0003]尽管企业渴望利用个人数据进行研究和商业活动,但这些数据都来自于数据拥有者,反映了每个人的独特属性和身份。因此,作为数据拥有者的企业或个人会考虑到提供个人数据给企业的隐私风险和利益等问题。这导致获取个人数据变得十分困难,即使企业向数据拥有者提供免费服务,数据拥有者也不愿意免费提供数据。在这种供需关系下,个人数据交易的概念应运而生。个人数据交易是指数据拥有者将数据出售给其他企业或个人获得报酬的过程。其可以为数据拥有者带来经济利益,同时也能够为数据买方提供更精准的服务和产品。
[0004]数据定价是个人数据交易的重要组成部分,即为数据确定一个价格。将数据视为一种可以自由交易的商品可以提高数据的市场流动性,从而创造更大的价值。在数据定价过程中,除了需要考虑交易双方的收益最大化和公平等问题,还需要考虑个人数据拥有方隐私泄露风险的问题。个人数据并不是相互独立的数据,存在属性关联。在不同的交易方式下,对于数据拥有者造成的隐私泄露风险程度也不同。例如,如果数据拥有者拥有多份属性数据,考虑两种售卖方式,一种是将其中两份数据售卖给同一个数据买家,另一种是将这两份数据分别出售给不同的两个买家。由于数据之间存在属性关联,数据买家购买的数据越多,拥有的背景知识越多,也就越容易推断出数据拥有者尚未出售的数据,这两种售卖方式对数据拥有者造成的隐私泄露风险程度也不同。因此,在数据定价过程中,需要考虑数据拥有者的心理价位和隐私泄露风险,对未出售数据进行动态的差异化定价是数据定价过程中的一个重要挑战。
[0005]目前的研究更关注于数据本身的隐私问题,例如通过差分隐私的方法对数据进行隐私保护,并根据隐私损失对数据所有者进行价格补偿。然而,这些研究并没有考虑到在数据出售过程中隐私泄露风险的动态变化问题。

技术实现思路

[0006]有鉴于此,本专利技术的目的在于提供一种基于隐私泄露风险的差异化数据商品动态定价机制。设计个人数据隐私泄露风险动态评估方法,分析数据之间的隐私关联等因素,结合信息熵、条件熵、互信息等理论,构建自定义隐私泄露风险动态概率;对多个数据集进行
采样,从而收集数据进行属性之间条件概率的计算,使用本地化差分隐私技术保护数据;结合无套利原则等定价理论以及隐私风险泄露概率,设计差异化动态定价方式以出售数据。
[0007]为达到上述目的,本专利技术提供如下技术方案:
[0008]一种基于差异化隐私泄露风险的数据商品动态定价方法,包括以下步骤:
[0009]S1:构造数据属性矩阵,数据所有者使用本地化差分隐私对属性数据进行扰动,并上传至中心节点计算条件概率;
[0010]S2:数据所有者分析数据之间的隐私关联,基于信息熵理论计算自定义隐私泄露风险动态概率;
[0011]S3:基于隐私泄露风险动态评估系数设计定价策略,结合无套利等定价基础理论定价。
[0012]进一步,步骤S1具体包括以下步骤:
[0013]S11:设存在N个数据拥有者用户,X={X1,X2,...,X
N
},表示N个数据拥有者所拥有的数据集合,X
i
表示来自第i个数据拥有者用户的数据记录;数据拥有者的每条数据记录具有d维属性,设d维属性A={A1,A2,...,A
d
},其中每个数据记录X
i
表示为其中表示第i个数据拥有者的第j个属性的记录;对于某一个用户的一条记录的属性集合A
j
,j=1,2,...,d,设置每个属性的值域其中表示一个属性中的一个变量,|Ω
j
|表示该属性中能取的变量个数;
[0014]S12:对数据拥有者的数据进行本地化差分隐私;设第i个数据拥有者拥有的数据为对其中的进行编码:
[0015][0016]其中,构造一个编码长度m
j
=|Ω
j
|的零向量B,编码的方式是将对应的位置设置为1,其他位为0;随后对其中每一位进行扰动,扰动概率如下:
[0017][0018]其中,给定p和q,以概率p和q对编码向量中的每一位进行随机响应扰动,该扰动方法满足于ε

LDP:
[0019][0020]S13:数据拥有者X
i
将每个属性的编码扰动后进行合并,形成一个长度为的向量,即编码扰动后的数据,中心节点随后收集多个数据拥有者的数据并使用LASSO回归方法来推导数据属性的联合分布概率。
[0021]进一步,步骤S13所述使用LASSO回归方法来推导数据属性的联合分布概率,具体包括:
[0022]首先构建候选矩阵M
t
×
r
,表示d维属性编码后的位长,表
示候选值的总数,将d维属性联合分布为一个向量P=(p1,p2,...,p
r
);将编码扰动后的每一位求和并校正,得到计数向量C=(c1,c2,...,c
t
),联合分布估计通过LASSO得到:
[0023]P=LASSO regression(M,C
T
)
[0024]将扰动后的编码生成一个近似与原始属性数据的分布:
[0025][0026]P
X
(A1,A2...A
d
)被定义为i∈{1,2,...,N},ω1∈Ω1,...,ω
d
∈Ω
d
,ω
j
表示在一个属性域中的具体的属性值,通过联合分布结合属性的边缘分布得到条件概率。
[0027]进一步,步骤S2具体包括以下步骤:
[0028]S21:假设一个n
×
d属性数据集T,n表示数据集中的个体用户数量,d表示属性的数量,表示第i个用户的第j个属性,其中i∈{1,2,...,n},j∈{1,2,...,d};数据商品集合为X={x1,x2,...,x
d
},其中x
i
表示结合中的第i个属性集合;
[0029]S22:利用信息熵理论构建待交易属性数据集的自信息:
[0030][0031]其中p(x
i
)表示属性值在属性域中的出现概率;H(X)描述为待出售属性数据的不确定程度,H(X)越大,数据的不确定程度越高,隐私风险泄露程度越小;
[0032]S23本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于差异化隐私泄露风险的数据商品动态定价方法,其特征在于:包括以下步骤:S1:构造数据属性矩阵,数据所有者使用本地化差分隐私对属性数据进行扰动,并上传至中心节点计算条件概率;S2:数据所有者分析数据之间的隐私关联,基于信息熵理论计算自定义隐私泄露风险动态概率;S3:基于隐私泄露风险动态评估系数设计定价策略,结合无套利等定价基础理论定价。2.根据权利要求1所述的基于差异化隐私泄露风险的数据商品动态定价方法,其特征在于:步骤S1具体包括以下步骤:S11:设存在N个数据拥有者用户,X={X1,X2,...,X
N
},表示N个数据拥有者所拥有的数据集合,X
i
表示来自第i个数据拥有者用户的数据记录;数据拥有者的每条数据记录具有d维属性,设d维属性A={A1,A2,...,A
d
},其中每个数据记录X
i
表示为其中表示第i个数据拥有者的第j个属性的记录;对于某一个用户的一条记录的属性集合A
j
,j=1,2,...,d,设置每个属性的值域其中表示一个属性中的一个变量,|Ω
j
|表示该属性中能取的变量个数;S12:对数据拥有者的数据进行本地化差分隐私;设第i个数据拥有者拥有的数据为对其中的进行编码:其中,构造一个编码长度m
j
=|Ω
j
|的零向量B,编码的方式是将对应的位置设置为1,其他位为0;随后对其中每一位进行扰动,扰动概率如下:其中,给定p和q,以概率p和q对编码向量中的每一位进行随机响应扰动,该扰动方法满足于ε

LDP:S13:数据拥有者X
i
将每个属性的编码扰动后进行合并,形成一个长度为的向量,即编码扰动后的数据,中心节点随后收集多个数据拥有者的数据并使用LSAAO回归方法来推导数据属性的联合分布概率。3.根据权利要求2所述的基于差异化隐私泄露风险的数据商品动态定价方法,其特征在于:步骤S13所述使用LASSO回归方法来推导数据属性的联合分布概率,具体包括:首先构建候选矩阵M
t
×
r
,表示d维属性编码后的位长,表示候选值的总数,将d维属性联合分布为一个向量P=(p1,p2,...,p
r
);将编码扰动后的每一位求和并校正,得到计数向量C=(c1,c2,...,c
t
),联合分布估计通过LASSO得到:P=LASSO regression(M,C
T
)
将扰动后的编码生成一个近似与原始属性数据的分布:P
X
...

【专利技术属性】
技术研发人员:穆南锟杨屏藩雷新雨孙翠黄宏宇
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1