当前位置: 首页 > 专利查询>海南大学专利>正文

跨数据、信息、知识模态的用户差异隐私保护方法技术

技术编号:27263917 阅读:33 留言:0更新日期:2021-02-06 11:26
本发明专利技术提供一种跨数据、信息、知识模态的用户差异隐私保护方法,包括以下步骤:S1、获取目标数据资源,判断目标数据资源是否关联特定用户;S2、在目标数据资源关联特定用户时,将所有与目标数据资源关联的数据资源识别为内涵数据资源或外延数据资源;S3、基于内涵数据资源和外延数据资源的属性和对应的属性值判断其是否属于隐私数据资源;S4、在数据请求方请求获取隐私数据资源时,对隐私数据资源执行隐私保护操作。本发明专利技术可以实现对隐式数据资源的保护,降低用户隐私泄露风险。降低用户隐私泄露风险。降低用户隐私泄露风险。

【技术实现步骤摘要】
跨数据、信息、知识模态的用户差异隐私保护方法


[0001]本专利技术涉及数据保护
,尤其涉及一种跨数据、信息、知识模态的用户差异隐私保护方法。

技术介绍

[0002]随着互联网的广泛普及和大数据时代的来临,产生了具有巨大商业价值和社会价值的各种资源,人们可以从这些资源中获得巨大好处,但随着累积内容量的增加,人们越来越需要努力处理相应的内容,以达到各种目的,包括共享内容资源和相应的隐私保护。与此同时,这些资源中可能存在大量敏感内容,包括重要的个人隐私数据和信息,例如,各大医院收集的患者身体健康情况数据、使用全球定位系统协议应用程序收集的用户位置信息等,这些敏感资源本身以及利用相关资源进行关联融合后形成的新敏感资源可能会随着更加隐蔽、多样的数据收集存储以及数据挖掘,导致更加频繁的隐私泄露和隐私窃取,从而产生更加巨大的危害和影响,引发了人们对隐私的广泛关注和担忧。现有的隐私保护方法主要是针对数据集上可直接观察到的数值型、字符型等类型数据进行各种处理,使得处理后的数据不能直接显示原数据的具体内容,以此达到保护隐私的目的。但是这些方案也存在很多不足,包括这些方案只对显式资源进行处理,未对隐式的,即不能直接观察到的资源进行保护,存在隐私泄露风险等问题。

技术实现思路

[0003]鉴于此,本专利技术的目的在于提供一种跨数据、信息、知识模态的用户差异隐私保护方法,以克服或至少部分解决现有技术所存在的以上问题。
[0004]一种跨数据、信息、知识模态的用户差异隐私保护方法,包括以下步骤:
[0005]S1、获取目标数据资源,判断目标数据资源是否关联特定用户;
[0006]S2、在目标数据资源关联特定用户时,将所有与目标数据资源关联的数据资源识别为内涵数据资源或外延数据资源;
[0007]S3、基于内涵数据资源和外延数据资源的属性和对应的属性值判断其是否属于隐私数据资源;
[0008]S4、在数据请求方请求获取隐私数据资源时,对隐私数据资源执行隐私保护操作。
[0009]进一步的,所述内涵数据资源用于反映目标数据资源的特有属性及其对应属性值,所述属性包括特征和功能。
[0010]进一步的,所述将所有与目标数据资源关联的数据资源识别为内涵数据资源,具体包括:
[0011]判断与目标数据资源关联的数据资源是否包含对目标数据资源属性的说明,若包含则识别为内涵数据资源;
[0012]对与目标数据资源关联的数据资源的重复次数进行统计,将重复次数超出预设阈值的数据资源识别为内涵数据资源。
[0013]进一步的,所述外延数据资源包括具有目标数据资源所反映的特有属性的其他目标实体、反映目标数据资源本身或其适用范围的数据资源、与目标数据资源相关联或目标数据资源所反映的特有属性的相关统计值数据资源中的一种或多种。
[0014]进一步的,所述步骤S3具体包括:
[0015]S31、设定内涵数据资源的部分属性及其对应属性值为目标数据资源的特有隐私属性,另一部分属性及其对应属性值为目标数据资源的特有非隐私属性;
[0016]S32、根据外延数据资源与特有隐私属性的关联关系判断其是否为隐私数据资源。
[0017]进一步的,所述步骤S4前还包括:分别计算并根据各个内涵数据资源和外延数据资源的提供支持度判断其是否属于隐私数据资源。
[0018]进一步的,所述分别计算并根据各个内涵数据资源和外延数据资源提供的总支持度判断其是否属于隐私数据资源,具体包括:
[0019]S401、输入与目标数据资源关联的所有不同内涵数据资源和外延数据资源;
[0020]S402、对归属于内涵数据资源的不同属性Data
Coni
进行分配来源分析,i∈[1,n],n为归属于内涵数据资源的不同属性总数,将内涵数据资源中作为属性的数据资源记为Attr1,将重复出现次数超过第一预设阈值的属性记为Attr2,将具有对应属性值的属性记为Attr3;
[0021]S403、对归属于内涵数据资源中的每个属性分别确定权重值,表达式为:
[0022]Degree
Support
(Data
Coni
)=α
·
f(Data
Coni
)+β
·
g(Data
Coni
)+γ
·
h(Data
Coni
)
[0023]其中,α+β=1,α、β和γ分别表示对应种类为Attr1、Attr2、Attr3的属性对描述目标数据资源所能提供的支持权重;
[0024]S403、对所有的Data
Coni
进行计算获得对应的提供支持度,所述计算表达式如下:
[0025][0026][0027][0028]其中,frequency(Data
Coni
)表示Data
Coni
重复出现的次数,ratio(Data
Coni
)表示与Data
Coni
的具体属性值相同的目标数据资源个数与目标数据资源总数之比;
[0029]S404、对归属于外延数据资源中的不同内容Data
Exj
进行提供支持度计算,j∈[1,m],m为归属于外延数据资源的不同内容总数,获得所有Data
Exj
的提供支持度,计算公式如下:
[0030]Degree
Support
(Data
Exj
)=β
·
frequency(Data
Exj
)
[0031]其中frequency(Data
Exj
)表示Data
Exj
重复出现的次数。
[0032]S405、基于Data
Coni
和Data
Exj
的提供支持度进行判断,对于提供支持度高于第二预
设阈值的内涵数据资源或外延数据资源判断其属于隐私数据资源。
[0033]进一步的,所述隐私保护操作包括:
[0034]当数据请求方请求获取隐私数据资源为数值型数据时,在获取结果中加入噪声数据;
[0035]当数据请求方请求获取隐私数据资源为非数值型数据时,在获取结果中通过指数分布调整概率的方法保护隐私数据内容。
[0036]与现有技术相比,本专利技术的有益效果是:
[0037]本专利技术所提供的一种跨数据、信息、知识模态的用户差异隐私保护方法,对于与特定用户相关联的目标数据资源,可通过将其识别为内涵数据资源和外延数据资源,据其属性和对应的属性值判断其是否属于隐私数据资源,在数据请求方请求获取隐私数据资源时,对隐私数据资源执行隐私保护操作,从而实现对隐式资源的保护,降低用户隐私泄露风险。
附图说明
[0038]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种跨数据、信息、知识模态的用户差异隐私保护方法,其特征在于,所述方法包括以下步骤:S1、获取目标数据资源,判断目标数据资源是否关联特定用户;S2、在目标数据资源关联特定用户时,将所有与目标数据资源关联的数据资源识别为内涵数据资源或外延数据资源;S3、基于内涵数据资源和外延数据资源的属性和对应的属性值判断其是否属于隐私数据资源;S4、在数据请求方请求获取隐私数据资源时,对隐私数据资源执行隐私保护操作。2.根据权利要求1所述的一种跨数据、信息、知识模态的用户差异隐私保护方法,其特征在于,所述内涵数据资源用于反映目标数据资源的特有属性及其对应属性值,所述属性包括特征和功能。3.根据权利要求2所述的一种跨数据、信息、知识模态的用户差异隐私保护方法,其特征在于,所述将所有与目标数据资源关联的数据资源识别为内涵数据资源,具体包括:判断与目标数据资源关联的数据资源是否包含对目标数据资源属性的说明,若包含则识别为内涵数据资源;对与目标数据资源关联的数据资源的重复次数进行统计,将重复次数超出预设阈值的数据资源识别为内涵数据资源。4.根据权利要求1所述的一种跨数据、信息、知识模态的用户差异隐私保护方法,其特征在于,所述外延数据资源包括具有目标数据资源所反映的特有属性的其他目标实体、反映目标数据资源本身或其适用范围的数据资源、与目标数据资源相关联或目标数据资源所反映的特有属性的相关统计值数据资源中的一种或多种。5.根据权利要求4所述的一种跨数据、信息、知识模态的用户差异隐私保护方法,其特征在于,所述步骤S3具体包括:S31、设定内涵数据资源的部分属性及其对应属性值为目标数据资源的特有隐私属性,另一部分属性及其对应属性值为目标数据资源的特有非隐私属性;S32、根据外延数据资源与特有隐私属性的关联关系判断其是否为隐私数据资源。6.根据权利要求1所述的一种跨数据、信息、知识模态的用户差异隐私保护方法,其特征在于,所述步骤S4前还包括:分别计算并根据各个内涵数据资源和外延数据资源的提供支持度判断其是否属于隐私数据资源。7.根据权利要求6所述的一种跨数据、信息、知识模态的用户差异隐私保护方法,其特征在于,所述分别计算并根据各个内涵数据资源和外延数据资源提供的总支持度判断其是否属于隐私数据资源,具体包括:S401、输入与目标数据资源关联的所有不同内涵数据资源和外延数据资源;S402、对归属于内涵数据资源的不同属性Data
Coni
进行分配来源分析,i∈[1,n],n为归属于内涵数据资源的不同属性总数,将内涵数据资源中作为属性的数据资源记为Attr1,将重复出现次数超过第一预...

【专利技术属性】
技术研发人员:段玉聪
申请(专利权)人:海南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1