一种具有个性化隐私保护功能的负调查方法技术

技术编号:20485966 阅读:44 留言:0更新日期:2019-03-02 19:24
本发明专利技术针对负调查过程中被调查者无法自由选择隐私受保护程度的问题,提出了一种具有个性化隐私保护功能的负调查方法。该方法在传统负调查的基础上采用了不定项负调查收集、处理数据,能够让用户自由选择信息的准确度以及隐私受保护程度,有效抵抗网络窃听攻击并还原出可靠的数据。本发明专利技术适用于日常生活中问卷调查、位置信息保护等方面。

【技术实现步骤摘要】
一种具有个性化隐私保护功能的负调查方法一、
本专利技术属于信息安全领域,具体涉及一种具有个性化隐私保护功能的负调查方法。二、
技术介绍
在传统的调查方法中,被调查者需要根据问题选择符合实际情况的选项。不过,调查问题的结果可能涉及到被调查者的隐私信息,比如收入,健康状况等。近年来,负调查被提出,以实现保护被调查者的隐私。在负调查中,被调查者不需要选择真实的选项(称为正选项),只需要选择不符合实际情况的选项(称为负选项)。比如,调查问题“你的月收入是多少元?”选项包括:“A.三千以下;B.三千到五千;C.五千到一万;D.一万以上”,被调查者甲某的真实情况是B,那么在负调查中甲某只需要从“A,C,D”随机选择一个提交。调查者根据甲某提交的内容,可以知道甲某的真实情况是其未提交的三种情况之一,每种情况的概率是1/3。因此调查者无法准确了解到甲某的真实信息,从而保护了甲某的隐私。负调查同时也为调查者提供了估算方法,能够根据多个被调查者提交的负选项,较为精确地估算出真实情况下每个选项被选择的比例。现有的负调查方法已经可以获得无偏的估算结果,估算的误差很小。然而,在现实生活中,每个被调查者的隐私保护需求往往不一样,有些被调查者的隐私保护要求高,有些被调查者的隐私保护要求低。比如,被调查者甲某比较注重隐私保护,只愿意提交一个负选项给调查者;而被调查者乙某对隐私保护要求不高,愿意提交两个负选项。部分被调查者提交多个负选项有利于调查者提高估算的精度,然而现有的负调查方案并没有考虑每个被调查者提交的负选项个数不同的情况,无法支持每个被调查者根据自身的个性化隐私保护要求提交不同个数负选项,即不能支持被调查者的个性化隐私保护需求。三、
技术实现思路
1、专利技术目的本专利技术针对负调查过程中被调查者无法自由选择隐私受保护程度的问题,提供了一种具有个性化隐私保护功能的负调查方法。在进行调查时,被调查者可以自由选择j(1≤j≤C-2,其中C为总选项个数)个负选项进行提交,对应的j值越大,则信息准确度越高,隐私保护程度越小;对应的j值越小,则信息准确度越低,隐私保护程度越大。j的值取决于被调查者保护自己隐私的具体需求,由被调查者自由决定。本专利技术的目的是解决在负调查过程中,被调查者无法自由权衡隐私受保护程度的问题。为此本专利技术提供了一种具有个性化隐私保护功能的负调查方法。此方法相对前人的方法不再对每个被调查者选择选项的个数做出严格限制,因而能自由适应不同人群的不同隐私保护需求。2、技术方案本专利技术的目的通过以下技术方案来实现:2.1.参数约定一种具有个性化隐私保护功能的负调查方法,其参数约定如下:假设:N为总人数C为选项个数。Pi是正调查中选第i项的人数。λj是负调查中每个人选j个选项的概率。Rij是负调查在选j个选项的条件下中选第i项的人数。pi是正调查中选第i项的人数占总人数的比例。所述方法包括以下步骤2.2.步骤一、收集数据:有N个人参与调查,他们分别是x1,x2,x3,...,xN。共有C个选项,它们分别是y1,y2,y3,...,yC。2.2.1.(1)被调查者xk(1≤k≤N)可以从集合{y1,Y2,Y3,...,yC}中任意选择j(1≤j≤C-2)个负选项并临时记录其选项编号为i1,i2,...,ij,将数据提交到服务器。2.2.2(2)然后更新二维数组R[C][C-2](该二维数组初始置为全零数组),具体做法为将R[i1][j],R[i2][j],...,R[ij][j]的值全部加一,全部被调查者提交完毕后形成二维数组Rij。2.3.步骤二、数据处理:由公式计算出即正调查中选第i(1≤i≤C)项的人数占总人数的比例。其中Rij即为二维数组R[i][j]的值。2.4理论证明:一种具有个性化隐私保护功能的负调查方法正确性证明如下:可以看出:所以由(2)式得由于任意一位被调查者在正调查中选那个选项和他负调查中选几个选项无关。由(1)式得可算出所以可配出表达式为保证每个被调查者的选择对最终结果的影响是均等的从而最终结果为可以看出,当λk=100%时,该式退化为K选定项负调查方差(1<K<C-1)。2.5优越性:相对于传统负调查,具有个性化隐私保护功能的负调查方法的优点在于:本专利技术为负调查提供个性化解决方案,为每个被调查者提供自由的隐私保护程度,同时保证了数据准确程度,能够适应不同人群的需求。四、附图说明下面结合附图及实施例对本专利技术作进一步描述:图1为本专利技术一种具有个性化隐私保护功能的负调查方法的流程图五、具体实施方式以下结合具体实例对上述方案做进一步说明。应理解,这些实施例是用于说明本专利技术而不限于限制本专利技术的范围。基于本专利技术的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术的保护范围。本专利技术采用Java编写实验代码,模拟不定项负调查的实验,并将实验结果与原始数据进行对比。本专利技术通过随机数的方法模拟客户端,正选项根据不同概率分布随机生成,包含均匀分布、二项分布、泊松分布,不定项中选择的负选项个数也根据不同概率分布随机生成,包含均匀分布和正态分布。本实验具体实施步骤如下:设置选项个数为10个,重复试验次数为50次。每次实验随机生成指定分布的正调查选项,对于不定项负调查,随机生成指定分布的负选项个数,一共生成6组不同分布组合的数据。通过本专利技术理论研究所得公式计算分别计算每个正选项的分布情况。实验结果如表1~6:表1均匀分布一均匀分布的不定项负调查选项的真实分布和估计分布对比选项一二三四五真实分布9.98%9.96%9.99%10.04%10.00%估计分布9.95%9.82%10.35%10.28%9.72%选项六七八九十真实分布10.01%10.05%9.93%9.98%10.05%估计分布9.99%9.88%9.99%9.98%10.03%表2均匀分布-正态分布的不定项负调查选项的真实分布和估计分布对比选项一二三四五真实分布9.97%10.03%10.01%10.03%10.02%估计分布9.93%10.30%9.94%10.10%9.88%选项六七八九十真实分布10.02%9.94%10.04%9.96%9.98%估计分布9.91%9.91%9.98%9.95%10.10%表3二项分布-均匀分布的不定项负调查选项的真实分布和估计分布对比选项一二三四五真实分布0.09%0.10%4.41%11.75%20.53%估计分布0.06%0.92%4.32%11.86%20.59%选项六七八九十真实分布24.62%20.50%11.72%4.40%0.99%估计分布24.30%20.63%11.65%4.60%1.07%表4二项分布-正态分布的不定项负调查选项的真实分布和估计分布对比选项一二三四五真实分布0.10%0.98%4.42%11.75%20.52%估计分布0.28%0.98%4.34%11.74%20.61%选项六七八九十真实分布24.60%20.52%11.71%4.44%0.97%估计分布24.68%20.49%11.55%4.44%0.89%表5泊松分布-均匀分布的不定项负调查选项的真实分布和估计分布对比选项一二三四五真实分布15.71%23.68%23.52%17.66%10.63%估本文档来自技高网
...

【技术保护点】
1.一种基于负调查的隐私保护方法,用于服务器端在调查总体数据时对被调查者的真实数据进行个性化保护,其特征在于所述方法包括以下步骤:(1)服务器端生成包含C个选项的问卷发送给被调查者;(2)被调查者提交1到C‑2个负选项给服务器端;(3)服务器端统计选j个选项的条件下中选第i项的人数Rij;(4)服务器端通过C、Rij估算出整体正调查概率分布,得到总体数据。

【技术特征摘要】
1.一种基于负调查的隐私保护方法,用于服务器端在调查总体数据时对被调查者的真实数据进行个性化保护,其特征在于所述方法包括以下步骤:(1)服务器端生成包含C个选项的问卷发送给被调查者;(2)被调查者提交1到C-2个负选项给服务器端;(3)服务器端统计选j个选项的条件下中选第i项的人数Rij;(4)服务器端通过C、Rij估算出整体正调查概率分布,得到总体数据。2.根据权利要求1所述的方法,其特征在于所述方法具体按照如下步骤执行:(a)服务器端生成包含C个选项(y1,y2,y3,...,yc)的问卷并发送,被调查者接收问卷。(b)被调查者xi在选项集合{y1,y2,y3,...,yc}中任意选择j(1...

【专利技术属性】
技术研发人员:朱友文刘鼎铭李佳慧
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1