一种群组隐私信息发现方法及系统技术方案

技术编号:22817428 阅读:25 留言:0更新日期:2019-12-14 13:16
本发明专利技术提供一种群组隐私信息发现方法及系统,基于中继服务器对隐私信息进行保护,在不牺牲聚类质量的前提下,通过中继服务器对用户上传的信息进行DP聚类,同时保护用户上传的敏感信息。其中,聚类操作将从用户的移动设备转移到中继服务器进行,允许用户在提交需求后可以离线,同时避免迭代计算,提升计算效率。根据聚类结果,在满足用户需求的前提下对结果进一步优化,扩大服务的覆盖范围。本发明专利技术能较大幅度地降低用户移动设备的计算和通信成本,同时帮助群组服务提供商节约开销和增大覆盖范围。

A group privacy information discovery method and system

【技术实现步骤摘要】
一种群组隐私信息发现方法及系统
本专利技术属于信息
,具体涉及一种群组隐私信息发现方法及系统。
技术介绍
近年来,随着信息服务化的迅速普及、移动通信技术的快速发展,移动互联网以其便携性和实时性促进了众多新型网络服务模式的发展,其中群组服务更是渗透到人们的日常生活。此类服务通过分析用户提交的需求,为一批需求相似的人群提供服务。服务提供商需要收集用户的部分个人信息或需求,才能为用户找出合适的共享对象,并以群组的方式提供服务。然而,因为服务提供商并不完全可信,这种形式的群组服务存在着巨大的隐私泄露风险。服务提供商根据收集到的用户信息,不仅可以推测出用户的潜在信息,甚至可能将用户提交的信息与潜在信息联系起来,推测出用户的家庭住址、个人偏好、财务状况等敏感信息。因此,如何在提供群组服务功能的同时,有效保护用户提交的数据中蕴含的隐私信息,而不泄露给其他用户和服务提供商是当前面临的主要技术挑战。目前大多数隐私保护方法使用隐私保护聚类(Privacy-PreservingClustering,PPC)算法来解决群组服务中的隐私泄露问题。现有的PPC方案采用的隐私保护技术可分为随机化或加密技术两种。随机技术是通过添加噪声来保护敏感数据,加密技术可以在不牺牲聚类质量的情况下实现相对强大的隐私保护。为了寻求隐私与聚类质量之间的平衡,接下来将介绍两种较经典的基于随机或加密技术的隐私保护聚类方法。Agrawal等人首先对数据集添加随机噪声,提出PPC方案(参照R.AgrawalandR.Srikant.Privacy-preservingdatamining[C].Proceedingsofthe2000ACMSIGMODInternationalConferenceonManagementofData,2000,pp.439–450.);B.Pinkas在数据聚类过程中,利用安全多方计算和同态加密保护用户的隐私信息(参照B.Pinkas.Cryptographictechniquesforprivacy-preservingdatamining[J].ACMSIGKDD,vol.4,no.2,pp.12–19,2002.)。现有的隐私保护聚类技术应用于群组服务有以下三点局限性:1.在现存的群组服务中,为了同时保障隐私保护效果和聚类质量,用户需要保持在线状态,频繁地与服务提供商交互,在每次交互迭代中执行加密和解密操作。这导致用户资源受限的移动设备端仍需承担较大的计算和通信开销。2.在与位置相关的群组服务中,用户位置通常具有空间正相关性,即处于邻近区域的用户行程数据将以更大概率聚集在同一类中。利用空间正相关性,服务提供商能提升聚类收敛速度。然而,若用户加密位置信息后提交给服务器,服务器很难从密文中快速识别地理位置相近的用户们,并利用空间正相关性加速聚类收敛。3.多数服务提供商会把某几类用户需求合并为一类需求,在减少服务种类的同时,能有效增加服务覆盖率,然而这与用户需要快速获取服务的实际需求相矛盾,降低用户体验。
技术实现思路
本专利技术的目的在于提供一种群组隐私信息发现方法及系统,基于中继服务器对隐私信息进行保护,在不牺牲聚类质量的前提下,通过中继服务器对用户上传的信息进行密度峰值(DensityPeaks,DP)聚类,同时保护用户上传的敏感信息。在本专利技术中,聚类操作将从用户的移动设备转移到中继服务器进行,允许用户在提交需求后可以离线,同时避免迭代计算,提升计算效率。根据聚类结果,在满足用户需求的前提下对结果进一步优化,扩大服务的覆盖范围。本专利技术方法能较大幅度地降低用户移动设备的计算和通信成本,同时帮助群组服务提供商节约开销和增大覆盖范围。为实现上述目的,本专利技术采用如下技术方案:一种群组隐私信息发现方法,将中继服务器部署于面向群组服务的用户终端设备和服务器之间,该方法主要包括以下步骤:1)隐私信息初始化,将系统公钥-私钥对中的私钥随机分解成两部分,一部分作为中继服务器的私钥,另一部分作为服务器的私钥,利用两部分私钥对使用系统公钥加密的信息共同解密可得到明文数据;2)用户终端设备发送请求,使用系统公钥、为用户分配的公钥和覆盖该用户当前位置的所有中继服务器的公钥对该请求进行加密,所述覆盖该用户的所有中继服务器包括最近中继服务器和与该用户相邻的中继服务器;3)最近中继服务器收集其覆盖范围内用户与其邻近用户的请求密文后,利用其私钥解密请求密文并进行随机化处理,该随机化处理是指使用固定范围内的随机数加入密文中,再与相邻中继服务器交换密文信息;4)相邻各中继服务器对接收到密文使用各自私钥解密并进行验证,若验证通过,则可从密文中移除随机数得到原始密文,再将各中继服务器覆盖范围内的用户及其邻近用户的两部分密文分别存储并发送至服务器;5)服务器向接收到的请求密文中加入随机数,利用其私钥进行部分解密后返回至相应的中继服务器;6)中继服务器将含有随机数的密文利用其私钥进行部分解密,结合步骤5)中服务器部分解密了的密文,得到含有随机数的明文,对其计算处理后使用系统公钥加密并将密文发送给服务器,服务器移除密文中的随机数后,再次对密文随机化处理,得到新密文,并与相应中继服务器联合解密,并将解密后的结果处理后发送至相应中继服务器;7)中继服务器根据步骤6)所得结果,辅助服务器进行DP聚类计算,获得聚类中心和属于各个聚类中心的成员集;8)根据步骤7)所得聚类结果,服务器配合中继服务器为用户提供服务,并进一步优化,以提高服务覆盖率。进一步地,每个用户具有一个中继服务器集合,该集合包括覆盖该用户当前位置的所有中继服务器(即最近中继服务器和与该用户相邻的中继服务器);每个中继服务器具有一个用户集合,该集合包括该中继服务器所覆盖的所有用户与覆盖范围内用户的邻近用户(邻近用户可能不在该用户所在中继服务器的服务覆盖范围内)。进一步地,用户发送的请求可表示为其中,pki,j表示系统给用户分配的公钥加密请求信息,表示使用系统公钥pk加密请求信息生成的密文,表示使用最近中继服务器的公钥pki加密随机数生成的密文,表示使用相邻中继服务器的公钥将随机数与随机数的哈希拼接所得明文进行加密得到的密文。进一步地,步骤3)具体包括以下步骤:最近中继服务器使用其私钥解密密文,并进行随机化处理得密文;将和密文发送给相邻中继服务器。进一步地,步骤4)具体包括以下步骤:相邻中继服务器接收到密文后,使用各自私钥对密文进行解密验证,若解密后得到的随机数经过哈希后的值与解密后得到的值一致,则说明验证通过,可得到随机数ri,j(3),便可从密文中移除该随机数,得到原始请求密文各中继服务器将收集到的覆盖范围内的用户及覆盖范围内用户的邻近用户的两部分密文分别存储并发送给服务器。进一步地,步骤6)具体包括以下步骤:中继服务器将接收到的含有随机数的密文进行部分解密,结合步骤5)中服务器部分解密了的密文,得到含有随机数的明文,对其计算处理后使用系统本文档来自技高网
...

【技术保护点】
1.一种群组隐私信息发现方法,将中继服务器部署于面向群组服务的用户终端设备和服务器之间,该方法主要包括以下步骤:/n1)隐私信息初始化,将系统公钥-私钥对中的私钥随机分解成两部分,一部分作为中继服务器的私钥,另一部分作为服务器的私钥,利用两部分私钥对使用系统公钥加密的信息共同解密可得到明文数据;/n2)用户终端设备发送请求,使用系统公钥、为用户分配的公钥和覆盖该用户当前位置的所有中继服务器的公钥对该请求进行加密,所述覆盖该用户的所有中继服务器包括最近中继服务器和与该用户相邻的中继服务器;/n3)最近中继服务器收集其覆盖范围内用户与其邻近用户的请求密文后,利用其私钥解密请求密文并进行随机化处理,该随机化处理是指使用固定范围内的随机数加入密文中,再与相邻中继服务器交换密文信息;/n4)相邻各中继服务器对接收到密文使用各自私钥解密并进行验证,若验证通过,则可从密文中移除随机数得到原始密文,再将各中继服务器覆盖范围内的用户及覆盖范围内用户的邻近用户的两部分密文分别存储并发送至服务器;/n5)服务器向接收到的请求密文中加入随机数,利用其私钥进行部分解密后返回至相应中继服务器;/n6)中继服务器将含有随机数的密文利用其私钥进行部分解密,结合步骤5)中服务器部分解密了的密文,得到含有随机数的明文,对其计算处理后使用系统公钥加密并将密文发送给服务器,服务器移除密文中的随机数后,再次对密文随机化处理,得到新密文,并与相应中继服务器联合解密,并将解密后的结果处理后发送至相应中继服务器;/n7)中继服务器根据步骤6)所得结果,辅助服务器进行DP聚类计算,获得聚类中心和属于各个聚类中心的成员集;/n8)根据步骤7)所得聚类结果,服务器配合中继服务器为用户提供服务。/n...

【技术特征摘要】
1.一种群组隐私信息发现方法,将中继服务器部署于面向群组服务的用户终端设备和服务器之间,该方法主要包括以下步骤:
1)隐私信息初始化,将系统公钥-私钥对中的私钥随机分解成两部分,一部分作为中继服务器的私钥,另一部分作为服务器的私钥,利用两部分私钥对使用系统公钥加密的信息共同解密可得到明文数据;
2)用户终端设备发送请求,使用系统公钥、为用户分配的公钥和覆盖该用户当前位置的所有中继服务器的公钥对该请求进行加密,所述覆盖该用户的所有中继服务器包括最近中继服务器和与该用户相邻的中继服务器;
3)最近中继服务器收集其覆盖范围内用户与其邻近用户的请求密文后,利用其私钥解密请求密文并进行随机化处理,该随机化处理是指使用固定范围内的随机数加入密文中,再与相邻中继服务器交换密文信息;
4)相邻各中继服务器对接收到密文使用各自私钥解密并进行验证,若验证通过,则可从密文中移除随机数得到原始密文,再将各中继服务器覆盖范围内的用户及覆盖范围内用户的邻近用户的两部分密文分别存储并发送至服务器;
5)服务器向接收到的请求密文中加入随机数,利用其私钥进行部分解密后返回至相应中继服务器;
6)中继服务器将含有随机数的密文利用其私钥进行部分解密,结合步骤5)中服务器部分解密了的密文,得到含有随机数的明文,对其计算处理后使用系统公钥加密并将密文发送给服务器,服务器移除密文中的随机数后,再次对密文随机化处理,得到新密文,并与相应中继服务器联合解密,并将解密后的结果处理后发送至相应中继服务器;
7)中继服务器根据步骤6)所得结果,辅助服务器进行DP聚类计算,获得聚类中心和属于各个聚类中心的成员集;
8)根据步骤7)所得聚类结果,服务器配合中继服务器为用户提供服务。


2.如权利要求1所述的方法,其特征在于,每个用户具有一个中继服务器集合,该集合包括覆盖该用户当前位置的所有中继服务器;每个中继服务器具有一个用户集合,该集合包括该中继服务器所覆盖的所有用户与覆盖范围内用户的邻近用户。


3.如权利要求1所述的方法,其特征在于,用户发送的请求可表示为其中,pki,j表示系统给用户分配的公钥加密请求信息,表示使用系统公钥pk加密请求信息生成的密文,表示使用最近中继服务器的公钥pki加密随机数生成的密文,表示使用相邻中继服务器的公钥将随机数与随机数的哈希拼接所得明文进行加密得到的密文。


4.如权利要求3所述的方法,其特征在于,步骤3)具体包括以下步骤:
最近中继服务器使用其私钥解密密文,并进行随机化处理得密文;
将和密文发送给相邻中继服务器。


5.如权利要求4所述的方法,其特征在于,步骤4)具体包括以下步骤:
相邻中继服务器接收到密文后,使用各自私钥对密文进行解密验证,若解密后得到的随机数经过哈希后的值与解密后得到的值一致,则...

【专利技术属性】
技术研发人员:李凤华牛犇何媛媛尹沛捷
申请(专利权)人:中国科学院信息工程研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1