数据即服务模式下支持范围查询的隐私保护方法和系统技术方案

技术编号:22387823 阅读:54 留言:0更新日期:2019-10-29 06:39
本发明专利技术涉及一种数据即服务模式下支持范围查询的隐私保护方法和系统。在数据即服务的管理模式中,数据服务商的安全策略可能并不完备,数据所有者对其并不完全信任。在这样的环境下,设计一个能够完备的、能够保证数据隐私安全同时数据查询相对高效的机制是很有必要的。已有的数据即服务的管理模式中存在时间效率低和隐私信息攻击的风险。本发明专利技术提出一个完备、隐私安全并且支持范围查询和数据验证的方案,其核心是通过对数据分区,在同一分区内的数据采取哈希函数部分和的方式获得索引;为了能够在范围查询时避免假命中数据和数据验证,引入了查询精度和验证矩阵。通过实验验证,本发明专利技术具有很好的时间效率,同时能够很好地减少数据信息泄露。

Privacy protection method and system supporting range query in data as a service mode

【技术实现步骤摘要】
数据即服务模式下支持范围查询的隐私保护方法和系统
本专利技术属于数据管理、隐私保护等数据安全
,具体设计一种保证用户隐私安全的数据即服务(DaaS)数据管理模式。
技术介绍
数据即服务(DaaS)已经是云计算时代的数据管理模式。数据组织者通过购买服务的模式得到按需的数据存储服务,通过将储存任务放在云端,可以减少企业的费用,增大数据的管理能力。但数据隐私安全成为一项数据组织者必须要考虑的问题,目前用户隐私泄露已经导致严重的社会问题。在用户隐私性保护技术中,首先就是设置合理的访问权限机制,非法的身份不能获得数据的访问权限。其次就是进行数据加密技术,对关键数据或者全部数据加密存储,存储经过加密的数据。在使用数据时,经过解密数据得到原始数据,再进行具体的统计分析。目前,数据即服务模型(DaaS)是数据管理使用的有效方式。数据往往存在数据服务商的服务器中。数据使用者在使用数据时需要从数据服务商的服务器中获得数据。数据即服务模型的优点是能够使得数据访问不局限于时间和地点,数据组织者不用使用相应的硬件来搭建数据服务器。但是数据存储在数据服务商中增加了数据隐私泄露的隐患。在DaaS模式中,可以将整个业务流程角色分为三个:(1)数据组织者。是数据的所有者。(2)数据服务商。存储用户的加密过的数据。(3)数据使用客户。使用数据服务商提供的服务进行查询。如附图1所示,数据使用客户使用数据服务商的数据存储服务。比如数据组织者要将自己的数据TRADE(tnocost,date)部署到数据服务商中,首先为了保护数据隐私,将数据项加密得到Entrypt(TRADE)后提交给数据服务商。数据使用客户在得到数据组织者的同意并得到密码本后,即查询数据并解密得到原始数据。他们之间的信任关系和服务模式也如附图1所示。数据使用客户和数据组织者存在信任关系,数据使用客户能够获得数据的密码策略来获得数据查询服务。而数据服务商与他们并没有绝对的信任关系,数据服务商不可信的原因是他们的存储策略并不完全可靠,可能会存在被非法窃取和篡改的可能性。为了数据隐私安全,在数据服务商并不可信的情况下,需要对数据进行加密存储,并且在进行查询服务时,对操作的数据查询请求也进行处理,使数据服务商不知道具体数据。同时需要提高在加密数据上的可操作性以及能够对查询结果进行验证。在加密数据上的范围查询以及对查询结果的验证是保证数据和服务可用的核心技术。在对加密技术实行范围查询的方法有保持顺序的加密算法以及桶分法。采用保持顺序的加密时,也就是说数d1<d2时,经过加密后有Encrypt(d1)<Encrypt(d2)。这个方法已经有算法实现,相关算法包括OPE、OPES,但是上述方法比较耗费时间,而且在插入新的数据时复杂度较高,会消耗更多的计算资源。桶分的方法是将数据范围分为若干个离散的区间,每个桶分配一个标识符,在理想的状态下,如果每个桶最多一个数据,这样不会存在查询的假命中的情况,但是在实际情况下,数据往往不是均匀分布的,并且查询往往会出现假命中的情况。在对数据的验证技术上,目前技术一般利用Merkle哈希树来验证,这种方式对于多维数据的验证比较困难,对于空间要求比较高。比如对于二维数据,需要的空间复杂度为O(n2)。同时在更新数据时,需要更新该数据的Merkle节点的所有父节点的哈希值,需要数据集所有的数据参与计算。
技术实现思路
本专利技术针对上述问题,提供一种在数据服务模型(DaaS)中的可验证的数据隐私保护方法,能够同时支持范围查询,并支持查询结果的正确性验证。本专利技术的总体技术方案如下:1.通过划分值域区间U,将其分为N个区间,每个区间分配唯一的标识符。这个区间是数据插入时哈希索引和哈希签名链的更新单元,是安全策略的更新单元。安全策略的更新是指可以通过更新区间的标识符来防止因访问频数而受到重要性攻击,还可以更改加密密钥使得某些数据使用用户的数据权限自动过期,这样可以防止数据访问权限被滥用。2.引入查询精度Φ和标志记录,这样可以在进行范围查找时能够根据边界范围定位到具体的位置。3.在同一个分区内通过计算得到与数据的属性值的顺序保持一致的哈希索引。在得到保持顺序的哈希索引时,通过累加该分区元素的哈希函数值来保持顺序。4.本专利技术计了一种哈希签名链和验证矩阵进行数据验证。哈希签名链中每个哈希签名通过自身数据项和与之相邻的数据项的哈希得到。哈希签名链是存储在数据服务商中的,为了能够验证哈希签名链和数据项,本专利技术设计了验证矩阵来验证查询结果。通过验证矩阵,能够通过自证、它证、共证三种方式验证数据正确性和完整性。具体来说,本专利技术采用的技术方案如下:一种数据即服务模式下支持范围查询的隐私保护方法,包括以下步骤:1)数据组织端将数据的值域分为若干区间,每个区间分配唯一的标识符,区间与标识符之间的映射关系作为密码本的一部分;数据组织端将密码本授权给受信任的数据使用端;2)数据组织端对同一个区间内的数据项建立保持顺序的哈希索引,并计算哈希签名链;所述哈希签名链中每个哈希签名通过数据项自身和与之相连的数据项的哈希得到;3)数据组织端插入数据时,在哈希索引中设置标志记录,然后将各区间内的加密的数据项及相应的哈希索引、哈希签名链提交给数据服务端;4)数据使用端向数据服务端进行范围查找时,通过数据组织端设定的查询精度和标志记录,根据边界范围定位到具体的位置;5)数据使用端收到数据服务端返回的数据后,利用数据组织端授权的密码本对数据进行解密,利用哈希签名的验证矩阵对数据进行验证。一种数据即服务模式下支持范围查询的隐私保护系统,包括数据组织端、数据服务端和数据使用端;数据组织端将数据的值域分为若干区间,每个区间分配唯一的标识符,区间与标识符之间的映射关系作为密码本的一部分;数据组织端将密码本授权给受信任的数据使用端;数据组织端对同一个区间内的数据项建立保持顺序的哈希索引,并计算哈希签名链;所述哈希签名链中每个哈希签名通过数据项自身和与之相连的数据项的哈希得到;数据组织端插入数据时,在哈希索引中设置标志记录,然后将各区间内的加密的数据项及相应的哈希索引、哈希签名链提交给数据服务端;数据使用端向数据服务端进行范围查找时,通过数据组织端设定的查询精度和标志记录,根据边界范围定位到具体的位置;数据使用端收到数据服务端返回的数据后,利用数据组织端授权的密码本对数据进行解密,利用哈希签名的验证矩阵对数据进行验证。本专利技术设计了一种高效安全的数据服务模型(DaaS),通过在数据的提交、查询和验证方面的设计,可以在数据的全生命周期提供安全保障,能够以很好的时间效率,提供一个完备的、安全的DaaS模型并提供数据管理、保证数据隐私安全。该方案具有以下的优点及效果:1、能够实现加密数据上的精准范围查询,查询结果不存在假的命中的情况。通过定义查询精度Φ,可以在范围查询的边界数据即使不在数据集中也能定位到数据集中边界。2、具有很好的时间效率。通过值域分区,对于数据集总体n,所有的操作都能够在时间复杂度为O(1)的情况下完成。数据在提交、更新以及查询过程中都具有很好的时间效率。3、增加了对查询结果的正确性验证。将数据验证的数据哈希签名存储在数据服务商中,最大限度的利用数据服务商的服务,同时为了更完善的验证,通本文档来自技高网
...

【技术保护点】
1.一种数据即服务模式下支持范围查询的隐私保护方法,其特征在于,包括以下步骤:1)数据组织端将数据的值域分为若干区间,每个区间分配唯一的标识符,区间与标识符之间的映射关系作为密码本的一部分;数据组织端将密码本授权给受信任的数据使用端;2)数据组织端对同一个区间内的数据项建立保持顺序的哈希索引,并计算哈希签名链;所述哈希签名链中每个哈希签名通过数据项自身和与之相连的数据项的哈希得到;3)数据组织端插入数据时,在哈希索引中设置标志记录,然后将各区间内的加密的数据项及相应的哈希索引、哈希签名链提交给数据服务端;4)数据使用端向数据服务端进行范围查找时,通过数据组织端设定的查询精度和标志记录,根据边界范围定位到具体的位置;5)数据使用端收到数据服务端返回的数据后,利用数据组织端授权的密码本对数据进行解密,利用哈希签名的验证矩阵对数据进行验证。

【技术特征摘要】
1.一种数据即服务模式下支持范围查询的隐私保护方法,其特征在于,包括以下步骤:1)数据组织端将数据的值域分为若干区间,每个区间分配唯一的标识符,区间与标识符之间的映射关系作为密码本的一部分;数据组织端将密码本授权给受信任的数据使用端;2)数据组织端对同一个区间内的数据项建立保持顺序的哈希索引,并计算哈希签名链;所述哈希签名链中每个哈希签名通过数据项自身和与之相连的数据项的哈希得到;3)数据组织端插入数据时,在哈希索引中设置标志记录,然后将各区间内的加密的数据项及相应的哈希索引、哈希签名链提交给数据服务端;4)数据使用端向数据服务端进行范围查找时,通过数据组织端设定的查询精度和标志记录,根据边界范围定位到具体的位置;5)数据使用端收到数据服务端返回的数据后,利用数据组织端授权的密码本对数据进行解密,利用哈希签名的验证矩阵对数据进行验证。2.如权利要求1所述的方法,其特征在于,每个所述区间是插入数据时哈希索引和哈希签名链的更新单元,是安全策略的更新单元;安全策略的更新是指通过更新区间的标识符来防止因访问频数而受到重要性攻击,以及更改加密密钥使得某些数据使用用户的数据权限自动过期,从而防止数据访问权限被滥用。3.如权利要求1所述的方法,其特征在于,在建立所述保持顺序的哈希索引时,通过叠加区间内元素的哈希函数值来保持顺序。4.如权利要求1所述的方法,其特征在于,所述查询精度能够在范围查询是定位到查询边界,不同区间设置不同的查询精度不会造成数据分布泄露;在范围查询时通过比较标志记录的标记和边界值来避免查询的假命中。5.如权利要求1所述的方法,其特征在于,所述哈希索引在同一个区间内,索引值与数据记录顺序相同,在范围查询时,只需要找到边界的定位,就能够得到查询的范围。6.如权利要求1所述的方法,其特征在于,所述验证矩阵根据哈希签名计算得到,哈希签名和数据项都能够被验证;数据使用端以自证、他证、公证三种证明方式对数据进行验证,能够对数据是否存在删除、伪造和破坏情况进行验证。7.如权利要求6所述的方法,其特征在于,所述哈希签名的计算公式为:S(data)=MaxP(SHash(di),1/ε1)+MaxP...

【专利技术属性】
技术研发人员:吴广君王勇王振宇李军
申请(专利权)人:中国科学院信息工程研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1