System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() TEE辅助的安全高效分布式高维数据相似性查询系统和方法技术方案_技高网

TEE辅助的安全高效分布式高维数据相似性查询系统和方法技术方案

技术编号:40546145 阅读:5 留言:0更新日期:2024-03-05 19:03
本发明专利技术公开了一种TEE辅助的安全高效分布式高维数据相似性查询方法,包括:构建TEE辅助的安全高效分布式高维数据相似性查询系统并对查询系统进行初始化;数据拥有者将其数据集中的数据构造成TPSS形式,并分布式外包至第一云服务器和第二云服务器;利用外包数据构建PB树;当在数据集中添加或删除一个更新数据时,第一云服务器、第二云服务器和可信执行环境通过协同运算搜索PB树以对更新数据进行添加或删除;根据查询代理提出的相似性查询请求,第一云服务器、第二云服务器和可信执行环境向查询代理提供查询服务。本发明专利技术能够支持基于外包分布式高维数据的安全查询索引构建、高效的相似性查询处理和数据动态更新。

【技术实现步骤摘要】

本专利技术属于数据相似性查询,具体涉及一种tee辅助的安全高效分布式高维数据相似性查询系统和方法。


技术介绍

1、随着物联网和信息技术的迅速发展,大数据呈现出快速增长和分布式存储的趋势。将大数据外包至拥有强大存储和计算能力的云服务器已成为缓解大数据存储压力、提高大数据处理效率的有效手段。然而,随着人们数据隐私保护意识的增强和相关隐私保护法律法规的颁布,数据通常以密态的形式存储在云服务器且允许云服务器基于密态数据向用户提供查询等数据服务。基于密态数据的外包查询能够有效地保护数据隐私,但加密破坏了数据的可用性,导致密态数据查询效率的下降。构建数据查询索引是提高外包数据查询的常用策略,并将索引加密,与密态数据一同发送至云服务器,辅助外包查询。当数据集中存储于一个数据拥有者时,构建和加密查询索引相对容易,仅基于明文数据构建查询索引,而后加密索引,但所构建的索引基本无法支持数据的动态更新,而且不适用于数据分布式存储的场景。具体地,当数据垂直或水平地分布式存储时,查询索引的构建需要通过安全多方计算技术实现,数据拥有者的计算开销较大,数据所有者间的通信开销较大。

2、针对高维数据的安全相似性查询,学者们已提出多种解决方法,但现有方法存在一种或多种局限性,如线性查询效率、查询结果不准确以及不支持分布数据和数据的动态更新。具体地,德克萨斯大学达拉斯分校的学者们在论文《efficient similarity searchover encrypted data》中基于局部敏感哈希(local-sensitive hashing,lsh)技术提出了一个近似相似性查询方法,利用哈希函数将距离相近的点映射至相同的数值,提高相似性查询的效率;并引入对称可搜索加密技术保护基于lsh值的相似性查询隐私性。该方法查询效率较高,但无法支持数据的动态更新。在此基础上,香港城市大学和香港城市大学深圳研究院的学者们在论文《encsim:an encrypted similarity search service fordistributed high-dimensional datasets》中巧妙地将全对lsh与具有前向安全性的对称可搜索加密方法相结合,以实现安全高效的相似性查询,并支持数据的动态添加。西安电子科技大学的学者们在论文《towards secure approximate k-nearest neighbor queryover encrypted high-dimensional data》中提出了一种基于lsh编码和优化线性排序的安全贪婪分区方法,利用这种方法实现了高维数据的安全近似距离计算和相似性查询。西安电子科技大学的学者们在论文《secure k nearest neighbors query for high-dimensional vectors in outsourced environments》中利用粗粒化、aes加密和paillier同态加密技术设计了一种安全的倒排文件索引,并基于该索引实现高效的高维数据近似距离计算。虽然上述方法具备亚线性的查询效率,仅能实现近似相似性查询,无法保证查询结果的准确性,且无法完全支持分布式数据的动态更新。

3、此外,学者们面向低维数据提出的一些安全相似性查询方法,也可用于实现安全高维数据的相似性查询。具体地,香港大学的学者们在论文《secure knn computation onencrypted databases》中利用可逆矩阵加密数据,基于密态数据能够有效判断数据记录与查询数据的距离顺序,从而实现安全相似性查询,但该方法安全性较弱,无法抵抗已知明文攻击。为了增强该方法的安全性,新布伦瑞克大学的学者们在论文《efficient privacy-preserving similarity range query with quadsector tree in ehealthcare》中提出了一个改进的矩阵加密方法,通过引入更多的随机值,确保该方法能够抵抗已知明文攻击,但该方法的查询效率与数据集大小线性相关。密苏里科技大学的学者们在论文《secure k-nearest neighbor query over encrypted data in outsourced environments》中利用加法同态加密方法设计了一系列隐私保护协议,包括:安全乘法、安全欧式距离计算等协议,并利用这些协议保护相似性查询的隐私性,但其查询效率仍然与数据集大小线性相关。

4、因此,面向分布式高维数据设计安全高效的相似性查询方法仍然是一个重要的挑战。


技术实现思路

1、为了解决现有技术中存在的上述问题,本专利技术提供了一种可信执行环境(trustedexecution environment,tee)辅助的安全高效分布式高维数据相似性查询系统和方法。本专利技术要解决的技术问题通过以下技术方案实现:

2、本专利技术提供了一种tee辅助的安全高效分布式高维数据相似性查询方法,包括:

3、s1:构建tee辅助的安全高效分布式高维数据相似性查询系统,对所述安全高效分布式高维数据相似性查询系统进行初始化,所述系统包括数据拥有者do、第一云服务器cs1、第二云服务器cs2、可信执行环境tee、中立方np和查询代理qa,所述第一云服务器cs1位于第一云服务器平台,所述第二云服务器cs2和所述可信执行环境tee位于第二云服务器平台;

4、s2:所述数据拥有者do将其所拥有的数据集中的数据构造成tpss形式,并分布式外包至所述第一云服务器cs1和所述第二云服务器cs2;

5、s3:利用外包至所述第一云服务器cs1和所述第二云服务器cs2的tpss形式的数据构建pb树;

6、s4:当在数据集中添加或删除一个更新数据时,所述第一云服务器cs1、所述第二云服务器cs2和所述可信执行环境tee通过协同运算搜索所述pb树以对所述更新数据进行添加或删除;

7、s5:根据所述查询代理qa提出的相似性查询请求,所述第一云服务器cs1、所述第二云服务器cs2和所述可信执行环境tee向所述查询代理qa提供查询服务。

8、在本专利技术的一个实施例中,对所述安全高效分布式高维数据相似性查询系统进行初始化,包括:

9、所述数据拥有者do对所述第一云服务器cs1进行初始化;所述查询代理qa对所述第二云服务器cs2进行初始化,所述中立方np创建所述可信执行环境tee;

10、所述数据拥有者do和所述中立方np协商出一个κ比特的对称密钥k1和一个伪随机函数其中,κ为安全参数,所述查询代理qa和所述中立方np协商一个κ比特的对称密钥k2,所述数据拥有者do发送所述对称密钥k1至所述第一云服务器cs1,将所述伪随机函数f公开;所述查询代理qa发送所述对称密钥k2至所述第二云服务器cs2;所述中立方np将{k1,k2}部署在所述可信执行环境tee上;

11、所述数据拥有者do公开数据值域dx,并公开所建pb树的叶子节点本文档来自技高网...

【技术保护点】

1.一种TEE辅助的安全高效分布式高维数据相似性查询方法,其特征在于,包括:

2.根据权利要求1所述的TEE辅助的安全高效分布式高维数据相似性查询方法,其特征在于,对所述安全高效分布式高维数据相似性查询系统进行初始化,包括:

3.根据权利要求1所述的TEE辅助的安全高效分布式高维数据相似性查询方法,其特征在于,所述S2包括:

4.根据权利要求1所述的TEE辅助的安全高效分布式高维数据相似性查询方法,其特征在于,所述S3包括:

5.根据权利要求4所述的TEE辅助的安全高效分布式高维数据相似性查询方法,其特征在于,所述第一云服务器CS1和所述第二云服务器CS2构建一个内部节点包括:

6.根据权利要求5所述的TEE辅助的安全高效分布式高维数据相似性查询方法,其特征在于,所述S301中的随机值生成算法包括:

7.根据权利要求5所述的TEE辅助的安全高效分布式高维数据相似性查询方法,其特征在于,所述S302包括:

8.根据权利要求5所述的TEE辅助的安全高效分布式高维数据相似性查询方法,其特征在于,所述S4包括:

9.根据权利要求5所述的TEE辅助的安全高效分布式高维数据相似性查询方法,其特征在于,所述S5包括:

10.一种TEE辅助的安全高效分布式高维数据相似性查询系统,其特征在于,包括数据拥有者DO、第一云服务器CS1、第二云服务器CS2、可信执行环境TEE、中立方NP和查询代理QA,所述第一云服务器CS1位于第一云服务器平台,所述第二云服务器CS2和所述可信执行环境TEE位于第二云服务器平台,其中,

...

【技术特征摘要】

1.一种tee辅助的安全高效分布式高维数据相似性查询方法,其特征在于,包括:

2.根据权利要求1所述的tee辅助的安全高效分布式高维数据相似性查询方法,其特征在于,对所述安全高效分布式高维数据相似性查询系统进行初始化,包括:

3.根据权利要求1所述的tee辅助的安全高效分布式高维数据相似性查询方法,其特征在于,所述s2包括:

4.根据权利要求1所述的tee辅助的安全高效分布式高维数据相似性查询方法,其特征在于,所述s3包括:

5.根据权利要求4所述的tee辅助的安全高效分布式高维数据相似性查询方法,其特征在于,所述第一云服务器cs1和所述第二云服务器cs2构建一个内部节点包括:

6.根据权利要求5所述的tee辅助的安全高效分布式高维数据相似性查...

【专利技术属性】
技术研发人员:郑艳冬张松年王枫为朱辉杨晓鹏李晖
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1