System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 面向海量分布式存储的隐匿查询方法、装置、设备及介质制造方法及图纸_技高网

面向海量分布式存储的隐匿查询方法、装置、设备及介质制造方法及图纸

技术编号:40445938 阅读:5 留言:0更新日期:2024-02-22 23:06
本申请公开了一种面向海量分布式存储的隐匿查询方法、装置、设备及介质,涉及计算机技术领域,应用于大数据平台,包括元数据节点、隐私信息检索查询处理节点、隐私信息检索协议执行节点、计算节点和存储节点,包括:获取客户端发送的包含多组关键字的查询请求;利用时序神经网络模型生成隐匿查询方案;时序神经网络模型是基于查询记录、存储分布情况、资源状况及网络状态训练得到的;根据隐匿查询方案从存储节点中获取数据,并通过隐私集合求交协议执行多组关键字的隐私集合求交获得存储序号;根据数据、存储序号及客户端创建的二维矩阵进行异或操作,并根据异或结果构建查询结果。本申请能够实现高效的隐匿查询,提高用户体验和整体性能。

【技术实现步骤摘要】

本专利技术涉及计算机,特别涉及一种面向海量分布式存储的隐匿查询方法、装置、设备及介质


技术介绍

1、随着云计算技术的蓬勃发展和大数据时代的到来,分布式存储已经成为了大规模数据管理的核心,传统的分布式存储系统,如hdfs(hadoop distributed file system,分布式文件系统)等,通常采用多副本机制来确保数据的可靠性和可用性。然而,随着大数据规模的不断扩大,用户的隐私保护需求变得日益迫切,特别是在数据检索场景下,用户在大数据平台上的查询行为可能包含敏感信息,如果这些信息暴露给云服务提供商或其他未授权的实体,将会导致用户隐私泄露,带来极大的安全风险。

2、隐匿查询技术(private information retrieval,pir)作为一种保护用户隐私的解决方案,允许用户在不泄露查询内容的前提下从数据库中检索所需信息。然而,在大数据的背景下,本领域面临着双重挑战。一方面,为了确保查询的高效性,需要降低通信开销和计算成本,以维护用户的良好体验。另一方面,为了确保查询的安全性,必须防止未授权实体获取用户的敏感信息。检索操作在性能和安全性这两个目标之间存在一定的矛盾。在这种情况下,如何在多副本环境下,有效结合深度学习、分布式存储和隐私保护技术,实现满足海量分布式存储场景下的高效隐匿查询成为亟需解决的问题。


技术实现思路

1、有鉴于此,本专利技术的目的在于提供一种面向海量分布式存储的隐匿查询方法、装置、设备及介质,能够实现高效的隐匿查询,提高用户体验和整体性能,其具体方案如下:

2、第一方面,本申请公开了一种面向海量分布式存储的隐匿查询方法,应用于目标大数据平台,其中,所述目标大数据平台包括若干个元数据节点、隐私信息检索查询处理节点、隐私信息检索协议执行节点、若干个计算节点和若干个存储节点,所述方法包括:

3、获取客户端发送的包含多组关键字的目标查询请求;其中,所述客户端对多组查询请求进行聚合得到聚合后查询请求,并对所述聚合后查询请求进行匿名化处理,然后生成包含所述多组关键字的所述目标查询请求;

4、通过所述隐私信息检索查询处理节点并利用预先训练完的目标时序神经网络模型生成针对所述目标查询请求的目标隐匿查询方案;其中,所述目标时序神经网络模型是基于所述目标大数据平台的查询记录、所述元数据节点的存储分布情况、资源使用状况以及网络状态训练得到的;

5、利用若干个所述计算节点并根据所述目标隐匿查询方案从若干个所述存储节点中获取相应的目标数据,并通过所述隐私信息检索协议执行节点以及根据隐私集合求交协议执行所述多组关键字的隐私集合求交,获得与所述多组关键字对应的目标存储序号;

6、根据所述目标数据、所述目标存储序号以及所述客户端根据所述目标隐匿查询方案创建的目标二维矩阵进行异或操作,并根据相应的异或结果构建针对所述目标查询请求的目标查询结果。

7、可选的,所述获取客户端发送的包含多组关键字的目标查询请求之前,还包括:

8、收集目标运行数据,并提取所述目标运行数据的频谱特征;其中,所述目标运行数据包括所述目标大数据平台的所述查询记录、所述存储分布情况、所述资源使用状况以及所述网络状态;

9、利用所述频谱特征对待训练时序神经网络模型进行训练,得到训练损失,当所述训练损失不满足预设条件时,则返回至所述利用所述频谱特征对待训练时序神经网络模型进行训练的步骤,直至获得所述训练损失满足所述预设条件的目标时序神经网络模型。

10、可选的,所述获得所述训练损失满足所述预设条件的目标时序神经网络模型之后,还包括:

11、将所述目标时序神经网络模型加载至所述目标大数据平台,以便所述大数据平台将所述目标时序神经网络模型部署在所述隐私信息检索查询处理节点上。

12、可选的,所述面向海量分布式存储的隐匿查询,还包括:

13、持续收集所述目标运行数据,并根据所述目标运行数据以及所述客户端发送的查询反馈记录对所述目标时序神经网络模型进行优化。

14、可选的,所述获取客户端发送的包含多组关键字的目标查询请求之前,还包括:

15、基于所述元数据节点的存储分布情况将海量数据分割为统一大小的若干个数据分片,并为每一所述数据分片分配对应的分片序号;

16、根据所述分片序号将预设的若干个关键字索引保存在所述元数据节点,以便基于所述元数据节点中的所述关键字索引确定所述多组关键字。

17、可选的,所述面向海量分布式存储的隐匿查询,还包括:

18、收集用户通过所述客户端发起的历史查询请求,并筛选所述历史查询请求中的关键字,然后根据筛选到的所述历史查询请求中的关键字创建所述若干个关键字索引。

19、可选的,所述隐私信息检索协议执行节点运行于可信执行环境上。

20、第二方面,本申请公开了一种面向海量分布式存储的隐匿查询装置,应用于目标大数据平台,其中,所述目标大数据平台包括若干个元数据节点、隐私信息检索查询处理节点、隐私信息检索协议执行节点、若干个计算节点和若干个存储节点,所述装置包括:

21、目标查询请求获取模块,用于获取客户端发送的包含多组关键字的目标查询请求;其中,所述客户端对多组查询请求进行聚合得到聚合后查询请求,并对所述聚合后查询请求进行匿名化处理,然后生成包含所述多组关键字的所述目标查询请求;

22、目标隐匿查询方案生成模块,用于通过所述隐私信息检索查询处理节点并利用预先训练完的目标时序神经网络模型生成针对所述目标查询请求的目标隐匿查询方案;其中,所述目标时序神经网络模型是基于所述目标大数据平台的查询记录、所述元数据节点的存储分布情况、资源使用状况以及网络状态训练得到的;

23、目标存储序号获取模块,用于利用若干个所述计算节点并根据所述目标隐匿查询方案从若干个所述存储节点中获取相应的目标数据,并通过所述隐私信息检索协议执行节点以及根据隐私集合求交协议执行所述多组关键字的隐私集合求交,获得与所述多组关键字对应的目标存储序号;

24、目标查询结果生成模块,用于根据所述目标数据、所述目标存储序号以及所述客户端根据所述目标隐匿查询方案创建的目标二维矩阵进行异或操作,并根据相应的异或结果构建针对所述目标查询请求的目标查询结果。

25、第三方面,本申请公开了一种电子设备,包括:

26、存储器,用于保存计算机程序;

27、处理器,用于执行所述计算机程序,以实现前述公开的面向海量分布式存储的隐匿查询方法。

28、第四方面,本申请公开了一种计算机可读存储介质,用于保存计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的面向海量分布式存储的隐匿查询方法。

29、可见,本申请提出一种面向海量分布式存储的隐匿查询方法,应用于目标大数据平台,其中,所述目标大数据平台包括若干个元数据节点、隐私信息检索查询处理节点、隐私信息检索协本文档来自技高网...

【技术保护点】

1.一种面向海量分布式存储的隐匿查询方法,其特征在于,应用于目标大数据平台,其中,所述目标大数据平台包括若干个元数据节点、隐私信息检索查询处理节点、隐私信息检索协议执行节点、若干个计算节点和若干个存储节点,所述方法包括:

2.根据权利要求1所述的面向海量分布式存储的隐匿查询方法,其特征在于,所述获取客户端发送的包含多组关键字的目标查询请求之前,还包括:

3.根据权利要求2所述的面向海量分布式存储的隐匿查询方法,其特征在于,所述获得所述训练损失满足所述预设条件的目标时序神经网络模型之后,还包括:

4.根据权利要求2所述的面向海量分布式存储的隐匿查询方法,其特征在于,还包括:

5.根据权利要求1所述的面向海量分布式存储的隐匿查询方法,其特征在于,所述获取客户端发送的包含多组关键字的目标查询请求之前,还包括:

6.根据权利要求5所述的面向海量分布式存储的隐匿查询方法,其特征在于,还包括:

7.根据权利要求1至6任一项所述的面向海量分布式存储的隐匿查询方法,其特征在于,所述隐私信息检索协议执行节点运行于可信执行环境上

8.一种面向海量分布式存储的隐匿查询装置,其特征在于,应用于目标大数据平台,其中,所述目标大数据平台包括若干个元数据节点、隐私信息检索查询处理节点、隐私信息检索协议执行节点、若干个计算节点和若干个存储节点,所述装置包括:

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,用于保存计算机程序;其中,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的面向海量分布式存储的隐匿查询方法。

...

【技术特征摘要】

1.一种面向海量分布式存储的隐匿查询方法,其特征在于,应用于目标大数据平台,其中,所述目标大数据平台包括若干个元数据节点、隐私信息检索查询处理节点、隐私信息检索协议执行节点、若干个计算节点和若干个存储节点,所述方法包括:

2.根据权利要求1所述的面向海量分布式存储的隐匿查询方法,其特征在于,所述获取客户端发送的包含多组关键字的目标查询请求之前,还包括:

3.根据权利要求2所述的面向海量分布式存储的隐匿查询方法,其特征在于,所述获得所述训练损失满足所述预设条件的目标时序神经网络模型之后,还包括:

4.根据权利要求2所述的面向海量分布式存储的隐匿查询方法,其特征在于,还包括:

5.根据权利要求1所述的面向海量分布式存储的隐匿查询方法,其特征在于,所述获取客户端发送的包含多组关...

【专利技术属性】
技术研发人员:孙善宝姜凯罗清彩李彬沈国栋
申请(专利权)人:山东浪潮科学研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1