模糊可搜索加密方法、装置及电子设备制造方法及图纸

技术编号:36802714 阅读:12 留言:0更新日期:2023-03-08 23:55
本发明专利技术提供一种模糊可搜索加密方法、装置及电子设备,该方法包括:私有云服务器接收数据使用者发送的索引密钥和包括检索关键词的查询请求;根据检索关键词构建检索模糊词集并根据索引密钥计算得到对应的陷门集;向公有云服务器发送包括陷门集的搜索请求;接收公有云服务器返回的多个检索文档标识及其对应的排序分数;多个检索文档标识由公有云服务器根据私有云服务器构建并上传的基于布隆过滤器分组的搜索树检索陷门集并匹配获得,排序分数由公有云服务器根据私有云服务器发送的加密相关度分数和加密查询值计算得到;根据排序分数对多个检索文档标识排序形成搜索结果返回给数据使用者。从而使检索效率提高,搜索结果更加符合数据使用者的需求。加符合数据使用者的需求。加符合数据使用者的需求。

【技术实现步骤摘要】
模糊可搜索加密方法、装置及电子设备


[0001]本专利技术涉及信息安全
,尤其涉及一种模糊可搜索加密方法、装置及电子设备。

技术介绍

[0002]在密文存储条件下仍能支持模糊搜索是有必要的。目前实现模糊可搜索加密的方法有多种,如先利用直接构造、基于通配符构造或基于N元模型(N

gram)构造构建模糊词集,再构建树型字典树的方法;还有一种语义扩展算法,不仅可以返回完全匹配的数据,还可以返回与查询关键词语义相关的内容;还有一种基于通配符构造、基于拼音构造和基于改进拼音构造三种建立中文模糊关键词集的方法,通过改进的词频

逆文本频率指数(Term Frequency

Inverse Document Frequency,TF

IDF)准则,设计的一个支持排序的中文模糊可搜索加密方案。
[0003]然而,这些模糊可搜索加密方法的实践效果并不理想,存在模糊词集占用存储空间较大,检索效率不高,搜索结果排序结果不符合用户预期的问题。

技术实现思路

[0004]针对现有技术存在的问题,本专利技术提供一种模糊可搜索加密方法、装置及电子设备。
[0005]第一方面,本专利技术提供一种模糊可搜索加密方法,应用于私有云服务器,包括:
[0006]接收数据使用者发送的索引密钥和查询请求,所述查询请求中包括检索关键词;
[0007]根据所述检索关键词构建检索模糊词集,并根据所述索引密钥计算所述检索模糊词集中每个检索模糊词对应的陷门值,得到所述检索模糊词集对应的陷门集;
[0008]向公有云服务器发送搜索请求,所述搜索请求中包括所述陷门集;
[0009]接收所述公有云服务器返回的多个检索文档标识,以及每个检索文档标识对应的排序分数;其中,所述多个检索文档标识由所述公有云服务器根据所述私有云服务器构建并上传的基于布隆过滤器分组的搜索树检索所述陷门集并匹配获得,所述每个检索文档标识对应的排序分数由所述公有云服务器根据所述私有云服务器发送的每个检索文档标识对应的加密相关度分数和加密查询值计算得到,所述加密相关度分数为对所述检索关键词与检索文档之间的相关度分数进行加密得到,所述加密查询值为对检索文档的查询值进行加密得到;
[0010]根据所述排序分数对所述多个检索文档标识进行排序,形成搜索结果返回给所述数据使用者。
[0011]可选地,所述基于布隆过滤器分组的搜索树的构建方式包括:
[0012]对上传文档的模糊词集中每个模糊词计算相应的索引值;
[0013]将属于同一上传文档的多个索引值添加到所述同一上传文档对应的布隆过滤器中,并将所述布隆过滤器作为叶节点;
[0014]对相邻布隆过滤器进行或运算,产生新的布隆过滤器作为所述相邻布隆过滤器的父节点;
[0015]重复生成父节点的过程,直到生成根节点。
[0016]可选地,所述方法还包括:
[0017]计算不同的布隆过滤器之间的相似度,并根据所述相似度,对布隆过滤器进行排列分侧。
[0018]可选地,所述上传文档的模糊词集的生成方式包括:
[0019]接收上传文档的关键词集,所述上传文档的关键词集是数据拥有者利用Word分词工具提取后发送给所述私有云服务器的;
[0020]基于同义词典,构建所述上传文档的关键词集所对应的模糊词集。
[0021]可选地,所述排序分数通过以下公式确定:
[0022]Quality=Dec
sim
*weight
sim
+Dec
q
*weight
q
[0023]其中,Quality表示所述排序分数,Dec
sim
表示所述加密相关度分数,Dec
q
表示所述加密查询值,weight
sim
、weight
q
分别表示所述加密相关度分数的权重和所述加密查询值的权重。
[0024]可选地,所述检索文档的查询值的确定方式包括:
[0025]初始化所有检索文档的查询值为1;
[0026]根据查询值更新规则对查询值进行更新;
[0027]所述查询值更新规则包括:
[0028]若确定目标检索文档被下载,则将所述目标检索文档的查询值加1;
[0029]若确定在预设时长内目标检索文档未被下载,则将所述目标检索文档的查询值减1。
[0030]第二方面,本专利技术还提供一种模糊可搜索加密装置,应用于私有云服务器,包括:
[0031]第一接收模块,用于接收数据使用者发送的索引密钥和查询请求,所述查询请求中包括检索关键词;
[0032]陷门模块,用于根据所述检索关键词构建检索模糊词集,并根据所述索引密钥计算所述检索模糊词集中每个检索模糊词对应的陷门值,得到所述检索模糊词集对应的陷门集;
[0033]发送模块,用于向公有云服务器发送搜索请求,所述搜索请求中包括所述陷门集;
[0034]第二接收模块,用于接收所述公有云服务器返回的多个检索文档标识,以及每个检索文档标识对应的排序分数;其中,所述多个检索文档标识由所述公有云服务器根据所述私有云服务器构建并上传的基于布隆过滤器分组的搜索树检索所述陷门集并匹配获得,所述每个检索文档标识对应的排序分数由所述公有云服务器根据所述私有云服务器发送的每个检索文档标识对应的加密相关度分数和加密查询值计算得到,所述加密相关度分数为对所述检索关键词与检索文档之间的相关度分数进行加密得到,所述加密查询值为对检索文档的查询值进行加密得到;
[0035]排序模块,用于根据所述排序分数对所述多个检索文档标识进行排序,形成搜索结果返回给所述数据使用者。
[0036]第三方面,本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并
可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述第一方面所述的模糊可搜索加密方法。
[0037]第四方面,本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上所述第一方面所述的模糊可搜索加密方法。
[0038]第五方面,本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述模糊可搜索加密方法。
[0039]本专利技术提供的模糊可搜索加密方法、装置及电子设备,通过私有云服务器构建基于布隆过滤器分组的搜索树并上传公有云服务器,接收数据使用者的索引密钥和检索关键词,根据检索关键词构建检索模糊词集,根据索引密钥计算检索模糊词集中每个检索模糊词对应的陷门值,得到检索模糊词集对应的陷门集,公有云服务器根据基于布隆过滤器分组的搜索树检索陷门集并匹配获得多个检索文档标识,并根据加密相关度分数和加密查询值计算这多个检索文档的排序分数,再由私有云服务器根据排序分数对多个检索文档标识进行排序,形成搜索结果返回本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模糊可搜索加密方法,其特征在于,应用于私有云服务器,包括:接收数据使用者发送的索引密钥和查询请求,所述查询请求中包括检索关键词;根据所述检索关键词构建检索模糊词集,并根据所述索引密钥计算所述检索模糊词集中每个检索模糊词对应的陷门值,得到所述检索模糊词集对应的陷门集;向公有云服务器发送搜索请求,所述搜索请求中包括所述陷门集;接收所述公有云服务器返回的多个检索文档标识,以及每个检索文档标识对应的排序分数;其中,所述多个检索文档标识由所述公有云服务器根据所述私有云服务器构建并上传的基于布隆过滤器分组的搜索树检索所述陷门集并匹配获得,所述每个检索文档标识对应的排序分数由所述公有云服务器根据所述私有云服务器发送的每个检索文档标识对应的加密相关度分数和加密查询值计算得到,所述加密相关度分数为对所述检索关键词与检索文档之间的相关度分数进行加密得到,所述加密查询值为对检索文档的查询值进行加密得到;根据所述排序分数对所述多个检索文档标识进行排序,形成搜索结果返回给所述数据使用者。2.根据权利要求1所述的模糊可搜索加密方法,其特征在于,所述基于布隆过滤器分组的搜索树的构建方式包括:对上传文档的模糊词集中每个模糊词计算相应的索引值;将属于同一上传文档的多个索引值添加到所述同一上传文档对应的布隆过滤器中,并将所述布隆过滤器作为叶节点;对相邻布隆过滤器进行或运算,产生新的布隆过滤器作为所述相邻布隆过滤器的父节点;重复生成父节点的过程,直到生成根节点。3.根据权利要求2所述的模糊可搜索加密方法,其特征在于,所述方法还包括:计算不同的布隆过滤器之间的相似度,并根据所述相似度,对布隆过滤器进行排列分侧。4.根据权利要求2所述的模糊可搜索加密方法,其特征在于,所述上传文档的模糊词集的生成方式包括:接收上传文档的关键词集,所述上传文档的关键词集是数据拥有者利用Word分词工具提取后发送给所述私有云服务器的;基于同义词典,构建所述上传文档的关键词集所对应的模糊词集。5.根据权利要求1所述的模糊可搜索加密方法,其特征在于,所述排序分数通过以下公式确定:Quality=Dec
sim
*weight
sim
+Dec
q
*weight
q
其中,Quality表示所述排序分数,Dec
sim<...

【专利技术属性】
技术研发人员:胡波龙红平王妍马超吕遒健
申请(专利权)人:中国科学院信息工程研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1