加密文档的检索方法、装置及系统制造方法及图纸

技术编号:40955279 阅读:27 留言:0更新日期:2024-04-18 20:31
本公开提供加密文档的检索方法、装置及系统,涉及文档检索技术领域,方法包括:接收来自客户端的第一布谷鸟哈希表,其包括存储有第一关键字的第一指纹的第一哈希桶,第一哈希桶的位置利用第一算法对第一关键字计算得到,第一算法使相似的多个关键字对应相同的哈希桶;计算第一指纹与每个加密文档的第二布谷鸟哈希表中第二哈希桶中存在的第二指纹的相似程度,第二哈希桶的位置与第一哈希桶的位置相同,第二布谷鸟哈希表包括第三哈希桶,第三哈希桶的位置利用第一算法对第二关键字计算得到,第三哈希桶中存储第二关键字的第二指纹和反映第二关键字与其所属的加密文档之间的相关程度的相关性分数;根据相似程度和相关性分数,确定匹配的加密文档。

【技术实现步骤摘要】

本公开涉及文档检索,尤其是一种加密文档的检索方法、装置及系统


技术介绍

1、密文检索是云安全领域的一个新兴方向,在云存储中,需要保护文档、索引、查询请求的隐私,需要对三者进行加密。然而,当前信息检索技术所采用的查询方法几乎都基于明文,难以应用到密文状态的文档。因此,需要开辟针对密文的信息检索技术。密文检索即是加密状态下仍能进行信息检索的技术。密文检索领域的检索,必须在密文状态完成。

2、目前主要采用标准的布隆过滤器来进行检索,布隆过滤器存在不支持动态删除、哈希碰撞概率大、查询性能低、存储空间大等缺陷。

3、为了解决这一问题,提出了标准布谷鸟过滤器。布谷鸟过滤器是一个增强版的布隆过滤器,其通过增加维度、采用指纹替代布隆过滤器中存储的0和1等方式改进了布隆过滤器。布谷鸟过滤器可以删除元素,查询效率更高,空间利用率更高。布谷鸟过滤器中的哈希算法普遍采用sha256等常见的精确哈希算法。


技术实现思路

1、相关技术中,标准布谷鸟过滤器不具有模糊检索(也称模糊查询)功能,实用性很低。检索信息时本文档来自技高网...

【技术保护点】

1.一种加密文档的检索方法,包括:

2.根据权利要求1所述的方法,其中,根据所述相似程度和所述相关性分数,确定所述多个加密文档与所述第一关键字匹配的加密文档包括:

3.根据权利要求2所述的方法,其中,根据所述相似程度与所述相关性分数,确定所述多个加密文档与所述第一关键字的匹配得分包括:

4.根据权利要求2所述的方法,其中,与所述第一关键字匹配的加密文档包括所述多个加密文档中所述匹配得分最高的预设数量的加密文档。

5.根据权利要求1所述的方法,其中,每个加密文档的第二布谷鸟哈希表根据如下方式确定:

6.根据权利要求5所述的方法,其...

【技术特征摘要】

1.一种加密文档的检索方法,包括:

2.根据权利要求1所述的方法,其中,根据所述相似程度和所述相关性分数,确定所述多个加密文档与所述第一关键字匹配的加密文档包括:

3.根据权利要求2所述的方法,其中,根据所述相似程度与所述相关性分数,确定所述多个加密文档与所述第一关键字的匹配得分包括:

4.根据权利要求2所述的方法,其中,与所述第一关键字匹配的加密文档包括所述多个加密文档中所述匹配得分最高的预设数量的加密文档。

5.根据权利要求1所述的方法,其中,每个加密文档的第二布谷鸟哈希表根据如下方式确定:

【专利技术属性】
技术研发人员:黄子瑜汪来富刘东鑫邓博仁吴波
申请(专利权)人:中国电信股份有限公司技术创新中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1