一种上下文增强的语义可搜索加密方法及系统技术方案

技术编号:44935807 阅读:48 留言:0更新日期:2025-04-12 01:13
本发明专利技术公开了一种上下文增强的语义可搜索加密方法及系统。本方法为:1)使用已标注的查询‑文档对数据训练所选模型,得到最优模型并部署在客户端;2)客户端生成密钥,利用最优模型为待上传的文档生成文档向量表示h<subgt;d</subgt;,然后利用密钥对h<subgt;d</subgt;进行加密,得到加密后的文档向量并上传至服务器端;3)服务器端存储文档向量并构建对应的索引I;4)客户端通过最优模型对输入的查询生成查询向量表示h<subgt;q</subgt;,然后使用密钥对h<subgt;q</subgt;进行加密,得到最终加密后的查询陷门T<subgt;q</subgt;并上传至服务器端;5)服务器端计算查询陷门T<subgt;q</subgt;与索引I之间的相似度分数,选择分数最高的前k个结果返回给客户端。本发明专利技术不仅保证了搜索的准确率,而且提高了数据安全性。

【技术实现步骤摘要】

本专利技术属于信息安全,涉及一种上下文增强的语义可搜索加密方法及系统


技术介绍

1、云存储技术凭借其高效和便捷的显著优势,已经作为数据存储的主流技术得到广泛采用。因此,越来越多的数据所有者选择将其数据外包给云服务器。然而,云服务器往往是"诚实但好奇"的,它正确地执行其检索职责,但也试图通过推断和分析其存储中的数据(包括索引)和协议期间接收的消息流来获取隐私信息。为了保护数据的隐私安全,数据所有者在外包给云之前应该对数据进行加密。这反过来又使得像搜索加密数据这样的数据利用成为一个具有挑战性的问题。

2、为了实现加密数据的安全搜索,song等人首次提出了可搜索加密的概念。从那时起,可搜索加密备受关注,诸多可搜索加密方案被提出。可搜索加密方案通常包括五个基本步骤:文档特征提取、可搜索索引构造、查询陷门生成、基于陷门的索引搜索以及搜索结果返回。传统的可搜索加密方案只支持查询关键词的精确匹配,会导致搜索结果不完整或无法完全满足用户的查询请求。同样的意思可以用不同的词语来表达,比如“北京大学”和“北大”,如果用户查询关键词为“北京大学”,则包含“北大”的本文档来自技高网...

【技术保护点】

1.一种上下文增强的语义可搜索加密方法,其步骤包括:

2.根据权利要求1所述的方法,其特征在于,所选模型为基于Transformer的预训练语言模型。

3.根据权利要求1或2所述的方法,其特征在于,每一个训练数据包含一个查询-文档对及其对应的标签信息;利用所述训练数据训练所选模型过程中,通过计算对比损失来最小化查询和相关文档间的距离,通过对比学习的方式来优化查询向量表示、文档向量表示,使得查询与相关文档间距离越近、与不相关文档距离越远。

4.根据权利要求1所述的方法,其特征在于,服务器端将加密的文档向量Enc(hd)存储在开源向量数据库FAISS中。<...

【技术特征摘要】

1.一种上下文增强的语义可搜索加密方法,其步骤包括:

2.根据权利要求1所述的方法,其特征在于,所选模型为基于transformer的预训练语言模型。

3.根据权利要求1或2所述的方法,其特征在于,每一个训练数据包含一个查询-文档对及其对应的标签信息;利用所述训练数据训练所选模型过程中,通过计算对比损失来最小化查询和相关文档间的距离,通过对比学习的方式来优化查询向量表示、文档向量表示,使得查询与相关文档间距离越近、与不相关文档距离越...

【专利技术属性】
技术研发人员:李波唐梓昕樊海慧古晓艳周江马晖
申请(专利权)人:中国科学院信息工程研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1