【技术实现步骤摘要】
本专利技术属于信息安全,涉及一种上下文增强的语义可搜索加密方法及系统。
技术介绍
1、云存储技术凭借其高效和便捷的显著优势,已经作为数据存储的主流技术得到广泛采用。因此,越来越多的数据所有者选择将其数据外包给云服务器。然而,云服务器往往是"诚实但好奇"的,它正确地执行其检索职责,但也试图通过推断和分析其存储中的数据(包括索引)和协议期间接收的消息流来获取隐私信息。为了保护数据的隐私安全,数据所有者在外包给云之前应该对数据进行加密。这反过来又使得像搜索加密数据这样的数据利用成为一个具有挑战性的问题。
2、为了实现加密数据的安全搜索,song等人首次提出了可搜索加密的概念。从那时起,可搜索加密备受关注,诸多可搜索加密方案被提出。可搜索加密方案通常包括五个基本步骤:文档特征提取、可搜索索引构造、查询陷门生成、基于陷门的索引搜索以及搜索结果返回。传统的可搜索加密方案只支持查询关键词的精确匹配,会导致搜索结果不完整或无法完全满足用户的查询请求。同样的意思可以用不同的词语来表达,比如“北京大学”和“北大”,如果用户查询关键词为“北京大学
...【技术保护点】
1.一种上下文增强的语义可搜索加密方法,其步骤包括:
2.根据权利要求1所述的方法,其特征在于,所选模型为基于Transformer的预训练语言模型。
3.根据权利要求1或2所述的方法,其特征在于,每一个训练数据包含一个查询-文档对及其对应的标签信息;利用所述训练数据训练所选模型过程中,通过计算对比损失来最小化查询和相关文档间的距离,通过对比学习的方式来优化查询向量表示、文档向量表示,使得查询与相关文档间距离越近、与不相关文档距离越远。
4.根据权利要求1所述的方法,其特征在于,服务器端将加密的文档向量Enc(hd)存储在开源向量数
...【技术特征摘要】
1.一种上下文增强的语义可搜索加密方法,其步骤包括:
2.根据权利要求1所述的方法,其特征在于,所选模型为基于transformer的预训练语言模型。
3.根据权利要求1或2所述的方法,其特征在于,每一个训练数据包含一个查询-文档对及其对应的标签信息;利用所述训练数据训练所选模型过程中,通过计算对比损失来最小化查询和相关文档间的距离,通过对比学习的方式来优化查询向量表示、文档向量表示,使得查询与相关文档间距离越近、与不相关文档距离越...
【专利技术属性】
技术研发人员:李波,唐梓昕,樊海慧,古晓艳,周江,马晖,
申请(专利权)人:中国科学院信息工程研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。