【技术实现步骤摘要】
一种基于词向量的多关键字密文存储、检索方法及系统
本专利技术属于密文检索领域,尤其涉及一种基于词向量的多关键字密文存储、检索方法及系统。
技术介绍
在互联网应用迅猛发展的推动下,用户对存储容量的要求日益提高,因此越来越多的企业或个人(即数据拥有者)会选择将数据存储在云服务器上,以节约本地存储空间。在此过程中,为了保证数据的安全性,数据拥有者会先对数据进行加密,之后再将其上传至云服务器。加密后的数据将失去灵活性,若用户想要从大量加密数据中获取所需数据,就需要将云服务器上全部数据下载解密后才可获得。这样获取相关数据的效率非常低,为解决此问题,研究者们提出了密文检索技术。密文排序检索技术是密文检索技术的延续,在模糊检索的基础上,提高了密文检索的准确性。从查询关键字数量的角度,可将密文排序检索方法分为单关键字密文排序方法和多关键字密文排序方法(Multi-KeywordRankedSearch)。MRSE方法(Multi-KeywordRankedSearchoverEncryptedCloudData)是多关键字密 ...
【技术保护点】
1.一种基于词向量的多关键词密文存储方法,其步骤包括:/n1)数据拥有者依据安全参数n,随机生成的一n+1维的二元分割向量s及两个(n+1)×(n+1)维的第一可逆矩阵M
【技术特征摘要】
1.一种基于词向量的多关键词密文存储方法,其步骤包括:
1)数据拥有者依据安全参数n,随机生成的一n+1维的二元分割向量s及两个(n+1)×(n+1)维的第一可逆矩阵M1及第二可逆矩阵M2,组成索引密钥SK=(s,M1,M2),n≥10;
2)分别从明文文档集的每一明文文档中抽取m个关键词,将各明文文档的m个关键词输入模型,得到各明文文档的m个n维关键词词向量,其中获取模型的方法包括将样本关键词集输入word2vec工具进行训练;
3)将每一关键词词向量的维度由n维扩展到n+1维,得到各明文文档的明文索引;
4)依据索引密钥及各明文索引,计算各明文文档的密文索引,并通过生成的一加密解密公私钥对,得到各明文文档的加密文档;
5)上传各密文索引及加密文档至云服务器,将索引密钥、解密私钥及训练得到的模型参数发送至数据使用者。
2.如权利要求1所述的方法,其特征在于,通过以下策略将每一关键词词向量的维度由n维扩展到n+1维:
1)每一关键词词向量的前n维保持不变;
2)计算关键词词向量的n+1维,即cw′j[n+1]=-0.5||cwj||2,cw为关键词词向量,j∈{1,2,…,m}。
3.如权利要求2所述的方法,其特征在于,通过以下步骤计算该明文文档的密文索引:
1)使用二元分割向量s将明文索引分割为第一明文索引与第二明文索引;
2)通过第一可逆矩阵M1及第二可逆矩阵M2对第一明文索引与第二明文索引分别加密,得到包含第一密文索引与第二密文索引的密文索引。
4.如权利要求3所述的方法,其特征在于,通过以下策略将明文索引分割为第一明文索引与第二明文索引:
1)若s[l]=1,则d′i[t][l]+d″i[t][l]=di[t][l],s[l]为第l维度的二元分割向量,di[t][l]为第i明文文档第t个关键词第l维度的明文索引,d′i[t][l]为第i明文文档第t个关键词第l维度的第一明文索引,d″i[t][l]为第i明文文档第t个关键词第l维度的第二明文索引,t∈{1,2,…,m},l∈{1,2,…,n,n+1},i∈{1,2,…,k},k为明文文档集中明文文档的数量;
2)若s[l]=0,则d′i[t][l]=d″i[t][l]=di[t][l]。
5.一种基于词向量的多关键词密文检索方法,其步骤包括:
1)数据使用者将x个查询关键词输入数据拥有者训练的模型中,得到x个n维查询关键词词向量;
2)将每一查询关键词词向量的维度由n维扩展到n+1维,得到查询索引;
3)根据接收的索引密钥SK=(s,M1,M2)及查询索引,生成陷门,并将陷门上传至云服务器;
4)云服务器根据陷门及通过权利要求1-5中任一方法得到的各加密文档的密文索引,计算查询关键词与各加密文档的相关度,并将相关度最高的若干加密文档返回至数据使用者;
5...
【专利技术属性】
技术研发人员:韩光,田宝松,许彩云,杨杨,兰静,哈兰,崔永进,
申请(专利权)人:中国软件与技术服务股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。