一种密文云数据查询方法技术

技术编号:10337793 阅读:101 留言:0更新日期:2014-08-20 20:21
本发明专利技术公开了一种密文云数据查询方法,包括:数据拥有者对其文件集构建二进制向量索引,并使用对称密码机制加密文件集,然后将加密文件集以及所有文件的二进制向量索引发送至云端。当某用户要求访问包含某些关键词的文件时,向数据拥有者申请查询令牌,查询令牌中包含有关键词集合。用户根据查询关键词与关键词集合构建查询二进制向量,并将查询二进制向量发送至云端。云端将查询二进制向量与每个文件的索引二进制向量进行内积计算以判断该文件是否包含用户的查询关键词。本发明专利技术能实现比目前广泛使用的倒排索引更高效的查询。

【技术实现步骤摘要】

本专利技术属于云存储和信息检索领域,具体涉及。
技术介绍
在云存储环境下,要保护用户数据机密性和隐私性,加密是一种常用的方法,但是数据加密后,密文数据检索问题亟待解决。为解决密文云数据检索问题,目前主要有两种典型的方法:一种是直接对密文进行线性搜索,即对密文中单词逐个进行比对,确认关键词是否存在以及出现的次数;第二种方法基于安全索引,即先对文档建立关键词索引,然后将文档和索引加密后上传至云端,搜索时从索引中查询关键词是否存在于某个文档中。直接对密文线性搜索的方法缺点在于搜索效率不高,且无法应对海量数据的搜索场景。基于索引的密文检索方法是目前的研究主流,原因是其查询效率更好,安全性能更高,适合用于大规模的云存储密文检索系统。基于索引的密文检索也可以分为两类:第一类是针对结构化的数据,以数据库为代表;第二类是针对非结构化的数据,以文件系统和Web网页内容为代表。在已有的研究工作中,所有方案都是采用倒排索引机制,还没有使用二进制向量索引的方案。采用二进制向量索引在数据拥有者端只需要保留较少的信息,就可以实现高效安全的密文数据检索。密文云数据查询是保证云存储中数据机密性和可检索性的关键技术,对于推进云存储的快速发展具有重要的理论意义和实用价值。
技术实现思路
针对现有技术的缺陷,本专利技术的目的在于提供,旨在提高数据查询效率与安全性。为实现上述目的,本专利技术提供了,包括以下步骤: 步骤1.数据拥有者对其文件集构建索引,使用二进制向量索引,即索引中每一位代表一个关键词,以O和I表示相应关键词是否存在于此文件中; 步骤2.数据拥有者使用对称密码机制加密文件集(可以基于单个文件或数据块); 步骤3.数据拥有者将加密文件集,所有文件的二进制向量索引发送至云端; 步骤4.用户要求访问包含某些关键词的文件时,向数据拥有者申请查询令牌,查询令牌中包含有关键词集合; 步骤5.用户根据查询关键词与关键词集合构建查询二进制向量,并将查询二进制向量发送至云端; 步骤6.云端将查询二进制向量与每个文件的索引二进制向量进行内积计算以判断该文件是否包含用户的查询关键词。步骤I具体包括以下子步骤:1.1数据拥有者使用已有的分词算法对其文件集提取关键词,构建关键词集合; 1.2数据拥有者根据每个文件中是否包含关键词集合中的对应关键词构建二进制向量索引,以I表示相应关键词存在于此文件中,以O表示相应关键词不存在于此文件中。步骤4具体包括以下子步骤: 4.1用户向数据拥有者发送查询授权申请,数据拥有者根据其安全策略决定是否向用户以及针对哪些文件集颁发授权令牌,令牌中包含有授权文件集的关键词集合; 4.2数据拥有者使用通用的安全传输机制将令牌发送给用户。步骤5中,构建查询二进制向量方法如下:用户根据查询关键词是否在关键词集合中构建查询二进制向量,以I表不相应关键词存在于关键词集合中,以O表不相应关键词不存在于关键词集合中。步骤6中,云端将查询二进制向量与每个文件的索引二进制向量进行内积计算,当内积计算结果为非O时,表明该文件包含查询关键词,当内积计算结果为O时,表明该文件不包含查询关键词。并且内积计算结果的值越大,表明包含的关键词越多。假设A是文档A的二进制索引向量,其中AC/] e {O, 1}表示关键词K是否在文档中存在W是一个查询向量,其屮(6[/] e {0,1}表示关键词~是否在查询关键词集合r中。文档A与查询关键词集合r的相似性得分通过内积方式计算出来,即rQ0 通过本专利技术所构思的以上技术方案,与现有技术相比,本专利技术具有以下的优势: 1.数据更新方便,建立索引的过程由数据拥有者完成,关键词集合信息由数据拥有者保管,当有文件需要更新时,数据拥有者只需要更新文件的二进制向量索引,并重新加密文件,然后将加密的文件以及二进制向量索引发送至云端。2.使用二进制向量内积计算非常高效,只需要在用户端增加少量的存储就可以实现闻效的检索。【附图说明】图1为本专利技术所涉及的各实体关系图。图2为本专利技术方法流程图。图3为本专利技术二进制向量索引图。【具体实施方式】为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。以下首先就本专利技术的技术术语进行解释和说明: 数据拥有者:指文件的拥有者,需要将文件存储在云中,且制定文件的访问控制策略; 用户:需要读取数据拥有者发布的文件; 云端或云存储:存储数据拥有者的文件,会忠实执行数据拥有者和合法用户发出的操作请求,但在条件允许时会偷窥文件内容; 文件:数据拥有者需要上传至云端的数据; 文件块:文件分块,数据拥有者对同一文件的不同分块采用不同的加密密钥;对称密码机制:是一种传统密码机制,加密和解密采用相同密钥,效率较高,在本专利技术中采用该机制加密文件或文件块; 对称密钥:对称密码机制中随机生成的二进制数据; 以下结合实施例和附图对本专利技术做进一步说明。 如图1所示,本专利技术的密文云数据查询方法是是应用在加密云存储系统中,该系统包括数据拥有者、用户以及云端。在本实施方式中,数据拥有者为某科研单位秘书,传至云端的数据是该单位的科研项目文件,主要用于单位内人员(包括有出差在外的人员)在项目申请以及开发过程中的数据共享。如图2所示,本专利技术的密文云数据查询方法包括以下步骤: 步骤1.数据拥有者对其文件集构建索引,使用二进制向量索引,即索引中每一位代表一个关键词,以O和I表示相应关键词是否存在于此文件中,如图3所示。本步骤具体包括以下子步骤: 1.1数据拥有者使用已有的分词算法对其文件集提取关键词,构建关键词集合; 举例而言,如图3所示,关键词集合{云计算,云存储,加密,数据检索,二进制向量}。1.2数据拥有者根据每个文件中是否包含关键词集合中的对应关键词构建二进制向量索引,以I表示相应关键词存在于此文件中,以O表示相应关键词不存在于此文件中。举例而言,如图3所示,文件I包含关键词{云计算,加密},其索引二进制向量为/7=(1,O, I, O, O),文件2包含关键词{云存储,加密,数据检索,二进制向量},其索引二进制向量为厶=(0,I, I, I, I)。步骤2.数据拥有者使用对称密码机制加密文件集(可以基于单个文件或数据块); 步骤3.数据拥有者将加密文件集,所有文件的二进制向量索引发送至云端; 步骤4.用户要求访问包含某些关键词的文件时,向数据拥有者申请查询令牌,查询令牌中包含有关键词集合。本步骤具体包括以下子步骤: 4.1用户向数据拥有者发送查询授权申请,数据拥有者根据其安全策略决定是否向用户以及针对哪些文件集颁发授权令牌,令牌中包含有授权文件集的关键词集合; 4.2数据拥有者使用通用的安全传输机制将令牌发送给用户。步骤5.用户根据查询关键词与关键词集合构建查询二进制向量,并将查询二进制向量发送至云端; 其中,构建查询二进制向量方法如下:用户根据查询关键词是否在关键词集合中构建查询二进制向量,以I表不相应关键词存在于关键词集合中,以O表不相应关键词不存在于关键词集合中。举例而言,设查询关键词为{云存储,数据检索},则查询二进制向量为= (O, I,O, I, 本文档来自技高网...

【技术保护点】
一种密文云数据查询方法,其特征在于,包括以下步骤:步骤1. 数据拥有者对其文件集构建索引,使用二进制向量索引,即索引中每一位代表一个关键词,以0和1表示相应关键词是否存在于此文件中;步骤2. 数据拥有者使用对称密码机制加密文件集(可以基于单个文件或数据块);步骤3. 数据拥有者将加密文件集,所有文件的二进制向量索引发送至云端;步骤4. 用户要求访问包含某些关键词的文件时,向数据拥有者申请查询令牌,查询令牌中包含有关键词集合;步骤5. 用户根据查询关键词与关键词集合构建查询二进制向量,并将查询二进制向量发送至云端;步骤6. 云端将查询二进制向量与每个文件的索引二进制向量进行内积计算以判断该文件是否包含用户的查询关键词。

【技术特征摘要】
1.一种密文云数据查询方法,其特征在于,包括以下步骤: 步骤1.数据拥有者对其文件集构建索引,使用二进制向量索引,即索引中每一位代表一个关键词,以O和I表示相应关键词是否存在于此文件中; 步骤2.数据拥有者使用对称密码机制加密文件集(可以基于单个文件或数据块); 步骤3.数据拥有者将加密文件集,所有文件的二进制向量索引发送至云端; 步骤4.用户要求访问包含某些关键词的文件时,向数据拥有者申请查询令牌,查询令牌中包含有关键词集合; 步骤5.用户根据查询关键词与关键词集合构建查询二进制向量,并将查询二进制向量发送至云端; 步骤6.云端将查询二进制向量与每个文件的索引二进制向量进行内积计算以判断该文件是否包含用户的查询关键词。2.根据权利要求1所述的密文云数据查询方法,其特征在于,步骤I具体包括以下子步骤: 1.1数据拥有者使用已有的分词算法对其文件集提取关键词,构建关键词集合; 1.2数据拥有者根据每个文件中是否包含关键词集合中的对应关键词构建二进制向量索引,以I表示相应关键词存在于此文件中,以O表示相应关键词不存在于此文件中。3.根据权利要求1所述的密文云数据查询方法,其特征在于,步骤2中,如果是基于单个文件加密,数据拥有者根据文件集中文件数量,利用对称密码机制随机生成对应数目的对称密钥,并利用对称密钥对文件进行加密生成密文,每个文件的加密密钥均不同;如果是基于数据块加密,数据拥有者根据设定数据块大小将文件集中文件进行分块,利用对称密码机制随机生成对应数目的对称密钥,并利用对称密钥对数据块进行加密生成密文,每个数据块的加密密钥均不同。4.根据权利要求1所述的密文云数据查询方法,其特征在于...

【专利技术属性】
技术研发人员:陈兰香
申请(专利权)人:福建师范大学
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1