基于逐字索引的密文检索方法技术

技术编号:4094989 阅读:312 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于逐字索引的密文检索方法,在基表中建立字符类型的加密属性的逐字索引信息,逐字索引信息由对加密属性的明文逐字加密后选取的部分字符构成,检索中,首先将涉及加密属性的原始检索条件转换为涉及该加密属性的逐字索引信息的中间检索条件,利用中间检索条件在基表中进行初步检索,最后利用原始检索条件在中间解密结果中进行精确检索。本发明专利技术可以在不解密的情况下对密文属性的内容进行预检索,得到准确率较高的中间结果集,这种方法降低了对中间结果集的解密开销,具有较高的检索性能。

【技术实现步骤摘要】

本专利技术属于计算机中的数据库应用
,具体地说,是对加密后的字符类型 数据进行高效检索的一种方法。
技术介绍
外包数据库是一种新兴的数据管理模式。在这种模式下,企业或用户把数据存放 在数据库服务提供商(Database Service Provider,简称DSP)端,通过互联网使用数据,从 而降低数据管理及维护的开销。但是,由于数据库存放在DSP端,对于其中敏感和重要的文 档数据,出于安全考虑,通常需要进行加密处理。加密后的密文文档数据由于失去了明文的 原有特征,必须采用专门的密文检索技术对其进行检索。现有的密文检索技术可分为两类, 一类是无索引密文检索技术,另一类是基于索引的密文检索技术。无索引密文检索技术的实现方法是对查询语句按其检索条件进行重构,将其分 为对明文属性的检索和对密文属性的检索两部分,先执行对明文属性的检索,筛选出符合 条件的中间结果集,然后对中间结果集中的记录进行解密,再在解密后的中间结果集上执 行对密文属性的检索,得到最终的结果集。这种方法的缺陷是,对密文属性的检索必须在中 间结果集解密后才能进行,导致中间结果集规模较大,对中间结果集的解密操作的开销也 相应增大,因此查询语句的检索效率偏低。基于索引的密文检索技术的实现方法是预先对密文属性按一定方式建立索引, 使系统能够利用该索引在不解密的前提下先对密文属性进行一次粗略的预检索,缩小中间 结果集的规模,然后再在解密后的中间结果集上执行精确检索,得到最终的结果集。这种方 法下,中间结果集的规模被预先缩小了,解密操作的开销也相应减小,因此检索效率更高。 但是,现有的基于索引的密文检索技术大多只能处理数值类型的数据,而对于字符类型的 文档数据,尚缺少高效的密文检索方法。
技术实现思路
本专利技术的目的在于提出一种,针对字符类型数据的 特点,具有较高的检索性能。,涉及基表,基表包含有字符类型的加密属性,以及 加密属性的逐字索引信息;加密属性的逐字索引信息获取方式为对加密属性的明文按字 符逐个加密,得到每个字符的密文字符串,从每个密文字符串中选取k个字符依次连接组 成逐字索引字符串,k小于等于采用的加密算法对密文字符串限定的最小长度;检索方法具体为(1)检索条件变换在涉及加密属性的原始检索条件中,匹配字符串Sl包括普通 字符和通配符,采用与上述逐字索引信息获取中相同的加密和字符选取方式对Sl中的普 通字符进行加密和选取字符,用选取的字符替换Si中的对应普通字符,同时检索条件中涉 及到的加密属性转换为该加密属性的逐字索引信息,形成中间检索条件;(2)初步检索利用中间检索条件在基表中进行初步检索,得到中间检索结果;(3)精确检索对中间检索结果的各条记录中的加密属性进行解密,最后利用原 始检索条件在解密结果中进行精确检索。本专利技术为字符类型的密文属性建立了一种逐字索引,可以在不解密的情况下对密 文属性的内容进行预检索,得到准确率较高的中间结果集。这种方法降低了对中间结果集 的解密开销,具有较高的检索性能。具体实施例方式本专利技术中的逐字索引是一种为字符类型的密文属性创建的,用于在不解密的情况 下快速检索该属性内容的索引信息。下面结合实施例对本专利技术作进一步的描述,但该实施 例不应理解为对本专利技术的限制。本专利技术按以下步骤实施在数据库中创建包含属性Al,A2,A3的基本表Tablel,定义Al,A2的数据类型为 字符类型(如char、varchar、text、clob等),A3的数据类型为整数类型,并插入若干条记 录。此时Tablel中的数据信息如表1所示。表本文档来自技高网
...

【技术保护点】
基于逐字索引的密文检索方法,涉及基表,基表包含有字符类型的加密属性以及加密属性的逐字索引信息;加密属性的逐字索引信息获取方式为:对加密属性的明文按字符逐个加密,得到每个字符的密文字符串,从每个密文字符串中选取k个字符依次连接组成逐字索引字符串,k小于等于采用的加密算法对密文字符串限定的最小长度;检索方法具体为:(1)检索条件变换:在涉及加密属性的原始检索条件中,匹配字符串S1包括普通字符和通配符,采用与上述逐字索引信息获取中相同的加密和字符选取方式对S1中的普通字符进行加密和选取字符,用选取的字符替换S1中的对应普通字符,同时检索条件中涉及的加密属性转换为该加密属性的逐字索引信息,形成中间检索条件;(2)初步检索:利用中间检索条件在基表中进行初步检索,得到中间检索结果;(3)精确检索:对中间检索结果的各条记录中的加密属性进行解密,最后利用原始检索条件在解密结果中进行精确检索。

【技术特征摘要】
基于逐字索引的密文检索方法,涉及基表,基表包含有字符类型的加密属性以及加密属性的逐字索引信息;加密属性的逐字索引信息获取方式为对加密属性的明文按字符逐个加密,得到每个字符的密文字符串,从每个密文字符串中选取k个字符依次连接组成逐字索引字符串,k小于等于采用的加密算法对密文字符串限定的最小长度;检索方法具体为(1)检索条件变换在涉及加密属性的原始检索条件中,匹配字符串S1包括普通字符和通...

【专利技术属性】
技术研发人员:张黎敏冯源周淳张青林
申请(专利权)人:武汉达梦数据库有限公司
类型:发明
国别省市:83[中国|武汉]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1