安全索引的关键字搜索系统及建立该系统的方法技术方案

技术编号:10914515 阅读:143 留言:0更新日期:2015-01-14 20:28
本发明专利技术公开了一种安全索引的关键字搜索系统及建立该系统的方法,该系统包含索引伺服器与代理伺服器。索引伺服器包含复数个子索引模块以及散列模块,散列模块用以对至少一个原始档案的至少一个关键字进行散列并分割为复数个关键字散列值片段,并将每一个关键字散列值片段分别储存至子索引模块之一中。代理伺服器包含搜索模块,搜索模块接收搜索字后,利用散列模块对搜索字进行散列并分割为复数个搜索字散列值片段,并将每一个搜索字散列值片段分别传送至子索引模块之一中,其中子索引模块基于搜索字散列值片段搜索关键字散列值片段后,回传原始档案中相匹配的至少一个匹配档案。

【技术实现步骤摘要】
安全索引的关键字搜索系统及建立该系统的方法
本专利技术涉及一种搜索系统,尤其涉及一种安全索引的搜索系统。
技术介绍
随着网络通讯产业的发展,云端技术的应用也日趋广泛,云端储存装置已渐渐成为民众或一般企业储存及备份资料的主流设备,将资料由过去固定式硬盘移至云端储存装置不但可减少个人或企业在储存设备上的花费,且不会受限于场地及时间,通过网络连线即可取得所需的资料。企业可通过将大量资料由公司的内部储存装置移至云端储存装置,减少企业在储存装置上的开销并降低设备购置与运行的成本,云端储存设备还可作为大量资料的沟通媒介,使企业运行时大量资料的传输更为便捷,仅需将资料传输至云端储存设备上即可供分处各地的分部存取,另外比起过去当多人同时需要一份文件时需准备多份复制文件且无法同时得知各备份的修改状况,云端储存装置中的文件可供多人存取与使用且不需多余的复制文件,能有效节省资料文件沟通的花费。利用电脑处理含有重要信息的文件时,信息安全一直是相当重要的课题,在云端装置上尤其如此,使用者并不希望储存的文件及其信息有不必要的公开,为避免文件在网际网络传输时遭受不明人士获取,或是由于遭到黑客入侵导致资料外流,提供服务的伺服器端多会将文件加密以确保在传送及储存时的信息安全性,但由于加密与解密的行为常需依赖特定密钥且密钥为各文件所属不可外流的重要信息,导致当储存在云端装置的密文文件有搜索需求时,伺服器端无法在密文文件直接进行搜索,而需先将文件解密以还原成明文后才可对文件内容进行搜索,如此一来便失去当初文件储存的安全性,欲窃取资料的人可通过送出搜索需求,在伺服器端将密文文件还原成明文文件时窃取欲取得的信息,且无需费心破解密钥。此外,为增加搜索效率,搜索系统多采用建立索引值的方式,根据分析文件的特性给予对应的索引值,并通过搜索索引值取得所需信息,但在加密搜索的情况下,此索引值的分布趋势恰好反应出被搜索信息的特征分布,使得搜索程序失去信息保密性,欲窃取资料的人可通过不停送出特定涵义的搜索信息,试探索引值的分布趋势以分析被搜索信息的特征。因此,如何对加密后的文件进行搜索,且不因追求搜索效率而破坏整体资料的安全性,以提供使用者安全便利的搜索系统,已成为当前相关领域亟需改进的目标。
技术实现思路
有鉴于此,本专利技术的目的为提出一种安全索引的关键字搜索系统,借以改善现行系统的安全性问题。依据本专利技术的一实施例,一种安全索引的关键字搜索系统包含索引伺服器与代理伺服器,代理伺服器与索引伺服器相连接。索引伺服器包含复数个子索引模块以及散列模块,散列模块用以对至少一个原始档案的至少一个关键字进行散列并分割为复数个关键字散列值片段,并将每一个关键字散列值片段分别储存至子索引模块之一中。代理伺服器包含搜索模块,搜索模块接收搜索字后,利用散列模块对搜索字进行散列并分割为复数个搜索字散列值片段,并将每一个搜索字散列值片段分别传送至子索引模块之一中,其中子索引模块基于搜索字散列值片段搜索关键字散列值片段后,回传原始档案中相匹配的至少一个匹配档案。依据本专利技术的一实施例,一种建立安全索引的关键字搜索系统的方法包含下列步骤:对至少一个原始档案的至少一个关键字进行散列并分割为复数个关键字散列值片段。将每一个关键字散列值片段分别储存至复数个子索引模块之一中。接收搜索字。对搜索字进行散列并分割为复数个搜索字散列值片段。分别传送每一个搜索字散列值片段至子索引模块之一中。基于搜索字散列值片段搜索关键字散列值片段,并回传原始档案中相匹配的至少一个匹配档案。在上述的实施例中,由于代理伺服器与索引伺服器为独立运行的伺服器,无法得知彼此的内部运行方式,且配合散列模块进行的散列演算,能够在确保信息安全性的状况下,将密文文件直接进行搜索,并通过采用复数个子索引模块的机制,将过去建立索引值时可能透露的索引值分布趋势抚平,使窃取资料的人无法通过试探索引值的分布趋势分析被搜索信息的特征。附图说明为让本专利技术的上述和其他目的、特征、优点与实施例能更明显易懂,附图说明如下:图1是依照本专利技术一实施例的一种安全索引的关键字搜索系统的框图。图2是依照本专利技术一实施例的一种建立安全索引的关键字搜索系统方法的流程图。图3是依照本专利技术一实施例的一种安全索引的关键字搜索系统方法的流程图。具体实施方式以下将以附图详细说明本专利技术的精神,任何所属
中具有通常知识的人员在了解本专利技术的较佳实施例后,当可由本专利技术所教示的技术加以改变及修饰,其并不脱离本专利技术的精神与范围。另一方面,众所周知的元件与步骤并未在实施例中描述,以避免对本专利技术造成不必要的限制。请参照图1,其为依照本专利技术一实施例的一种安全索引的关键字搜索系统的框图。安全索引的关键字搜索系统包含代理伺服器100、索引伺服器200与储存伺服器300,代理伺服器100与索引伺服器200和储存伺服器300相连接。代理伺服器100为使用者提供操作平台,可用来接收使用者上传的原始档案、供使用者输入搜索字、显示匹配档案以及为使用者提供相关的操作功能,储存伺服器300用来储存加密后的原始档案,由索引伺服器200基于多个原始档案建立搜索架构,以提供搜索服务,索引伺服器200可基于代理伺服器100接收的搜索字,搜索原始档案中的关键字以回传原始档案中具有相匹配字句的匹配档案。代理伺服器100、索引伺服器200与储存伺服器300可为专业的伺服器机台、个人电脑主机或是其他具备运算能力的装置,伺服器可由具有不同权限的管理者管理,不具备适当权限者即无法登入、查询或使用其提供的功能,伺服器间彼此为独立运行,无法得知其他伺服器内部的运行机制,设置时还可以将其实体机器放置于不同位置,增加欲窃取资料者破解时的复杂程度。代理伺服器100可接收多位使用者上传的原始档案,代理伺服器100在接收使用者上传的原始档案后,加密此原始档案,并将加密后的原始档案储存至储存伺服器300,代理伺服器100可利用上传的使用者名称与登入密码,或是其他与上传使用者相关的信息,作为加密的密钥,并通过信息安全演算法将原始档案加密,以保存完整的原始档案并同时维持其信息安全性。索引伺服器200包含复数个子索引模块与散列模块220。在本专利技术的一实施例中,复数个子索引模块为第一子索引模块210、第二子索引模块212、第三子索引模块214与第四子索引模块216,但子索引模块的数量不以此为限。散列模块220用来对至少一个原始档案中至少一个关键字进行散列,以产生固定长度(即包含固定的字节数量)的关键字散列值,散列模块220将关键字散列值分割为与子索引模块数量相同的复数个关键字散列值片段,分割方式可依据任一规则但需对所有关键字采用相同的分割方式,散列模块220依据关键字散列值片段在关键字散列值中的位置顺序,将每一个关键字散列值片段分别储存至对应的子索引模块之一中。在本专利技术的一实施例中,散列模块220将关键字进行散列后产生长度为三十二个字节的关键字散列值,散列模块220将此关键字散列值分割为四个相同长度的关键字散列值片段,每个关键字散列值片段长度为八个字节,依据每个关键字散列值片段在关键字散列值中的位置顺序,将第一个关键字散列值片段(即第一到八个字节)储存至第一子索引模块210中,将第二个关键字散列值片段储存至第二子索引模块212中,将第三个关键字散列值本文档来自技高网
...
安全索引的关键字搜索系统及建立该系统的方法

【技术保护点】
一种安全索引的关键字搜索系统,其特征在于,包含:索引伺服器,其包含:复数个子索引模块;以及散列模块,其用以对至少一个原始档案的至少一个关键字进行散列并分割为复数个关键字散列值片段,并将每一个上述这些关键字散列值片段分别储存至上述这些子索引模块之一中;以及代理伺服器,其连接于上述索引伺服器,其中该代理伺服器包含:搜索模块,其在接收搜索字后,利用上述散列模块对该搜索字进行散列并分割为复数个搜索字散列值片段,并将每一个上述这些搜索字散列值片段分别传送至上述这些子索引模块之一中,其中上述这些子索引模块基于上述这些搜索字散列值片段搜索上述这些关键字散列值片段后,回传上述至少一个原始档案中相匹配的至少一个匹配档案。

【技术特征摘要】
1.一种安全索引的关键字搜索系统,其特征在于,包含:索引伺服器,其包含:复数个子索引模块;以及散列模块,其用以对至少一个原始档案的至少一个关键字进行散列并分割为复数个关键字散列值片段,并将每一个上述复数个关键字散列值片段分别储存至上述复数个子索引模块之一中;以及代理伺服器,其连接于上述索引伺服器,其中该代理伺服器包含:搜索模块,其在接收搜索字后,利用上述散列模块对该搜索字进行散列并分割为复数个搜索字散列值片段,并将每一个上述复数个搜索字散列值片段分别传送至上述复数个子索引模块之一中,其中上述复数个子索引模块基于上述复数个搜索字散列值片段搜索上述复数个关键字散列值片段后,回传上述至少一个原始档案中相匹配的至少一个匹配档案。2.如权利要求1所述的安全索引的关键字搜索系统,其特征在于,还包含:储存伺服器,其连接于所述代理伺服器,其中所述代理伺服器接收所述原始档案后,加密所述原始档案并储存加密后的所述原始档案至上述储存伺服器。3.如权利要求2所述的安全索引的关键字搜索系统,其特征在于,所述索引伺服器包含:识别码对应模块,其用以依据所述复数个关键字散列值片段所属的所述原始档案,以及代表所述原始档案的识别码,在所述复数个子索引模块中将每一个所述复数个关键字散列值片段与其所属的所述原始档案的该识别码建立对应关系。4.如权利要求3所述的安全索引的关键字搜索系统,其特征在于,所述索引伺服器包含:识别码交集模块,其用以将每一个所述复数个子索引模块搜索到的每一个所述复数个关键字散列值片段,通过所述对应关系取得所述识别码,并回传所述复数个子索引模块交集的所述识别码至所述代理伺服器。5.如权利要求4所述的安全索引的关键字搜索系统,其特征在于,所述代理伺服器包含:档案取得模块,其基于所述识别码从所述储存伺服器取得加密后的所述原始档案;以及档案解密模块,其用以将加密后的所述原始档案解密,并回传解密后的所述原始档案作为所述匹配档案。6.如权利要求1所述的安全索引的关键字搜索系统,其特征在于,所述代理伺服器还包含:关键字加密模块,其用以依据所述关键字的属性,及该属性预先设定的属性密钥,加密所述关键字,供所述散列模块进行散列并分割。7.如权利要求6所述的安全索引的关键字搜索系统,其特征在于,所述代理伺服器包含:搜索字加密模块,其用以在所述搜索模块取得所述搜索字后,依据所述搜索字预先设定的所述属性密钥,加密所述搜索字,供所述散列模块进行散列并分割。8.一种建立安全索引的关键字...

【专利技术属性】
技术研发人员:陈志鸿李志玮
申请(专利权)人:一零四资讯科技股份有限公司
类型:发明
国别省市:中国台湾;71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1