利用哈希算法的搜索引擎服务制造技术

技术编号:7162335 阅读:390 留言:0更新日期:2012-04-11 18:40
一种使用搜索引擎通过哈希提供者由用户进行的安全搜索的安全搜索方法。用户向哈希提供者注册。哈希提供者向搜索引擎发送唯一编号、经加密结果数据库和哈希化的索引。用户输入至少一个要搜索的搜索项。用户对该搜索项进行哈希化,并连同唯一编号向搜索引擎发送该搜索项。搜索引擎基于该唯一编号来搜索和选择哈希化的索引和经加密结果数据库。将取自经加密结果数据库的经加密结果数据集发送至用户。用户对结果集进行解密。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及搜索引擎,并且更具体而言涉及使用哈希算法的搜索引擎。
技术介绍
运营web搜索引擎的组织基于个人输入到搜索引擎中的搜索项而取得大量关于个人的信息。搜索项揭示了个人日常活动、商业动向、个人思想。这种对个人的搜索的大规模且非常详细的积累导致许多隐私问题。某些搜索引擎已决定把向它们的搜索服务提供隐私增强作为其经营策略的一部分。现有的“隐私增强的”搜索引擎实现方式与大多数搜索引擎的不同之处在于它们不记录搜索项和结果,或者运营组织仅将记录保持一段最短的时间。然而,使用这种类型的实现方式,运营搜索引擎的组织仍然能够获得搜索项和结果。
技术实现思路
因此,本专利技术力图提供一种使用搜索引擎通过哈希提供者而由用户进行安全搜索的安全搜索方法。用户向哈希提供者注册。哈希提供者向搜索引擎发送唯一编号、经加密结果数据库以及哈希化的索引。用户输入要搜索的至少一个搜索项。用户将搜索项进行哈希化,并将该搜索项连同唯一编号发送至搜索引擎。搜索引擎基于该唯一编号搜索并选择哈希化的索引和经加密结果数据库。将取自经加密结果数据库的经加密结果数据集发送至用户。用户对结果集进行解密。附图说明现在将参考随附的附图,仅通过示例的方式,对本专利技术的实施方式进行描述,在附图中图1示出注册步骤的框图。图2至图3示出本专利技术的实施方式的搜索引擎组织的框图。 具体实施例方式图1至图3示出本专利技术的搜索引擎系统的框图。在本专利技术中,例如通过索引字对要搜索的搜索引擎数据应用哈希算法。当请求搜索时,也对用户所输入的搜索项进行哈希化,使得发送至搜索引擎的项目仅由用户知晓。此外,使用对称加密来对搜索引擎的结果进行加密,这同样仅允许用户知晓他们的搜索结果,从而允许私有且匿名的搜索。本专利技术的搜索引擎系统要求搜索引擎组织具有明确遵守责任划分的至少两个不同团体,例如两个完全独立的组织,比如哈希提供者和搜索提供者。哈希提供者提供并维持签约或注册,该签约或注册用于让用户可以通过经修改的客户端(诸如浏览器“附加”)取得盐值(salt)、加密密钥和临时唯一编号。该唯一编号也许本质上是临时性的并且在有限时段中是唯一的。注册可以通过便于即时用户注册的简单3方法来提供,并且根据用户所愿而多次进行。每次注册导致分配一组新的唯一 id编号、盐值和密钥。可以在散布的用户间重复使用盐值和密钥对。优选的是,仅交换便于注册以及注册用户的规律性到期所必要的最低信息量。注册用于向用户分配唯一盐值(或者随机字符串)和唯一加密密钥。哈希提供者通过创建搜索引擎数据的加盐的哈希来创建哈希化的数据集。这包括创建搜索索引中所使用的字(并非一定是整个词组或文档)的哈希。哈希提供者还可以执行收集和维护搜索引擎数据的功能,例如抓取网站并为其编制索引;或者也可以由向哈希提供者提供这一数据的另一组织来执行这些活动。哈希提供者还对URL以及搜索引擎作为结果或者结果数据库(例如页面描述和图像)而返回的其他数据进行对称加密。该加密密钥是先前向用户或用户组提供的加密密钥。所搜索的数据与作为结果而提供的数据被捆绑在一起,作为针对每个编入索引的页面的集合,而盐值和密钥也是集合且相互对应。举例而言,如果针对项目“户外”、“狗”和“屋舍”这些项目而对网页进行了索引, 则使用盐值η对这些字进行独立哈希化。该网页具有http Z/xyz. tld/doRhousel234/html 这一 URL以及“用钱能买到的最好的狗舍”这一描述。用密钥η来加密URL和描述。盐值 η和密钥η的集合捆绑在一起。另一独立团体,即搜索提供者,运营搜索引擎界面并维护针对哈希化的搜索引擎数据库执行哈希化的搜索项(字)的搜索的软件。哈希被视为字,被视为各自代表单个字, 因此无需新的或额外的搜索算法。搜索提供者和哈希提供者将永不知晓用户向搜索引擎提交了什么项目或者搜索结果如何。参考图1,用户在哈希提供者界面上进行注册100。哈希提供者生成101 —组盐值、 加密密钥以及唯一临时编号。哈希提供者准备102搜索引擎数据的索引(数据1),并使用算法或密码哈希函数 (fl)以及盐值,来对搜索引擎数据进行哈希化,以获得要针对用户的搜索项而搜索的搜索引擎数据的加盐的哈希化的索引(数据1’)。哈希提供者还准备102结果数据库(数据2) 并使用算法或对称加密函数( )以及密钥,来对结果数据库(数据幻进行加密,以获得对结果数据库中所提供的数据进行加密的经加密结果数据库(数据2’)。结果数据库优选地包括网站或图像的URL和简要描述。当遇到相关联的索引项目时,从结果数据库中选择出网站或图像的URL和简要描述。哈希提供者向用户发送103所述一组盐值、加密密钥和唯一编号,并且哈希提供者向搜索引擎发送104搜索引擎数据的哈希化的索引(数据1’)、经加密结果数据库(数据2’)以及所述唯一编号。一旦哈希化的索引(数据1’)、经加密结果数据库(数据2’)和唯一编号被发送 104至搜索提供者,用户即可将用户想在其中搜索的搜索项(字η)输入至经修改的客户端 (诸如,具有由搜索提供者维护的“附加件”或“插件”的web浏览器)之中。经修改的客户端将使用算法或密码哈希(Π)对搜索项(字η)与用户的盐值进行哈希化108,以获得(字 η’)。随后,经修改的客户端向搜索提供者所运营的搜索引擎界面提交110搜索项(字η’) 和唯一编号。搜索提供者所运营的搜索引擎接收哈希化的值(字η’),并且使用用户的唯一编号来选择112哈希化的索引(数据1’)以及对应的经加密结果数据库(数据2’)。搜索引擎在适当的哈希化的索引集中搜索114哈希化的搜索项(字n’),以从取自经加密结果数据库(数据2’)的经加密数据中提供经加密结果集(数据3’)。该经加密数据(数据3’) 继而发送118至用户。在用户接收120来自搜索引擎的数据3’之后,经修改的客户端对返回的经加密搜索结果数据3’进行解密122,并向用户展示IM解密的结果数据3。如果用户决定搜索126 额外的项目,则用户返回并输入106另一搜索。如果用户决定不搜索额外项目,则该方法结束ο优选地针对每个用户或者一组用户使用唯一的盐值。在能够非常迅速地对所有搜索引擎数据进行哈希化的前提下,可以针对每个(或几乎每个)搜索或会话生成新的盐值, 尽管这对于做到成功实现而言并非必需。如果不使用任何盐值,则实现将会是有缺陷的,这是因为搜索项可以被推断出来。哈希函数可以是任何迭代密码哈希函数。所得哈希的强度,例如原像抗性 (pre-image resistance),取决于所选哈希函数的特性。堪用的哈希算法的一个例子是 SHA-256安全哈希算法,该算法由美国国家安全局所设计,并由美国国家标准与技术研究院 (NIST)作为美国联邦信息处理标准发布。可以使用任何对称密钥加密算法。堪用的密钥算法的一个例子是由美国政府改编为一种加密标准的、具有1 或256比特密钥长度的高级加密标准(AES)。可以针对盐值和对称密钥二者使用相同的随机字符串,但不建议这样做,以防止有可能在相同的密钥被两个不同算法用于可能相关的内容时显露出密钥值的未来潜在攻击。哈希提供者与搜索提供者之间的职责分离应当如任何通常的职责分离(SOD)要求那样为可审计的。由哈希提供者向用户进行的密钥分发可以以自动的方式发生,经由SSL(安全套本文档来自技高网...

【技术保护点】
1.一种使用搜索引擎通过哈希提供者由用户进行的安全搜索的安全搜索方法,包括所述哈希提供者:生成一组盐值、加密密钥和唯一编号;使用所述盐值,准备搜索引擎数据的加盐的哈希化的索引;使用所述加密密钥,准备搜索引擎数据的经加密结果数据库;向所述用户发送所述一组盐值、加密密钥和唯一编号;以及向搜索引擎发送所述哈希化的索引、所述经加密结果数据库和唯一编号。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:B·格伯
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1