当前位置: 首页 > 专利查询>沈文策专利>正文

一种基于关键字查找信息的方法及系统技术方案

技术编号:13075187 阅读:64 留言:0更新日期:2016-03-30 10:48
本发明专利技术提供一种基于关键字查找文件的方法,包括只读数据库定时将最新的关键字及其数据发送至源服务器;源服务器将获取的关键字分别根据MD5算法编码为长度固定且唯一的字符串并顺序截取字符串的复数个字符依次生成相应的分级目录作为文件路径,同时顺序截取字符串上至少一半字符作为文件名并将数据序列化后保存在对应的文件;源服务器定时将更新的各关键字所在文件同步到复数台应用服务器上;用户在任一应用服务器上输入关键字搜索,应用服务器将搜索的关键字进行MD5算法编码为对应的字符串,按同样的字符串截取规则找到该关键字所在文件路径,并将文件返回给用户查看。本发明专利技术的优点是减少远程读取数据的消耗,提升用户体验并保证数据安全。

【技术实现步骤摘要】

本专利技术涉及计算机数据处理领域,更具体地说,涉及一种基于关键字查找信息的方法。
技术介绍
关键字匹配在计算机领域有着广泛的应用,它可用于数据处理、数据压缩、文本编辑、信息检索等。目前用户通过关键字查找信息的架构通常有两种方式:1、用户在本地服务器通过关键字查找信息,本地服务器向源服务器提出获取关键字请求,中间服务器再向数据库提出获取关键字请求,数据库收到请求后将与关键字相关的信息打包发送给源服务器,源服务器再将数据发送给本地服务器,最后返回给用户;2、用户直接向数据库请求与关键字相关的信息,由数据库返回数据;但是,这两种方式存在以下问题:1、用户每次向本地服务器请求查找,本地服务器都要向源服务器请求一次,源服务器再向数据库请求一次,如此远程往复,过程繁琐、消耗大,且数据库每次返回的数据都存储在源服务器上,需要时本地服务器才从源服务器上取数据,这样源服务器的数据压力会过大,且一旦本地服务器遭到黑客攻击,按此架构模式,源服务器和数据库都将依次被攻破,造成数据泄露,安全性低;2、用户直接向数据库请求的方式,若用户行为被黑客跟踪,数据库将被侵入,同样会产生数据泄漏问题。
技术实现思路
本专利技术要解决的技术问题之一,在于提供一种基于关键字查找信息的方法,通过源服务器定时将最新的关键字及其相关数据从只读数据库中读取,再将关键字相关数据有规则的生成文本文件,用户在应用服务器上搜索关键字时,应用服务器根据相同的规则进行匹配,从而快速定位到关键字所指向的文件,并把与关键字相关的所有数据信息发送给用户,大大减少了源服务器和应用服务器远程读取数据的消耗,应用服务器能快速索引到对应数据,提升了用户体验且保证数据的安全性。本专利技术之一是这样实现的:一种基于关键字查找信息的方法,包括如下步骤:步骤10、只读数据库定时将最新的关键字及其相关数据发送至源服务器;步骤20、源服务器将每次获取的不同关键字分别根据MD5算法(所述MD5算法是一种公知的散列算法)编码为长度固定且唯一的字符串,并顺序截取字符串上的复数个字符依次生成相应的分级目录,作为关键字及其相关数据存储的文件路径,同时顺序截取字符串上至少一半数量的字符作为文件名并将关键字的相关数据序列化后保存在该关键字对应的文件中;步骤30、源服务器定时将更新的各关键字对应的文件同步到复数台应用服务器上;步骤40、用户在任一应用服务器上输入关键字进行搜索,应用服务器接收到搜索的关键字后将该关键字进行MD5算法编码生成对应的字符串,按照源服务器上的字符串截取规则(所述字符串截取规则即步骤20中所述顺序截取字符串上的复数个字符依次生成相应的分级目录,作为关键字及其相关数据存储的文件路径)自动找到该关键字所在的文件路径,并将该关键字对应的文件返回给用户查看。较佳的,所述步骤20进一步具体为,顺序截取字符串的前四位字符依次生成第一级目录与第二级目录,且每两位字符对应一级目录,每级目录不超过256个文件夹。较佳的,所述应用服务器的数量至少为源服务器数量的两倍。较佳的,只读数据库定时接收写数据库发送的最新的关键字及其相关数据进行同步更新。本专利技术要解决的技术问题之二,在于提供一种基于关键字查找信息的系统,通过源服务器定时将最新的关键字及其相关数据从只读数据库中读取,再将关键字相关数据有规则的生成文本文件,用户在应用服务器上搜索关键字时,应用服务器根据相同的规则进行匹配,从而快速定位到关键字所指向的文件,并把与关键字相关的所有数据信息发送给用户,大大减少了源服务器远程读取数据的消耗,应用服务器能快速索引到对应数据,提升了用户体验且保证数据的安全性。本专利技术之二是这样实现的:一种基于关键字查找信息的系统,所述系统包括发送模块、接收处理模块、同步模块和搜索模块:所述发送模块:用于定时将最新的关键字及其相关数据发送至源服务器;所述接收处理模块:用于将每次获取的不同关键字分别根据MD5算法(所述MD5算法是一种公知的散列算法)编码为长度固定且唯一的字符串,并顺序截取字符串上的复数个字符依次生成相应的分级目录,作为关键字及其相关数据存储的文件路径,同时顺序截取字符串上至少一半数量的字符作为文件名并将关键字的相关数据序列化后保存在该关键字对应的文件中;所述同步模块:用于定时将更新的各关键字对应的文件同步到复数台应用服务器上;所述搜索模块:用于用户在任一应用服务器上输入关键字进行搜索时,应用服务器接收到搜索的关键字后将该关键字进行MD5算法编码生成对应的字符串,按照源服务器上的字符串截取规则(所述字符串截取规则即接收处理模块中所述顺序截取字符串上的复数个字符依次生成相应的分级目录,作为关键字及其相关数据存储的文件路径)自动找到该关键字所在的文件路径,并将该关键字对应的文件返回给用户查看。较佳的,所述接收处理模块执行顺序截取字符串的前四位字符依次生成第一级目录与第二级目录,且每两位字符对应一级目录。较佳的,所述应用服务器的数量至少为源服务器数量的两倍。较佳的,所述发送模块还包括更新单元,用于定时接收写数据库发送的最新的关键字及其相关数据到只读数据库进行同步更新。本专利技术具有如下优点:1、源服务器不再向数据库请求数据,而是由只读数据库定时将最新关键字及其相关数据发送给源服务器并进行规则化处理后再返回给应用服务器存储,这样用户每次搜索关键字时只需在应用服务器上直接查找本地数据,不用再由应用服务器向源服务器和数据库依次请求,减少了源服务器和应用服务器远程读取数据的消耗,加快了查找速度,提升了用户体验,且应用服务器与源服务器不用再与数据库交互,只负责接收和处理只读数据库发来的数据,有效防止非法入侵造成的数据泄漏,保证数据的安全性;2、截取关键字编码后生成的字符串前两位作为第一级目录,第三位和第四位作为第二级目录,减少目录数量,且按此分级方法,每级目录下最多只有256个文件夹,最大化地节省了存储空间,方便快速查找到相应的数据信息。【附图说明】下面参照附图结合实施例对本专利技术作进一步的说明。图1为本专利技术方法执行流程图。图2为本专利技术系统架构图。图3为本专利技术系统的模块连接示意图。【具体实施方式】请参阅图1,本专利技术一种基于关键字查找信息的方法,包括如下步骤:步骤10、只读数据库定时将最新的关键字及其相关数据发送至源服务器;步骤20、源服务器将每次获取的不同关键字分别根据MD5算法(所述MD5算法是一种公知的散列算法)编码为长度固定且唯一的字符串,并顺序截取字符串上的复数个字符依次生成相应的分级目录,作为关键字及其相关数据存储的文件路径,同时顺序截取字符串上至少一半数量的字符作为文件名并将关键字的相关数据序列化后保存在该关键字对应的文件中;步骤30、源服务器定时将更新的各关键字对应的文件同步到复数台应用服务器上;步骤40、用户在任一应用服务器上输入关键字进行搜索,应用服务器接收到搜索的关键字后将该关键字进行MD5算法编码生成对应的字符串,按照源服务器上的字符串截取规则(所述字符串截取规则即接收处理模块中所述顺序截取字符串上的复数个字符依次生成相应的分级目录,作为关键字及其相关数据存储的文件路径)自动找到该关键字所在的文件路径,并当前第1页1 2 本文档来自技高网...

【技术保护点】
一种基于关键字查找信息的方法,其特征在于:包括如下步骤:步骤10、只读数据库定时将最新的关键字及其相关数据发送至源服务器;步骤20、源服务器将每次获取的不同关键字分别根据MD5算法编码为长度固定且唯一的字符串,并顺序截取字符串上的复数个字符依次生成相应的分级目录,作为关键字及其相关数据存储的文件路径,同时顺序截取字符串上至少一半数量的字符作为文件名并将关键字的相关数据序列化后保存在该关键字对应的文件中;步骤30、源服务器定时将更新的各关键字对应的文件同步到复数台应用服务器上;步骤40、用户在任一应用服务器上输入关键字进行搜索,应用服务器接收到搜索的关键字后将该关键字进行MD5算法编码生成对应的字符串,按照源服务器上的字符串截取规则自动找到该关键字所在的文件路径,并将该关键字对应的文件返回给用户查看。

【技术特征摘要】

【专利技术属性】
技术研发人员:沈文策
申请(专利权)人:沈文策
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1