一种海量数据信息检索系统及其方法技术方案

技术编号:6866526 阅读:213 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种海量数据信息检索系统及其方法,其包括终端层、数据服务层、数据缓存服务层和数据存储服务层,所述数据缓存服务层包括检索结果缓存层和关键字检索缓存层,数据缓存服务层提供数据缓存服务进行关键词比对以加快系统检索效率,从而加快对海量数据的检索速度。

【技术实现步骤摘要】

本专利技术涉及信息检索系统领域,特别涉及。
技术介绍
信息检索系统是一种利用计算机设备对信息资料进行收集、编辑、管理和检索的系统。在当今信息爆炸的时代,每个单位或个人都在为信息的快速增长做出了各种贡献。 信息的种类也在不断的扩展,越来越多的非结构化信息不断出现,包括企业的各种报表、帐单、电子文档、网站的各种元素、图片、传真、扫描影像,以及大量的多媒体的音频、视频信息等等。故而数据缓存技术对非结构化的海量数据进行快速地检索,便是当代信息检索系统需要解决的首要问题。
技术实现思路
本专利技术的目的是提供,其采用并数据缓存技术对海量的非结构化信息进行检索。一方面,本专利技术提供一种海量数据信息检索系统,包括终端层,提供检索系统界面并向前台服务层发送检索请求并显示检索结果;数据服务层,包括数据服务器集群,采用webservice组件提供检索业务逻辑的实现;数据缓存服务层,包括数据缓存服务器集群,通过提供数据缓存服务以加快系统检索效率;数据存储服务层,包括数据存储服务器集群,提供海量数据的存储。所述数据缓存服务层包括两层结构第一层为检索结果缓存层,所述检索结果缓存层通过将检索关键字与检索结果缓存层所储存的关键字做出比对,如两者相同则直接调用数据存储服务层的相应数据;第二层为关键字检索缓存层,所述关键字检索缓存层通过将检索关键字与关键字检索缓存层所储存的关键字做出比对,如两者相同则直接调用数据存储服务层的相应数据。所述检索结果缓存层所储存的关键字由每次检索之后将上次检索的关键字返回到关键字检索缓存层存储后得出,所述检索结果缓存层将所储存的关键字根据搜索频率做出排名。所述关键字检索缓存层所储存的关键字还包括相应检索结果的数据存储地址,所述数据存储地址通过哈希算法计算得出。所述关键字检索缓存层所储存的关键字通过数据库导入数据时截取。另一方面,本专利技术还提供一种海量数据信息检索方法,包括以下步骤步骤S110,终端层发送检索请求;步骤S120,数据服务层通过webservice实现检索业务逻辑,执行检索请求向数据缓存服务层调用数据,返回检索结果;步骤S130,数据缓存服务层提供数据缓存服务以加快系统检索效率;步骤S140,数据服务层提供调用数据。所述数据缓存服务层包括两层结构第一层为检索结果缓存层,所述检索结果缓存层通过将检索关键字与检索结果缓存层所储存的关键字做出比对,如两者相同则直接调用数据存储服务层的相应数据;第二层为关键字检索缓存层,所述关键字检索缓存层通过将检索关键字与关键字检索缓存层所储存的关键字做出比对,如两者相同则直接调用数据存储服务层的相应数据。所述检索结果缓存层所储存的关键字由每次检索之后将上次检索的关键字返回到关键字检索缓存层存储后得出,所述检索结果缓存层将所储存的关键字根据搜索频率做出排名。所述关键字检索缓存层所储存的关键字还包括相应检索结果的数据存储地址, 所述数据存储地址通过哈希算法计算得出。所述关键字检索缓存层所储存的关键字通过数据库导入数据时截取。采用本专利技术所述的,其包括终端层、数据服务层、数据缓存服务层和数据存储服务层,所述数据缓存服务层包括检索结果缓存层和关键字检索缓存层,数据缓存服务层提供数据缓存服务进行关键词比对以加快系统检索效率,从而加快对海量数据的检索速度。附图说明图1是本专利技术所述系统的原理框图;图2是本专利技术所述方法流程图。具体实施例方式下面结合附图和实施例进一步说明本专利技术的技术方案。参照图1,图1显示了一种海量数据信息检索系统100,包括终端层110,数据服务层120,数据缓存服务层130,数据存储服务层140。终端层110,提供检索系统界面并向前台服务层发送检索请求并显示检索结果,所述终端层110由装有检索系统客户端程序的电脑所组成。数据服务层120,包括防火墙和数据服务器集群,所述数据服务层120采用 webservice组件提供检索业务逻辑的实现,所述webservice组件采用soap技术,通过80 端口进行数据通信,防火墙无需另开端口进行各服务器之间的数据通信。数据缓存服务层130,包括数据缓存服务器集群,通过提供数据缓存服务以加快系统检索效率。所述数据缓存服务层130包括检索结果缓存层131和关键字检索缓存层132。所述检索结果缓存层131通过将检索关键字与检索结果缓存层131所储存的关键字做出比对,如两者相同则直接调用数据存储服务层140的相应数据。所述检索结果缓存层131所储存的关键字由每次检索之后将上次检索的关键字返回到关键字检索缓存层132 存储后得出,所述检索结果缓存层131将所储存的关键字根据搜索频率做出排名。所述关5键字检索缓存层132所储存的关键字还包括相应检索结果的数据存储地址,所述数据存储地址通过哈希算法计算得出。所述关键字检索缓存层132,所述关键字检索缓存层132通过将检索关键字与关键字检索缓存层132所储存的关键字做出比对,如两者相同则直接调用数据存储服务层 140的相应数据。所述关键字检索缓存层132所储存的关键字通过数据库导入数据时截取。所述数据存储服务层140包括数据存储服务器集群,提供海量数据的存储。参见图2,本专利技术还提供一种海量数据信息检索系统方法200,包括步骤Sl 10,终端层110发送检索请求;步骤S120,数据服务层120通过webservice实现检索业务逻辑,执行检索请求向数据缓存服务层130调用数据,返回检索结果;步骤S130,数据缓存服务层130提供数据缓存服务以加快系统检索效率;步骤S140,数据服务层120提供调用数据。所述数据缓存服务层130包括两层结构第一层为检索结果缓存层131,所述检索结果缓存层131通过将检索关键字与检索结果缓存层131所储存的关键字做出比对,如两者相同则直接调用数据存储服务层140 的相应数据;第二层为关键字检索缓存层132,所述关键字检索缓存层132通过将检索关键字与关键字检索缓存层132所储存的关键字做出比对,如两者相同则直接调用数据存储服务层140的相应数据。所述检索结果缓存层131所储存的关键字由每次检索之后将上次检索的关键字返回到关键字检索缓存层132存储后得出,所述检索结果缓存层131将所储存的关键字根据搜索频率做出排名。所述关键字检索缓存层132所储存的关键字还包括相应检索结果的数据存储地址,所述数据存储地址通过哈希算法计算得出。所述关键字检索缓存层132所储存的关键字通过数据库导入数据时截取。需要指出的是,本专利技术所述的一种海量数据信息检索系统100和一种海量数据信息检索方法200,两者在原理和实施例上是相同或类似的,故其重复部分不再赘述。本
中的普通技术人员应当认识到,以上的实施例仅是用来说明本专利技术, 而并非用作为对本专利技术的限定,只要在本专利技术的实质精神范围内,对以上实施例的变化、变型都将落在本专利技术的权利要求书范围内。权利要求1.一种海量数据信息检索系统,其特征在于包括终端层,提供检索系统界面并向前台服务层发送检索请求并显示检索结果; 数据服务层,包括数据服务器集群,采用webservice组件提供检索业务逻辑的实现; 数据缓存服务层,包括数据缓存服务器集群,通过提供数据缓存服务以加快系统检索效率;数据存储服务层,包括数据存储服务器集群,提供海量数据的存储。2.本文档来自技高网
...

【技术保护点】
1.一种海量数据信息检索系统,其特征在于包括:终端层,提供检索系统界面并向前台服务层发送检索请求并显示检索结果;数据服务层,包括数据服务器集群,采用webservice组件提供检索业务逻辑的实现;数据缓存服务层,包括数据缓存服务器集群,通过提供数据缓存服务以加快系统检索效率;数据存储服务层,包括数据存储服务器集群,提供海量数据的存储。

【技术特征摘要】

【专利技术属性】
技术研发人员:蒋志勇郑修虹孔佳薇叶青程三艳
申请(专利权)人:上海市浦东科技信息中心
类型:发明
国别省市:31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1