一种快速检索企业数据的方法技术

技术编号:6086539 阅读:209 留言:0更新日期:2012-04-11 18:40
快速检索企业数据的方法,采用如下步骤:搜索引擎即检索模块初始化时,从数据库里加载所有需检索的数据,并按照搜索引擎配置的多元检索类型关键字生成多个散列表,为每个类型建立对应的索引;同时,对数据所有属性进行指定类型处理后存放在该数据的缓冲区接受用户检索条件匹配;分析检索条件参数和散列索引表控制:根据散列索引表获取数据块、对散列索引表中数据进行判断;对选中的数据进行检索条件参数匹配识别,排列并生成检索结果;获取指定数据块后,将从该数据块内的每条数据的缓冲区判定是否满足用户输入的检索条件参数,如果满足,则将该结果添加到搜索结果中。

Method for fast searching enterprise data

Rapid retrieval method of enterprise data, using the following steps: the search engine retrieval module initialization, from all the data to be retrieved in the database according to the search engine load, and multiple configuration retrieval type keyword generates a hash table, establish the corresponding index for each type of data; at the same time, all the attributes of the specified buffer type after processing the data stored in the received user retrieval matching; analysis of retrieval condition parameters and hash index table control: according to the hash index table data block, the data table hash index to judge; retrieval parameters to match the selected data, arrangement and generate retrieval results; access to the specified data block, the the data from the buffer of each data block within the user input to determine whether they meet the retrieval condition parameters, if meet The result is added to the search results.

【技术实现步骤摘要】

本专利技术涉及计算机信息检索
,具体涉及企业内部各种信息化系统所包含的数 据进行快速检索的方法以及搜索引擎。
技术介绍
在信息技术日益发达,企业生产数据日益庞大,知识爆炸性增长的今天,如何快速有效 检索企业内部的运营数据,提升知识管理的运用与效果,是每个企业不得不面对的一个现 实问题。目前在万维网上常见的信息检索技术,通常采用的是大规模服务器阵列存储海量 数据,蜘蛛机器人自动在网络上爬行获取数据进行分析缓存,这种模式并不适用于企业级 应用。企业各种信息化系统大多采用关系型数据库进行数据存储,对系统内关键数据检索 通常是基于数据库部分字段的精确匹配及部分字段的模糊搜索,在数据量比较大时,此类 检索性能较差,在用户较多时,搜索会带给整个系统较大性能压力。而当数据库结构发生变 化时,需要对新增加的字段进行检索则会导致产生新的客户需求,引发系统变更及升级,增 加企业及软件供应商的成本。
技术实现思路
本专利技术目的是针对企业数据检索需求,本专利技术提供了一种进行数据缓存及快速检索 的方法和系统。这种方法对企业关键数据进行管理,提供高效的散列检索及数据匹配过滤, 构建了一个快速有效的搜索引擎,适用范围广。本专利技术的技术方案是,快速检索企业数据的方法搜索引擎即检索模块初始化时, 从数据库(系统的数据库,检索对象系统)里加载所有需检索的数据,并按照搜索引擎配 置的多元检索类型关键字生成多个散列表,为每个类型建立对应的索引;同时,对数据所有 属性进行指定类型处理后存放在该数据的缓冲区接受用户(终端)检索条件匹配;分析检索 条件参数和散列索引表控制根据散列索引表获取数据块、对散列索引表中数据进行判断; 对选中的数据进行检索条件参数匹配识别,排列并生成检索结果;在检索数据时,首先判定 该数据是否有对应的索引,例如编码索引,名称索引,如果发现索引,则通过索引去获取该 索引指定的数据块,如果没有,则检索所有数据;获取指定数据块后,将从该数据块内的每 条数据的缓冲区判定是否满足用户输入的检索条件参数,如果满足,则将该结果添加到搜 索结果中。如此,以内存空间为代价,取代数据库级模糊检索,大大提高效率,如果需要检索 的数据量很大,可以采用多台服务器分别负责不同的数据类型模式并行搜索,提高响应速 度。快速检索的搜索引擎构成一个独立的模块,加载在C/S模式下的服务器端或加载 在B/S模式下的Web服务器业务层;调用方式是直接调用封装代码,也可以异步Ajax调用; 在系统中添加企业数据快速检索引擎或模块,只需要少量的代码变更,涉及到以下方面检 索引擎在系统启动时是不会被自动启动的,需要显示调用在第一次调用时进行初始化加 载,计算机系统可以选择性在加载完成后调动搜索引擎初始化。系统数据变更时,可以发送 消息给检索引擎,检索引擎会进行异步数据刷新。快速检索引擎的引用添加引擎代码类库引用或直接添加源代码到项目。设置检索数据需要对进行检索的数据库的数据类型进行分析,并进行配置,例 如,与核心主数据相关联的附加数据的表名设置,在搜索引擎加载系统数据时,会一次性加 载所有附加数据表里的所有数据,并根据关联字段自动匹配缓冲区数据。设置需要检索的数据内容配置检索字段,即设置数据哪些对应的字段参与检索 或不参与检索(默认情况下所有字段会被加载入缓冲区,有些无意义的字段则可以设置为 不检索以提高效率)。设置检索匹配数据企业部分数据格式特殊,需要额外设置。举例1 某些字段是 数值型,需要转化成对应的字符串(例如,状态栏为0表示正常,当用户输入检索条件为正 常时应当能过滤出)。举例2 某些字段的关键字存在重复混淆,例如,优选/非优选,检索 时如果单纯使用优选对结果没有影响,使用非优选则能检索出非优选数据,正确设置后使 用优选则可以过滤掉非优选数据。编写检索界面包括用户输入界面及结果显示界面。引擎扩展支持^aS模式,可以通过Web服务支持多个检索引擎检索不同类型数 据并合并到最终结果;从本专利技术方案可以看出,本专利技术对企业数据检索提供了快速有效准 确的支持,从用户使用到代码扩展开发,均简便快捷,对不同企业不同类型数据适用面广。本专利技术的有益效果是这种方法在目前的信息化系统内应用时基本无需增加额外 的硬件支持,性能极高。并且本方法和引擎模块提供给用户的使用界面极其方便,用户无需 进行多次点击及分类导航等,一次输入,即可快速获得结果。本引擎提供给开发者的效率也 很高,无需对数据进行各种分类,编写各样的数据分类、导航界面,只需提供一个用户输入 框便可完成前台检索界面。四附图说明图1是本专利技术流程图 五具体实施例方式具体数据检索方式通过一个简单的实例,结合附图对本专利技术的应用进行更详细的描 述,但不构成对本专利技术的限制。本专利技术对企业核心数据数据进行检索的方法描述以制造业零部件信息检索为例在用户打开搜索界面后,将可以看到一个搜索信息输 入栏,后面是搜索按钮,整个界面干净简洁, 检索对应编码零部件用户在输入栏直接输入零部件的编码,点击搜索按钮,直接根据该编码给出对应零部 件的详细信息 根据名称检索1、用户输入要检索的零部件名称,例如“螺栓”,自动检索出所有螺栓相关的零部件2、用户输入要检索的零部件名称,并在后面加上参数,可以自动检索并过滤满足条 件的零部件,例如,用户输入“螺栓M20”,自动检索出所有M20的螺栓,参数可以是多个,中 间以空格或逗号分隔3、参数可以是各种条件,例如重量、尺寸、描述、供应商、等级、状态等,并可以叠加, 例如用户输入“发动机100优选”,则可以检索出所有发动机,并且被用户设置为优选件的,同时,某项参数里带有100,例如尺寸100*XX*XX的,或排气量为100L之类的,检索结果 里,零部件属性中含检索参数项将会被红色标注4、用户也可以不输入零部件名称,直接输入各种检索条件,这种情况下,因为会检索 所有数据,检索效率会略有降低,但不影响检索结果 搜索引擎原理搜索引擎是一个独立的模块,可以加载在C/S模式下的服务器端也可以加载在B/S模 式下的Web服务器业务层。调用方式可以是直接调用封装代码,也可以异步Ajax调用,开 发者也可以根据业务逻辑针对性修改源代码。搜索引擎在系统启动时是不会被自动启动的,需要显示调用在第一次调用时进行 初始化加载,系统可以选择性在加载完成后调动搜索引擎初始化。系统数据变更时,可以发 送消息给引擎,引擎会进行异步数据刷新。引擎初始化时,会从数据库里加载所有需检索的数据,并自动按照关键字生成多 个散列索引表,同时,对数据所有属性进行指定类型处理后存放在该数据的缓冲区。在检索 数据时,会首先判定该数据是否有对应的索引,例如编码索引,名称索引,如果发现,则通过 索引去获取该索引指定的数据块,如果没有,则检索所有数据。获取指定数据块后,将从该 数据块内的每条数据的缓冲区判定是否满足用户输入的参数,如果满足,则将该结果添加 到搜索结果中,如此,以内存空间为代价,取代数据库级模糊检索,大大提高效率,如果用户 数据量很大,可以采用多台服务器分别负责不同的数据类型模式并行搜索,提高响应速度。引擎检索流程图根据实际运行效果,以十万条为单位的数据量检索中,消耗内存 代价不高,检索速度极快,及其适合于制造业关键数据检索。以上通过一个具体使用场景案例详细本文档来自技高网...

【技术保护点】
1.快速检索企业数据的方,其特征是采用如下步骤:搜索引擎即检索模块初始化时,从数据库里加载所有需检索的数据,并按照搜索引擎配置的多元检索类型关键字生成多个散列表,为每个类型建立对应的索引;同时,对数据所有属性进行指定类型处理后存放在该数据的缓冲区接受用户检索条件匹配;分析检索条件参数和散列索引表控制:根据散列索引表获取数据块、对散列索引表中数据进行判断;对选中的数据进行检索条件参数匹配识别,排列并生成检索结果;在检索数据时,首先判定该数据是否有对应的索引,如果发现索引,则通过索引去获取该索引指定的数据块,如果没有,则检索所有数据;获取指定数据块后,将从该数据块内的每条数据的缓冲区判定是否满足用户输入的检索条件参数,如果满足,则将该结果添加到搜索结果中。

【技术特征摘要】

【专利技术属性】
技术研发人员:张晓东张卫陈万江殷建琳
申请(专利权)人:南京新模式软件集成有限公司
类型:发明
国别省市:84

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1