结构化信息快速检索方法及系统技术方案

技术编号：8105765 阅读：283 留言：0更新日期：2012-12-21 04:35

本发明专利技术提供一种结构化信息快速检索方法，先对结构化信息的数据源进行预处理，采用多线程的方式来不断地产生不同的索引片，生成小索引文件，然后定量或定期地把小索引文件合并到一个大索引文件中；数据分析：对所述大索引文件的域转换为最基本的索引表示单元项，这些索引表示单元项是用于决定匹配查询条件的信息；建立索引并入库；用户输入查询条件；解析：对用户输入的查询条件进行解析，即对用户输入的查询条件对应的每个查询项解析成索引表示单元项；利用索引表示单元项进行索引；将索引的结果集返回给用户。本发明专利技术通过建立颗粒度较小的索引文件，再合并为大索引文件；通过分级建立索引之后进行存储，能极大提高检索的效率。

全部详细技术资料下载

【技术实现步骤摘要】
结构化信息快速检索方法及系统
本专利技术涉及一种快速检索方法及系统。
技术介绍
结构化信息是信息格式固定，可以存储在数据库中，可用二维表逻辑来表达的信息。常见的结构化信息的检索包括数据库检索方式以及类似GOOGLE和百度的搜索引擎技术。数据库检索虽然能够准确地查询出我们需要的信息；但随着数据量的激增，在高效性上遇到了瓶颈，响应速度慢，经常无响应。而搜索引擎获取的信息是及时高效的，但准确性不高。信息量越大，用搜索引擎查找信息在准确性上也随之降低了。安全事件属于结构化信息中的一种，目前没有一种准确高效的检索方法。
技术实现思路
本专利技术要解决的技术问题之一，在于提供一种结构化信息快速检索方法，采用分片再合并的方式处理数据，可以大为提高检索的效率及准确性。本专利技术要解决的技术问题之二，在于提供一种结构化信息快速检索系统，采用分片再合并的方式处理数据，可以大为提高检索的效率及准确性。本专利技术要解决的技术问题之一是这样实现的一种结构化信息快速检索方法，包括如下步骤步骤10、预处理先对结构化信息的数据源进行预处理，并生成索引文件；所述预处理是抽取相同类型的结构化信息的公共信息，并在生成索引文件是对不同主机传递过来的相同类型的结构化信息的差异化数据进行单独处理；所述索引文件的生成方式是采用多线程的方式来不断地产生不同的索引片，生成小索引文件，然后定量或定期地把小索引文件合并到一个大索引文件中；步骤20、数据分析对所述大索引文件的域转换为最基本的索引表示单元项，这些索引表示单元项是用于决定匹配查询条件的信息；步骤30、建立索引并入库所述大索引文件的数据经分析后分级建立...

【技术保护点】
一种结构化信息快速检索方法，其特征在于：包括如下步骤：步骤10、预处理：先对结构化信息的数据源进行预处理，并生成索引文件；所述预处理是抽取相同类型的结构化信息的公共信息，并在生成索引文件是对不同主机传递过来的相同类型的结构化信息的差异化数据进行单独处理；所述索引文件的生成方式是采用多线程的方式来不断地产生不同的索引片，生成小索引文件，然后定量或定期地把小索引文件合并到一个大索引文件中；步骤20、数据分析：对所述大索引文件的域转换为最基本的索引表示单元项，这些索引表示单元项是用于决定匹配查询条件的信息；步骤30、建立索引并入库：所述大索引文件的数据经分析后分级建立索引，再按顺序进行存储；步骤40、查询：用户输入查询条件；步骤50、解析：对用户输入的查询条件进行解析，即对用户输入的查询条件对应的每个查询项解析成索引表示单元项；步骤60、索引：利用步骤50所得的索引表示单元项进行索引；步骤70、返回结果：将索引的结果集返回给用户。

【技术特征摘要】

【专利技术属性】
技术研发人员：陈进炘，唐敏，陈冬冬，涂大志，黄震奇，
申请(专利权)人：福建富士通信息软件有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人