一种基于云存储的电力信息检索方法及系统技术方案

技术编号:6081524 阅读:254 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于云存储的电力信息检索方法,包括:根据预设的电力主题词表的分词词库对预设的电力数据库中的各个文档进行分词处理,根据得到的分词结果建立索引数据库,所述电力数据库以及索引数据库存储于云存储系统中;获取用户的检索信息,根据所述检索信息确定检索信息的关键词,以及关键词之间的逻辑关系;从索引数据库中查找得到各个关键词对应的文档集合;根据关键词之间的逻辑关系对所述文档集合进行处理,得到检索信息对应的文档信息;将所述文档信息向用户进行展现。还提供了一种基于云存储的电力信息检索系统,该方法及系统能够实现对于电力信息的检索,且提高了检索速度。

Power information retrieval method and system based on cloud storage

The invention discloses a power information retrieval method based on cloud storage, including: according to the preset power thesaurus sub word thesaurus segmentation processing for each document in the database of power preset, according to the segmentation results for database indexing, the index database stored in the database and the power of cloud storage system for users; according to the information retrieval, the retrieval information to determine the keyword retrieval information, the logical relationship between keywords and search; obtained from the index database of each keyword corresponds to the document collection; according to the logic relation between keywords of the document collection processing, retrieval information corresponding to the document information; the document information to the user show. It also provides a power information retrieval system based on cloud storage. The method and system can realize the retrieval of power information and improve the retrieval speed.

【技术实现步骤摘要】

本专利技术涉及检索技术,尤其涉及一种基于云存储的电力信息检索方法及系统
技术介绍
随着信息技术的迅猛发展,人们越来越多的将各种资料转换成电子资源,通过计算机等终端进行存储,并且,也越来越多的通过计算机或者网络等查找自己所需的各种信息;从而,为了方便用户对于各种信息的查询,电子图书馆应运而生。但是,现有的电子图书馆都是涵盖了各个领域的各种技术资料,但是由于自身存储能力以及获取到的资源的限制,只能提供各个领域中较为基础和有限的资源。现有技术中,并没有公开仅基于电力信息所建立的电子图书馆,也没有公开基于电子图书馆的进行电力信息检索的方法。
技术实现思路
有鉴于此,本专利技术要解决的技术问题是,提供一种基于云存储的电力信息检索方法及装置,能够实现对于电力信息的检索,且提高了检索速度。为此,本专利技术实施例采用如下技术方案—种基于云存储的电力信息检索方法,包括根据预设的电力主题词表的分词词库对预设的电力数据库中的各个文档进行分词处理,根据得到的分词结果建立索引数据库,所述电力数据库以及索引数据库存储于云存储系统中;获取用户的检索信息,根据所述检索信息确定检索信息的关键词,以及关键词之间的逻辑关系;从索引数据库中查找得到各个关键词对应的文档集合;根据关键词之间的逻辑关系对所述文档集合进行处理,得到检索信息对应的文档 fn息;将所述文档信息向用户进行展现。还包括根据用户的点击操作,从电力数据库中获取用户点击的文档信息对应的文档,将所述文档向用户展现。根据得到的分词结果建立索引数据库包括根据分词结果确定每个词项所对应的、包含该词项的文档集合,以词项为主字段, 建立所述索引数据库。还包括对检索信息对应的文档信息,按照文档信息所对应文档与检索信息之间的关联度进行排序;相应的,向用户进行展现的文档信息为排序后的文档信息。一种基于云存储的电力信息检索系统,包括建立单元,用于根据预设的电力主题词表的分词词库对预设的电力数据库中的各个文档进行分词处理,根据得到的分词结果建立索引数据库;云存储系统,用于对电力数据库以及索引数据库进行云存储;确定单元,用于获取用户的检索信息,根据所述检索信息确定检索信息的关键词, 以及关键词之间的逻辑关系;查找单元,用于从索引数据库中查找得到各个关键词对应的文档集合;处理单元,用于根据关键词之间的逻辑关系对所述文档集合进行处理,得到检索信息对应的文档信息;第一展现单元,用于将所述文档信息向用户进行展现。还包括第二展现单元,用于根据用户的点击操作,从电力数据库中获取用户点击的文档信息对应的文档,将所述文档向用户展现。建立单元包括分词子单元,用于根据预设的电力主题词表的分词词库对预设的电力数据库中的各个文档进行分词处理;建立子单元,用于根据得到的分词结果确定每个词项所对应的、包含该词项的文档集合,以词项为主字段,建立所述索引数据库。还包括排序单元,用于对检索信息对应的文档信息,按照文档信息所对应文档与检索信息之间的关联度进行排序。对于上述技术方案的技术效果分析如下建立基于电力信息的电力数据库,根据预设的电力主题词表的分词词库对预设的电力数据库中的各个文档进行分词处理,根据得到的分词结果建立索引数据库,所述索引数据库存储于云存储系统中,从而后续用户可以输入由电力主题词表中的词项构成的检索信息,进行电力信息文档的检索,从而实现了专门针对电力信息的检索;而且,将电力数据库以及索引数据库存储于云存储系统中,从而可以提高对于电力信息的检索速度。附图说明图1为本专利技术实施例基于云存储的电力信息检索方法流程示意图;图2为本专利技术实施例另一种基于云存储的电力信息检索方法流程示意图;图3为本专利技术实施例一种基于云存储的电力信息检索系统结构示意图。具体实施例方式以下,结合附图详细说明本专利技术实施例基于云存储的进行电力关键词全文检索的方法及装置的实现。图1为本专利技术实施例一种基于云存储的电力信息检索方法流程示意图,如图1所示,该方法包括预设设置基于电力信息的数据库,所述数据库中可以包括从时效性最高的电力动态信息到时效性较低的图书手册等各种电力信息资源,具体的,可以电力动态、电力报刊、电力期刊、会议文集、技术标准、法律法规、科技报告、考察报告、科技成果、图书手册等;并且,可以将这些电力信息资源进行类别的划分,具体的类别以及类别的数量可以在实际应用中自主设定并划分,这里并不限定。步骤101 根据预设的电力主题词表的分词词库对预设的电力数据库中的各个文档进行分词处理,根据得到的分词结果建立索引数据库,所述索引数据库存储于云存储系统中;步骤102 获取用户的检索信息,根据所述检索信息确定检索信息的关键词,以及关键词之间的逻辑关系;步骤103 从索引数据库中查找得到各个关键词对应的文档集合;步骤104 根据关键词之间的逻辑关系对所述文档集合进行处理,得到检索信息对应的文档信息;步骤105 将所述文档信息向用户进行展现。图1所示的本专利技术实施例检索方法中,建立基于电力信息的电力数据库,根据预设的电力主题词表的分词词库对预设的电力数据库中的各个文档进行分词处理,根据得到的分词结果建立索引数据库,所述索引数据库存储于云存储系统中,从而后续用户可以输入由电力主题词表中的词项构成的检索信息,进行电力信息文档的检索,从而实现了专门针对电力信息的检索;而且,将电力数据库以及索引数据库存储于云存储系统中,从而可以提高对于电力信息的检索速度。在图1的基础上,通过图2对本专利技术实施例基于云存储的电力信息检索方法进行更为详细的说明,如图2所示,该方法包括步骤201 预先设置基于电力信息的电力数据库,所述数据库中包含基于电力信息资源的各种文档;所述电力数据库存储于云存储系统中。其中,所述云存储系统可以使用现有的各种云存储系统实现,这里不赘述。步骤202 根据预设的电力主题词表的分词词库对电力数据库中的各个文档进行分词处理,将得到的分词结果按照倒排结构进行存储,构成索引数据库,所述索引数据库存储于云存储系统中。所述索引数据库中包括词项以及该包含该词项的文档构成的文档集合。其中,所述文档集合中可以仅记载文档对应的文档信息,例如文档标识(ID)和/或文档名称等。其中,根据预设的电力主题词表的分词词库对电力数据库中的各个文档进行分词处理包括依次将待分词文档中字符串与分词词库中的各个词条进行匹配,如果匹配上,则存储该词条以及词条对应的信息,再继续进行该词条后续字符串的匹配,直到文档末端。进行分词处理后得到的分词结果是正排结构,分词结果以文档为主字段,记录了每个文档中包含的词项,也即是说每个文档对应一个由该文档所包含词项构成的词项集合。而倒排结构则以词项为主字段,记录了包含词项的所有文档,也即是说每个词项对应一个由包含该词项的所有文档构成的文档集合。例如,正排结构是包括文档1,词项集合 {tl、t2、t3};文档2,词项集合{tl、t2、t4};而其对应的倒排结构则是词项tl,文档集合 {1、2};词项t2,文档集合{1,2};词项t3,文档集合{1};词项t4,文档集合⑵。步骤203 获取用户输入的检索信息,根据所述检索信息确定检索信息的关键词, 以及关键词之间的逻辑关系。其中,用户输入的检索信息可以为词条或者语句,此时,一般需要通过分词的方式确定检索信息的关键词,具体的分词方本文档来自技高网...

【技术保护点】
1.一种基于云存储的电力信息检索方法,其特征在于,包括:根据预设的电力主题词表的分词词库对预设的电力数据库中的各个文档进行分词处理,根据得到的分词结果建立索引数据库,所述电力数据库以及索引数据库存储于云存储系统中;获取用户的检索信息,根据所述检索信息确定检索信息的关键词,以及关键词之间的逻辑关系;从索引数据库中查找得到各个关键词对应的文档集合;根据关键词之间的逻辑关系对所述文档集合进行处理,得到检索信息对应的文档信息;将所述文档信息向用户进行展现。

【技术特征摘要】

【专利技术属性】
技术研发人员:曹汝滨吴凯峰张荣孙雪芬徐杰锋肖政方东煦李云吴铧明
申请(专利权)人:国网信息通信有限公司北京天云融创科技有限公司北京友友天宇系统技术有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1