一种创建索引的方法和创建索引的装置制造方法及图纸

技术编号:3873593 阅读:215 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及索引技术,针对现有索引构建方案占用系统资源过多的缺陷,涉及一种创建索引的方法和创建索引的装置。创建索引的方法接收索引更新命令,提取其中包含的业务标识,在该业务标识对应的源目录下读取源业务文件;在判定读取的源业务文件与该业务标识对应的目标目录下的目标业务文件不同时,依据所述源业务文件对所述目标业务文件进行更新;为更新后的目标业务文件生成索引文件,依据该索引文件对所述业务标识对应的索引文件目录下的索引文件进行更新。本发明专利技术还提供了一种创建索引的装置。依据业务文件是否发生变化来确定是否构建索引,可大大降低索引构建工作的执行密度,克服现有索引构建方案占用系统资源过多的缺陷。

【技术实现步骤摘要】

本专利技术涉及索引技术,更具体地说,涉及一种创建索引的方法和创建索引的装置
技术介绍
随着数字化信息存储技术的日渐成熟,信息的全文检索得到了广泛的应用。从互 联网搜索引擎,到图书馆图书搜索,信息全文检索技术的应用随处可见。 面对庞大的信息库,为提高全文检索的效率,往往需要对信息构建索引。以互联网 搜索引擎为例,搜索引擎公司必须对每天挖掘的大量网页数据构建索引,才能保障每日数 以千万计的网页搜索请求得到快速的响应。 然而,现有索引构建方法往往需要占用大量的系统资源,对于大型数据库而言,往 往需要配置专门的索引设备来执行索引构建任务。 因此,需要一种索引构建方案,能够有效克服现有索引构建方法存在的上述缺陷。
技术实现思路
本专利技术要解决的技术问题在于,针对现有索引构建方案占用系统资源过多的缺 陷,提供一种创建索引的方法和创建索引的装置。 本专利技术解决其技术问题所采用的技术方案是 构造一种创建索引的方法,包括 Sl、接收索引更新命令,提取其中包含的业务标识,在该业务标识对应的源目录下 读取源业务文件; S2、在判定读取的源业务文件与该业务标识对应的目标目录下的目标业务文件不 同时,依据所述源业务文件对所述目标业务文件进行更新; S3、为更新后的目标业务文件生成索引文件,依据该索引文件对所述业务标识对 应的索引文件目录下的索引文件进行更新。 在本专利技术提供的创建索引的方法中,所述索引更新命令在到达所述业务标识对应 的索引更新时间时被触发。 在本专利技术提供的创建索引的方法中,在所述步骤S2中,在判定所述源业务文件的 MD5校验值与所述目标业务文件的MD5校验值不同时,判定所述源业务文件与所述目标业 务文件不同。 在本专利技术提供的创建索引的方法中,在所述步骤S2中,在判定所述源业务文件的 修改时间与所述目标业务文件的修改时间不同时,判定所述源业务文件与所述目标业务文 件不同。 在本专利技术提供的创建索引的方法中,在所述步骤S2中,在判定所述源业务文件的 文件大小与所述目标业务文件的文件大小不同时,判定所述源业务文件与所述目标业务文 件不同。 本专利技术还提供了一种创建索引的装置,包括 接收模块,用于接收索引更新命令,提取其中包含的业务标识; 读取模块,用于在该业务标识对应的源目录下读取源业务文件; 业务文件更新模块,用于在判定读取的源业务文件与该业务标识对应的目标目录下的目标业务文件不同时,依据所述源业务文件对所述目标业务文件进行更新; 索引文件创建模块,用于为更新后的目标业务文件生成索引文件,依据该索引文件对所述业务标识对应的索引文件目录下的索引文件进行更新。 在本专利技术提供的创建索引的装置中,所述索引更新命令在到达所述业务标识对应 的索引更新时间时被触发。 在本专利技术提供的创建索引的装置中,所述业务文件更新模块用于在判定所述源业 务文件的MD5校验值与所述目标业务文件的MD5校验值不同时,判定所述源业务文件与所 述目标业务文件不同。 在本专利技术提供的创建索引的装置中,所述业务文件更新模块用于在判定所述源业 务文件的修改时间与所述目标业务文件的修改时间不同时,判定所述源业务文件与所述目 标业务文件不同。 在本专利技术提供的创建索引的装置中,所述业务文件更新模块用于在判定所述源业 务文件的文件大小与所述目标业务文件的文件大小不同时,判定所述源业务文件与所述目 标业务文件不同。 实施本专利技术的技术方案,具有以下有益效果在本专利技术提供的创建索引的方法和 创建索引的装置中,首先判断待创建索引的业务文件是否发生了变化。基于判断结果,只有 在业务文件发生变化时,才对该业务文件构建索引。如此一来,便可对业务文件有选择的构 建索引,即只对发生变化的业务文件创建索引,这样便可大大降低索引构建工作的执行密 度,克服现有索引构建方案占用系统资源过多的缺陷。附图说明 下面将结合附图及实施例对本专利技术作进一步说明,附图中 图1是依据本专利技术一较佳实施例的索引创建方法的流程图; 图2是依据本专利技术另一较佳实施例的索引创建方法的流程图; 图3是依据本专利技术一较佳实施例的索引创建装置的逻辑结构示意图。具体实施例方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对 本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并 不用于限定本专利技术。 本专利技术提供了一种创建索引的方法和创建索引的装置,可首先判断待创建索引的 业务文件是否发生了变化,再基于判断结果,在业务文件发生变化时,才对该业务文件构建 索引。如此一来,便可对业务文件有选择的构建索引,即只对发生变化的业务文件创建索 弓l,这样便可大大降低索引构建工作的执行密度,克服现有索引构建方案占用系统资源过 多的缺陷。下面就结合附图和具体实施例对本专利技术提供的技术方案进行详细描述。 本专利技术提供的技术方案主要用于为业务提供商提供的业务创建索引。业务提供商提供的业务可概括划分为多种类型,例如但不限于图片业务、小说业务、音乐业务、视频业 务、游戏业务、主题业务、软件业务和动漫业务等等。为便于用户搜索对应的业务,服务提供 商需要对其提供的业务构建索引。而在具体实现过程中,业务提供商依照业务的类型来对 属于该类型的所有业务构建索引。每项业务都对应一描述该业务内容的描述文件。该描述 文件中写有该项业务的名称、类型、简介、提供商、业务版本、价格、縮略图、下载地址、作者、专辑等多个属性。在构建索引过程中,对于每个业务类型,业务提供商首先生成包含属于该 业务类型的所有业务的属性文件的业务文件,并为该业务文件设置一业务标识。然后针对 上文所述的属性(即业务的名称、类型、简介、提供商、业务版本、价格、縮略图、下载地址、 作者、专辑等)为该业务文件构建索引。在具体应用过程中,每类业务对应的业务文件一般 仅在该类业务之中的某些业务发生变化(例如某些业务发生更新,或者增删业务)时才会 更新。 图1是依据本专利技术一较佳实施例的索引创建方法100的流程图。如图1所示,方 法100开始于步骤102。 随后,在下一步骤104,接收索引创建命令,提取其中包含的业务标识。在接收到新 的业务文件(例如增加了新的一类业务导致新增新的业务文件)时,将触发发出一索引创 建命令(例如操作人员触发发出索引创建命令),该索引创建命令之中包含该新业务文件 对应的业务标识。新接收到的业务文件将作为源业务文件存储在该业务标识对应的源目录 下,其中源目录专门用于存储源业务文件。 随后,在下一步骤106,为该业务标识生成对应的目标目录和索引文件目录。在具 体实现过程中,为该业务标识生成对应的目标目录和索引文件目录均可以依据该业务标识 来命名。 随后,在下一步骤108,在提取的业务标识对应的源目录下读取源业务文件。 随后,在下一步骤IIO,将读取的源业务文件作为目标业务文件存储到为该业务标 识生成的目标目录下。 随后,在下一步骤112,为该目标业务文件生成索引文件并存储到为该业务标识生 成的索引文件目录下,其中索引文件目录专门用于存储索引文件。有关生成索引文件的具 体内容已经在现有技术之中做了清楚的描述,因此此处不再赘述。 最后,方法100结束于步骤114。 对于每类业务而言,其业务范围和业务项目可能会发生变化,由此导致其本文档来自技高网...

【技术保护点】
一种创建索引的方法,其特征在于,包括:    S1、接收索引更新命令,提取其中包含的业务标识,在该业务标识对应的源目录下读取源业务文件;    S2、在判定读取的源业务文件与该业务标识对应的目标目录下的目标业务文件不同时,依据所述源业务文件对所述目标业务文件进行更新;    S3、为更新后的目标业务文件生成索引文件,依据该索引文件对所述业务标识对应的索引文件目录下的索引文件进行更新。

【技术特征摘要】

【专利技术属性】
技术研发人员:王有为刘克鸿刘飞杨旗杨丰马慧蒋铮
申请(专利权)人:卓望数码技术深圳有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1