数据索引装置和数据索引方法制造方法及图纸

技术编号:8366823 阅读:224 留言:0更新日期:2013-02-28 05:33
本发明专利技术提出了一种数据索引装置,包括:读取单元,读取半结构化数据,判断所述半结构化数据中是否有与索引字段相匹配的字符串;标记单元,将所述字符串与索引字段相匹配的字段标记为符合字段,并在所述符合字段加入标签;索引建立单元,搜索引擎根据所述标签查找到需要索引的字段,并建立索引。相应地,本发明专利技术还提供了一种数据索引方法。通过本发明专利技术的技术方案,在读取半结构化数据时,将半结构化数据中与索引字段匹配的字段加上标签,在搜索引擎建立索引时,找到与需要索引的字段相匹配的标签即可,不必再对数据进行结构化,从而方便搜索引擎建立索引,使得搜索引擎的实时性有了更大的提升。

【技术实现步骤摘要】

本专利技术涉及数据处理领域,具体而言,涉及一种。
技术介绍
随着网络技术的发展,特别是互联网和企业内部网技术的飞快发展,使得半结构化数据的数量日趋增大。目前,对半结构化数据的处理主要是做结构化处理,进行结构化处理耗时较长,随着数据结构越来越来越复杂,结构化处理将越来越不适合产品应用。因此,需要一种新的技术方案,可以使得在处理半结构化数据时,避免对其进行结构化处理时产生的耗时长等问题,而可以采取更好的方法对半结构化数据进行处理
技术实现思路
·本专利技术正是基于上述问题,提出了一种新的技术方案,可以使得在处理半结构化数据时,避免对其进行结构化处理时产生的耗时长等问题,而可以采取更好的方法对半结构化数据进行处理。有鉴于此,本专利技术提出了一种数据索引装置,包括读取单元,读取半结构化数据,判断所述半结构化数据中是否有与索引字段相匹配的字符串;标记单元,将所述字符串与索引字段相匹配的字段标记为符合字段,并在所述符合字段加入标签;索引建立单元,搜索引擎根据所述标签查找到需要索引的字段,并建立索引。在该技术方案中,在处理半结构化数据时,将半结构化数据中与索引字段匹配的字段加上标签,在搜索引擎建立索本文档来自技高网...

【技术保护点】
一种数据索引装置,其特征在于,包括:读取单元,读取半结构化数据,判断所述半结构化数据中是否有与索引字段相匹配的字符串;标记单元,将所述字符串与索引字段相匹配的字段标记为符合字段,并在所述符合字段加入标签;索引建立单元,搜索引擎根据所述标签查找到需要索引的字段,并建立索引。

【技术特征摘要】

【专利技术属性】
技术研发人员:赵兴成
申请(专利权)人:深圳中兴网信科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1