一种修改Lucene索引文件中词的方法及装置制造方法及图纸

技术编号：11230899 阅读：85 留言：0更新日期：2015-03-29 18:23

本发明专利技术公开了一种修改Lucene索引文件中词的方法及装置，该方法首先获取修改参数，然后对于索引文件夹中每一个段，查找该段中要修改字段是否存在旧词，如果存在则进入下一步，否则放弃对该段的修改；对要修改的段，生成新词对应的信息；并根据该段中原先就存在的除旧词和新词外其他词对应的信息、以及新词对应的信息，新生成四个倒排文件；最后在所有段都处理完成后，用新生成的四个倒排文件集中替换原索引文件夹中对应的文件。本发明专利技术还同时公开了实现上述方法的装置，本发明专利技术的方法及装置通过直接操作索引文件的方式，避免了重新创建索引的繁琐，极大地提高了修改的性能。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种修改Lucene索引文件中词的方法及装置，该方法首先获取修改参数，然后对于索引文件夹中每一个段，查找该段中要修改字段是否存在旧词，如果存在则进入下一步，否则放弃对该段的修改；对要修改的段，生成新词对应的信息；并根据该段中原先就存在的除旧词和新词外其他词对应的信息、以及新词对应的信息，新生成四个倒排文件；最后在所有段都处理完成后，用新生成的四个倒排文件集中替换原索引文件夹中对应的文件。本专利技术还同时公开了实现上述方法的装置，本专利技术的方法及装置通过直接操作索引文件的方式，避免了重新创建索引的繁琐，极大地提高了修改的性能。【专利说明】一种修改Lucene索引文件中词的方法及装置
本专利技术属于数据库索引
，尤其涉及一种修改Lucene索引文件中词的方法及装置。
技术介绍
在交通管理系统中，车辆信息管理是其中一项重要功能。其功能主要是将通过某个路口的车辆信息如:时间、地点、速度、车型、图片、告警信息等保存到数据库中。随着数据库的日益庞大，以及对搜索速度的高要求，一般需要使用其它搜索引擎(如Lucene)对数据库中的数据重新创建索引。这样，即使数据库达到了十亿级别的数量，系统的查询功能仍然可以达到理想的响应速度。使用Lucene虽然能大幅度提高搜索性能，但也出现了新的难题。由于客观或主观原因，保存在数据库中的某些信息有可能会出现错误。比如，在现实生活中，操作人员的不小心，把原本属于某个行政区划的社区误设为其它行政区的社区。这样它从一开始创建索引的时候就出现了信息上的错误问题，反映在Lucen...
一种修改Lucene索引文件中词的方法及装置

【技术保护点】
一种修改Lucene索引文件中词的方法，其特征在于，所述方法包括步骤：步骤1、获取修改参数，包括要修改字段、要修改的旧词以及修改后的新词；步骤2、对于索引文件夹中每一个段，查找该段中要修改字段是否存在旧词，如果存在则进入下一步，否则放弃对该段的修改；步骤3、获取当前处理的段中旧词所对应的信息，判断当前处理的段中要修改字段是否已经存在与新词相同的词，如果存在与新词相同的词，则将与新词相同的词对应的信息与旧词对应的信息进行合并，生成新词对应的信息，否则直接根据旧词对应的信息生成新词对应的信息；步骤4、根据当前处理的段中原先就存在的除旧词和新词外其他词对应的信息、以及新词对应的信息，新生成四个倒排文件segment.tim、segment.tip、segment.doc以及segment.pos；步骤5、等到所有的段都处理完毕，用新生成的四个倒排文件集中替换原索引文件夹中对应的文件。

【技术特征摘要】

【专利技术属性】
技术研发人员：王新成，
申请(专利权)人：浙江宇视科技有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人