当前位置: 首页 > 专利查询>崔春明专利>正文

一种实时全文搜索引擎事务处理的实现方法技术

技术编号:8387148 阅读:281 留言:0更新日期:2013-03-07 07:49
本发明专利技术公开了一种实时搜索引擎中支持事务处理的方法,其特点在于,实时分布式搜索引擎130是主存储区,存放索引接口操作完成后生效的索引数据;索引管理110有本地索引缓存120,且以事务为单位来组织,在事务过程中,索引管理110的接口将在缓存中临时存储新创建、修改和删除的数据,当索引数据操作完成提交且满足生效条件后,则将缓存中涉及此事务的数据以异步方式同步到实时分布式搜索引擎的主存储区中,从而实现了接口的事务操作。本发明专利技术实现了一种开销比较小的实时搜索引擎访问的事务操作,简单有效地保证了应用在实时更新搜索引擎时数据的完整性、事务隔离性和正确性,并保留原有的具有批量的处理特点的实时分布式搜索引擎不变。

【技术实现步骤摘要】

本专利技术涉及云计算搜索引擎中数据完整性问题,尤其涉及实时应用对搜索引擎进行数据更新时,能有效的解决数据完整性问题的实时搜索引擎事务操作方法。
技术介绍
全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索 方式。这个过程类似于通过字典中的检索字表查字的过程。全文检索引擎是按照全文检索理论建立起来的用于提供全文检索服务的软件系统。一般来说,全文检索需要具备建立索引和提供查询的基本功能,此外现代的全文检索系统还需要具有方便的用户接口、面向WWW的开发接口、二次应用开发接口等等。功能上,全文检索系统核心具有建立索引、处理查询返回结果集、增加索引、优化索引结构等等功能,外围则由各种不同应用具有的功能组成。结构上,全文检索系统核心具有索引引擎、查询引擎、文本分析引擎、对外接口等等,加上各种外围应用系统等等共同构成了全文检索系统。例如Apache Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索引擎。同时对其进行了扩展,提供了比Luc本文档来自技高网...

【技术保护点】
一种实时全文搜索引擎事务操作的实现方法,其特征在于:将分布式搜索引擎作为主存储区,存放提交后生效的索引数据,索引管理接口端有本地文件缓存存储区,用于存放事务中涉及的临时索引数据。索引管理接口在事务过程中在本地文件缓冲存储区中对临时数据进行操作,当所有数据操作都完成提交且满足生效条件后,在临时缓冲区中的数据将标记为完成状态,并通过异步方式同步到分布式搜索引擎实现事务持久化。临时缓冲区中处于已提交完成状态的数据,对于正在处理的事务以及新的事务也都同时生效,未提交的数据只对当前事务生效,从而实现事务隔离功能。

【技术特征摘要】

【专利技术属性】
技术研发人员:崔春明
申请(专利权)人:崔春明
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1