【技术实现步骤摘要】
本专利技术涉及云计算搜索引擎中数据完整性问题,尤其涉及实时应用对搜索引擎进行数据更新时,能有效的解决数据完整性问题的实时搜索引擎事务操作方法。
技术介绍
全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索 方式。这个过程类似于通过字典中的检索字表查字的过程。全文检索引擎是按照全文检索理论建立起来的用于提供全文检索服务的软件系统。一般来说,全文检索需要具备建立索引和提供查询的基本功能,此外现代的全文检索系统还需要具有方便的用户接口、面向WWW的开发接口、二次应用开发接口等等。功能上,全文检索系统核心具有建立索引、处理查询返回结果集、增加索引、优化索引结构等等功能,外围则由各种不同应用具有的功能组成。结构上,全文检索系统核心具有索引引擎、查询引擎、文本分析引擎、对外接口等等,加上各种外围应用系统等等共同构成了全文检索系统。例如Apache Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索引擎。同时对其进行了 ...
【技术保护点】
一种实时全文搜索引擎事务操作的实现方法,其特征在于:将分布式搜索引擎作为主存储区,存放提交后生效的索引数据,索引管理接口端有本地文件缓存存储区,用于存放事务中涉及的临时索引数据。索引管理接口在事务过程中在本地文件缓冲存储区中对临时数据进行操作,当所有数据操作都完成提交且满足生效条件后,在临时缓冲区中的数据将标记为完成状态,并通过异步方式同步到分布式搜索引擎实现事务持久化。临时缓冲区中处于已提交完成状态的数据,对于正在处理的事务以及新的事务也都同时生效,未提交的数据只对当前事务生效,从而实现事务隔离功能。
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。