The embodiment of the invention discloses a method for updating the lexicon, the method comprises the following steps: at the start of the server, the hard disk in the thesaurus is loaded into memory; modify every time a preset period of time to detect hard disk in the lexicon; in the last modification time of the detected change time and detected at present update, in memory database. The embodiment of the invention also discloses an updating device of the thesaurus. The embodiment of the invention aims at reducing the cost of maintaining the thesaurus and extended thesaurus in memory, reducing the difficulty of operation and maintenance and improving the user experience.
【技术实现步骤摘要】
一种词库的更新方法和装置
本专利技术涉及互联网
,尤其涉及一种词库的更新方法和装置。
技术介绍
Solr是一个独立的企业级搜索应用服务器,使用Solr时,由于Solr自带的分词器无法满足中文分词问题,为了解决这一问题,需要依赖ik分词器对搜索或者索引字段进行分词,ik分词器在分词时需要依赖其存储在硬盘中的词库。当启动Solr后,ik分词器会一次性加载硬盘中的词库进内存,然而,一旦Solr启动后,对ik词库文件的更改,不能实时加载到内存中,在现有技术中,当ik词库文件更新后,为了更新内存上的词库,只能重启Solr服务,而这种方式会导致用户在一段时间内无法使用Solr进行搜索服务。
技术实现思路
有鉴于此,本专利技术的主要目的在于提出一种词库的更新方法和装置,旨在降低维护内存中的词库和扩展词库的成本,降低了运维难度,提升了用户体验度。为达到上述目的,本专利技术的技术方案是这样实现的:第一方面,本专利技术实施例提供了一种词库的更新方法,所述方法包括:在启动服务器之后,将硬盘中的词库加载至内存中;每隔预设时间段检测所述硬盘中的词库的修改时间;在上一次检测到的修改时间与当前检测到的修改时间不同时,更新所述内存中的词库。进一步地,所述更新所述内存中的词库,包括:调用预设的更新函数将所述内存中的词库更新为所述硬盘中的词库。进一步地,所述更新所述内存中的词库包括:获取所述硬盘中的词库的状态信息;其中,所述硬盘中的词库的状态信息为:删除记录;删除所述内存中的词库中所述删除记录中的分词。进一步地,所述更新所述内存中的词库包括:获取所述硬盘中的词库的状态信息;其中,所述硬盘中 ...
【技术保护点】
一种词库的更新方法,其特征在于,所述方法包括:在启动服务器之后,将硬盘中的词库加载至内存中;每隔预设时间段检测所述硬盘中的词库的修改时间;在上一次检测到的修改时间与当前检测到的修改时间不同时,更新所述内存中的词库。
【技术特征摘要】
1.一种词库的更新方法,其特征在于,所述方法包括:在启动服务器之后,将硬盘中的词库加载至内存中;每隔预设时间段检测所述硬盘中的词库的修改时间;在上一次检测到的修改时间与当前检测到的修改时间不同时,更新所述内存中的词库。2.根据权利要求1所述的方法,其特征在于,所述更新所述内存中的词库,包括:调用预设的更新函数将所述内存中的词库更新为所述硬盘中的词库。3.根据权利要求1所述的方法,其特征在于,所述更新所述内存中的词库包括:获取所述硬盘中的词库的状态信息;其中,所述硬盘中的词库的状态信息为:删除记录;删除所述内存中的词库中所述删除记录中的分词。4.根据权利要求1所述的方法,其特征在于,所述更新所述内存中的词库包括:获取所述硬盘中的词库的状态信息;其中,所述硬盘中的词库的状态信息为:添加记录;将所述添加记录中的分词添加至所述内存中的词库中。5.根据权利要求1所述的方法,其特征在于,所述更新所述内存中的词库包括:获取所述硬盘中的词库的状态信息;其中,所述硬盘中的词库的状态信息为:更换记录;根据所述更换记录中的被更换分词查找到所述内存中的词库中的被更换分词,将所述内存中的词库中的被更换分词更新为所述更换记录中的更换分词。6.一种词库的更新装置,其特征在于...
【专利技术属性】
技术研发人员:姬晨,陈亚堂,张淑燕,
申请(专利权)人:努比亚技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。