一种词库的更新方法和装置制造方法及图纸

技术编号:15499913 阅读:53 留言:0更新日期:2017-06-03 22:00
本发明专利技术实施例公开了一种词库的更新方法,所述方法包括:在启动服务器之后,将硬盘中的词库加载至内存中;每隔预设时间段检测硬盘中的词库的修改时间;在上一次检测到的修改时间与当前检测到的修改时间不同时,更新内存中的词库。本发明专利技术实施例还同时公开了一种词库的更新装置。本发明专利技术实施例旨在降低维护内存中的词库和扩展词库的成本,降低了运维难度,提升了用户体验度。

Method and device for updating Thesaurus

The embodiment of the invention discloses a method for updating the lexicon, the method comprises the following steps: at the start of the server, the hard disk in the thesaurus is loaded into memory; modify every time a preset period of time to detect hard disk in the lexicon; in the last modification time of the detected change time and detected at present update, in memory database. The embodiment of the invention also discloses an updating device of the thesaurus. The embodiment of the invention aims at reducing the cost of maintaining the thesaurus and extended thesaurus in memory, reducing the difficulty of operation and maintenance and improving the user experience.

【技术实现步骤摘要】
一种词库的更新方法和装置
本专利技术涉及互联网
,尤其涉及一种词库的更新方法和装置。
技术介绍
Solr是一个独立的企业级搜索应用服务器,使用Solr时,由于Solr自带的分词器无法满足中文分词问题,为了解决这一问题,需要依赖ik分词器对搜索或者索引字段进行分词,ik分词器在分词时需要依赖其存储在硬盘中的词库。当启动Solr后,ik分词器会一次性加载硬盘中的词库进内存,然而,一旦Solr启动后,对ik词库文件的更改,不能实时加载到内存中,在现有技术中,当ik词库文件更新后,为了更新内存上的词库,只能重启Solr服务,而这种方式会导致用户在一段时间内无法使用Solr进行搜索服务。
技术实现思路
有鉴于此,本专利技术的主要目的在于提出一种词库的更新方法和装置,旨在降低维护内存中的词库和扩展词库的成本,降低了运维难度,提升了用户体验度。为达到上述目的,本专利技术的技术方案是这样实现的:第一方面,本专利技术实施例提供了一种词库的更新方法,所述方法包括:在启动服务器之后,将硬盘中的词库加载至内存中;每隔预设时间段检测所述硬盘中的词库的修改时间;在上一次检测到的修改时间与当前检测到的修改时间不同时,更新所述内存中的词库。进一步地,所述更新所述内存中的词库,包括:调用预设的更新函数将所述内存中的词库更新为所述硬盘中的词库。进一步地,所述更新所述内存中的词库包括:获取所述硬盘中的词库的状态信息;其中,所述硬盘中的词库的状态信息为:删除记录;删除所述内存中的词库中所述删除记录中的分词。进一步地,所述更新所述内存中的词库包括:获取所述硬盘中的词库的状态信息;其中,所述硬盘中的词库的状态信息为:添加记录;将所述添加记录中的分词添加至所述内存中的词库中。进一步地,所述更新所述内存中的词库包括:获取所述硬盘中的词库的状态信息;其中,所述硬盘中的词库的状态信息为:更换记录;根据所述更换记录中的被更换分词查找到所述内存中的词库中的被更换分词,将所述内存中的词库中的被更换分词更新为所述更换记录中的更换分词。第二方面,本专利技术实施例提供了一种词库的更新装置,所述装置包括:加载模块,用于在启动服务器之后,将硬盘中的词库加载至内存中;检测模块,用于每隔预设时间段检测所述硬盘中的词库的修改时间;更新模块,用于在上一次检测到的修改时间与当前检测到的修改时间不同时,更新所述内存中的词库。进一步地,所述更新模块,具体用于调用预设的更新函数将所述内存中的词库更新为所述硬盘中的词库。进一步地,所述更新模块,具体用于获取所述硬盘中的词库的状态信息;其中,所述硬盘中的词库的状态信息为:删除记录;所述更新模块,还用于删除所述内存中的词库中所述删除记录中的分词。进一步地,所述更新模块,具体用于获取所述硬盘中的词库的状态信息;其中,所述硬盘中的词库的状态信息为:添加记录;所述更新模块,还用于将所述添加记录中的分词添加至所述内存中的词库中。进一步地,所述更新模块,具体用于获取所述硬盘中的词库的状态信息;其中,所述硬盘中的词库的状态信息为:更换记录;所述更新模块,还用于根据所述更换记录中的被更换分词查找到所述内存中的词库中的被更换分词,将所述内存中的词库中的被更换分词更新为所述更换记录中的更换分词。本专利技术实施例所提供的一种词库的更新方法和装置,在启动服务器之后,首先,将硬盘中的词库加载至内存中,从而方便分词器使用内存中的词库,然后,每隔预设时间段检测硬盘中的词库的修改时间,在上一次检测到的修改时间与当前检测到的修改时间不同时,更新内存中的词库,也就是说,本专利技术实施例中,通过每隔预设时间段检测硬盘中的词库的修改时间,可以及时地知晓硬盘中词库的当前状态,通过对硬盘中的词库的修改时间的定时检测,使得内存中的词库能够得到及时地更新,避免了重启服务器所导致的用户在一段时间内无法使用服务器,并且,降低维护内存中的词库和扩展词库的成本,同时降低了运维难度,进而提升了用户体验度。附图说明图1为实现本专利技术各个实施例的一种可选的终端的硬件结构示意图;图2为如图1所示的移动终端的无线通信系统示意图;图3为本专利技术实施例一中的词库的更新方法的流程示意图;图4为本专利技术实施例二中的词库的更新方法的一种可选的流程示意图;图5为本专利技术实施例二中的词库的更新方法的另一种可选的流程示意图;图6为本专利技术实施例二中的词库的更新方法的再一种可选的流程示意图;图7为本专利技术实施例三中的词库的更新装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。现在将参考附图1来描述实现本专利技术各个实施例的终端。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本专利技术的说明,其本身并没有特定的意义。因此,"模块"与"部件"可以混合地使用。终端可以以各种形式来实施。例如,本专利技术中描述的终端可以包括诸如移动电话、智能电话、笔记本电脑、数字广播接收器、个人数字助理(PDA)、平板电脑(PAD)、便携式多媒体播放器(PMP)、导航装置等等的终端以及诸如数字TV、台式计算机等等的固定终端。下面,假设终端是终端。然而,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本专利技术的实施方式的构造也能够应用于固定类型的终端。图1为实现本专利技术各个实施例的一种可选的终端的硬件结构示意图。如图1所示,终端100可以包括无线通信单元110、音频/视频(A/V)输入单元120、用户输入单元130、感测单元140、输出单元150、存储器160、接口单元170、控制器180和电源单元190等等。图1示出了具有各种组件的终端,但是应理解的是,并不要求实施所有示出的组件,可以替代地实施更多或更少的组件,将在下面详细描述终端的元件。无线通信单元110通常包括一个或多个组件,其允许终端100与无线通信系统或网络之间的无线电通信。例如,无线通信单元可以包括广播接收模块111、移动通信模块112、无线互联网模块113、短程通信模块114和位置信息模块115中的至少一个。广播接收模块111经由广播信道从外部广播管理服务器接收广播信号和/或广播相关信息。广播信道可以包括卫星信道和/或地面信道。广播管理服务器可以是生成并发送广播信号和/或广播相关信息的服务器或者接收之前生成的广播信号和/或广播相关信息并且将其发送给终端的服务器。广播信号可以包括TV广播信号、无线电广播信号、数据广播信号等等。而且,广播信号可以进一步包括与TV或无线电广播信号组合的广播信号。广播相关信息也可以经由移动通信网络提供,并且在该情况下,广播相关信息可以由移动通信模块112来接收。广播信号可以以各种形式存在,例如,其可以以数字多媒体广播(DMB)的电子节目指南(EPG)、数字视频广播手持(DVB-H)的电子服务指南(ESG)等等的形式而存在。广播接收模块111可以通过使用各种类型的广播系统接收信号广播。特别地,广播接收模块111可以通过使用诸如多媒体广播-地面(DMB-T)、数字多媒体广播-卫星(DMB-S)、数字视频广播-手持(DVB-H),前向链路媒体(MediaFLO@)的数据广播系统、地面数字广播综合服务(ISDB-T)等等的数字广播系统接收数字广播。广播接收模块111可以被构造为适合提供广播信号的本文档来自技高网...
一种词库的更新方法和装置

【技术保护点】
一种词库的更新方法,其特征在于,所述方法包括:在启动服务器之后,将硬盘中的词库加载至内存中;每隔预设时间段检测所述硬盘中的词库的修改时间;在上一次检测到的修改时间与当前检测到的修改时间不同时,更新所述内存中的词库。

【技术特征摘要】
1.一种词库的更新方法,其特征在于,所述方法包括:在启动服务器之后,将硬盘中的词库加载至内存中;每隔预设时间段检测所述硬盘中的词库的修改时间;在上一次检测到的修改时间与当前检测到的修改时间不同时,更新所述内存中的词库。2.根据权利要求1所述的方法,其特征在于,所述更新所述内存中的词库,包括:调用预设的更新函数将所述内存中的词库更新为所述硬盘中的词库。3.根据权利要求1所述的方法,其特征在于,所述更新所述内存中的词库包括:获取所述硬盘中的词库的状态信息;其中,所述硬盘中的词库的状态信息为:删除记录;删除所述内存中的词库中所述删除记录中的分词。4.根据权利要求1所述的方法,其特征在于,所述更新所述内存中的词库包括:获取所述硬盘中的词库的状态信息;其中,所述硬盘中的词库的状态信息为:添加记录;将所述添加记录中的分词添加至所述内存中的词库中。5.根据权利要求1所述的方法,其特征在于,所述更新所述内存中的词库包括:获取所述硬盘中的词库的状态信息;其中,所述硬盘中的词库的状态信息为:更换记录;根据所述更换记录中的被更换分词查找到所述内存中的词库中的被更换分词,将所述内存中的词库中的被更换分词更新为所述更换记录中的更换分词。6.一种词库的更新装置,其特征在于...

【专利技术属性】
技术研发人员:姬晨陈亚堂张淑燕
申请(专利权)人:努比亚技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1