【技术实现步骤摘要】
统一搜索词库更新方法及装置
本专利技术涉及自动程序设计
,尤其是涉及一种统一搜索词库更新方法及装置。
技术介绍
本部分旨在为权利要求书中陈述的本专利技术实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。Elasticsearch(以下简称ES)是一个分布式、高扩展、高实时的搜索与数据分析引擎。它能很方便的使大量数据具有搜索、分析和探索的能力。统一搜索基于ElasticSearch的ik分词器插件进行中文分词及索引,在定义扩展词库时一般都采用读取存放于ES配置目录的扩展词库文件的方式,在进行扩展词库内容变更后,需要重启ES才能生效;这种词库扩展方式在集群部署时需要逐个重启服务器,当集群数量扩大到一定规模时变得尤为困难。
技术实现思路
本专利技术提供了一种统一搜索词库更新方法及装置,该方法可以自动实现统一搜索词库更新,降低运维成本,提高词库更新效率,进而确保词库的更新能够及时的影响用户查询结果,使搜索结果更加精准精确。第一方面,本专利技术实施例提供了一种统一搜索词库 ...
【技术保护点】
1.一种统一搜索词库更新方法,其特征在于,包括:/n监听目标数据库,得到监听结果;/n根据所述监听结果,利用词库更新插件更新所述统一搜索词库。/n
【技术特征摘要】
1.一种统一搜索词库更新方法,其特征在于,包括:
监听目标数据库,得到监听结果;
根据所述监听结果,利用词库更新插件更新所述统一搜索词库。
2.根据权利要求1所述的方法,其特征在于,所述词库更新插件包括第一插件和第二插件;
监听目标数据库,得到监听结果之前,还包括:
将所述统一搜索词库中的第一类词信息存储至所述第一插件,第二类词信息存储至所述第二插件。
3.根据权利要求2所述的方法,其特征在于,监听目标数据库,包括:
监听目标数据库中的第一类词信息变动情况和第二类词信息变动情况,得到监听结果。
4.根据权利要求3所述的方法,其特征在于,所述第一类词信息包括第一版本号信息,所述第二类词信息包括第二版本号信息;
监听目标数据库中的第一类词信息变动情况和第二类词信息变动情况,得到监听结果,包括:
若所述第一版本号信息存在变动,则确定监听结果为第一类词信息存在更新;
若所述第二版本号信息存在变动,则确定监听结果为第二类词信息存在更新。
5.根据权利要求4所述的方法,其特征在于,根据所述监听结果,利用词库更新插件更新所述统一搜索词库,包括:
若所述监听结果为第一类词信息存在更新,则将目标数据库中更新的第一类词信息添加至所述第一插件;
若所述监听结果为第二类词信息存在更新,则将目标数据库中更新的第二类词信息添加至所述第二插件。
6.根据权利要求5所述的方法,其特征在于,所述第一插件包括分词处理组件和存储组件;
将目标数据库中更新的第一类词信息添加至所述第一插件,包括:
利用所述分词处理组件对所述更新的第一类词信息进行格式转换,得到格式转换结果;
将所述格式转换结果发送至所述存储组件。
7.根据权利要求5所述的方法,其特征在于,所述第二插件包括第一存储组件和第二存储组件;
将目标数据库中更新的第二类词信息添加至所述第二插件,包括:
将所述第二类词信息中的第一组词数据存储至所述第一存储组件;
将所述第二类词信息中的第二组词数据存储至所述第二存储组件。
8.根据权利要求2-7任一项所述的方法,其特征在于,所述第一类词信息包括同义词数据;所述第二类词信息包括自定义词数据和停止词数据。
9.一种统一搜索词库更新装置,其特征在于,包括:
监听模块,用于监听目标数据库,得到监听结果;
更新模块,用于根据所...
【专利技术属性】
技术研发人员:徐士元,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。