一种增量更新词库数据的控制方法及控制装置制造方法及图纸

技术编号:20723511 阅读:29 留言:0更新日期:2019-03-30 17:24
本发明专利技术提供了一种增量更新词库数据的控制方法,其用于对输入法词库进行增量更新,具体包括如下步骤:a.基于用户核心词库当前版本以及服务器核心词库最新版本确定是否需要增量更新,若是,则进入步骤b;b.基于当前版本的用户核心词库以及一个或多个版本的服务器核心词库确定增量信息;c.将所述增量信息更新至当前版本的用户核心词库,其通过判断是否需要增量更新,对于需要增量更新的当前版本用户核心词库,确定增量信息,再将增量信息加入当前版本的用户核心词库,从而实现对用户核心词库的更新,操作简单,提供了一种更新步骤与更新周期较短的增量更新词库数据的控制方法及控制装置,具有极高的商业价值。

【技术实现步骤摘要】
一种增量更新词库数据的控制方法及控制装置
本专利技术属于输入法更新
,特别涉及一种增量更新词库数据的控制方法及控制装置。
技术介绍
随着科学技术的日新月异,互联网在人们生活中起到了非常重要的作用,而目前,进入网页、app等的主要方式是文字输入,用户需要输入相关网址进入目标网站或者输入相关关键词搜索所需信息,同时电子文档的输入、电子邮件的使用、聊天软件的使用等均离不开输入法。输入法词库的大小,词库中包含的词条数目,词库中词条内容,均是影响用户输入时的方便程度的重要因素。以拼音输入法为例,当用户想要输入“魑魅魍魉”这一成语时,如果词库中包含这一成语,则用户只需要一次性输入该成语的拼音即可,但如果词库中不包含该成语,则用户需要单独输入四个字,进行四次输入并选择字的操作,非常不快捷,因此词库的更新和增量是提升输入法系统系性能的重要方面。目前,多数输入法是通过网络爬虫抓取页面,然后进行分词处理,再将其中的有效部分制作成词库,只有当服务器端生成新版本的词库时,客户端的输入法词库才会更新,因而更新周期较长,流程复杂,且每次更新时,需要重复全部过程,更新周期较慢,对于日新月异的互联网环境来说,词库版本低、词库内容陈旧、词库词条数目少等问题均会影响用户体验。需要一种输入法技术,针对新词,可以不必每一次均重复全部的更新步骤,而只需增加新词到词库中,从而实现较短的更新周期。
技术实现思路
针对现有技术存在的技术缺陷,根据本专利技术的一个方面,提供一种增量更新词库数据的控制方法,其用于对输入法词库进行增量更新,具体包括:a.基于用户核心词库当前版本以及服务器核心词库最新版本确定是否需要增量更新,若是,则进入步骤b;b.基于当前版本的用户核心词库以及一个或多个版本的服务器核心词库确定增量信息;c.将所述增量信息更新至当前版本的用户核心词库。进一步地,在所述步骤a之前,还包括步骤:i:将所述服务器核心词库版本进行分类,并确定服务器版本为m-n、m-n+1、m-n+2+…m-2、m-1、m,其中,所述m为服务器核心词库最新版本,n为服务器核心词库原始版本与服务器核心词库最新版本之差,所述1≤n;ii:确定原始版本的服务器核心词库与最新版本的服务器核心词库中每相邻版本之间的词库增量信息S,即S1、S2、S3、S4…Sk,其中k为在原始版本的服务器核心词库与最新版本的服务器核心词库中每相邻版本之间的词库增量信息的个数,所述k等于所述n。进一步地,所述步骤a还包括:-当用户核心词库当前版本小于服务器核心词库版本时,进入步骤b;-当用户核心词库当前版本等于服务器核心词库版本时,停止更新。进一步地,所述步骤b包括:b1:判断所述用户核心词库是否进行过增量升级,若是,则执行步骤b2,若不是,则执行步骤b3;b2:确定当前版本的用户核心词库以及当前版本的下一个版本的用户核心词库,并将当前版本的用户核心词库与当前版本的下一个版本的用户核心词库之间的增量词库作为增量信息;b3:确定当前版本的用户核心词库以及最新版本的服务器核心词库,并将当前版本的用户核心词库以及最新版本的服务器核心词库之间的增量词库作为增量信息。进一步地,所述步骤c包括:c1:将所述增量信息增加至当前版本的用户核心词库;c2:将增加增量信息的当前版本更替为当前版本。进一步地,所述步骤c之后,还包括:d:相隔时间t,重新执行a步骤。优选地,所述时间t的取值范围为:t≥180min。进一步地,所述步骤c之后,还包括:e:在用户下一次使用输入法时,重新执行步骤a。根据本专利技术的另一个方面,提供一种增量更新词库数据的控制装置,其用于对输入法词库进行增量更新,具体包括:第一确定装置:基于用户核心词库当前版本以及服务器核心词库版本确定是否需要增量更新;第二确定装置:基于用户核心词库当前版本确定增量信息;第一处理装置:将所述增量信息更新至用户核心词库。进一步地,还包括:第二处理装置:将所述服务器核心词库版本进行分类,并确定服务器版本为m-n、m-n+1、m-n+2+…m-2、m-1、m;第三确定装置:确定服务器核心词库原始版本与服务器核心词库最新版本中每相邻版本之间的词库增量信息S。进一步地,还包括:第四确定装置:确定当前版本的用户核心词库以及当前版本的下一个版本的用户核心词库,或确定当前版本的用户核心词库以及最新版本的服务器核心词库;第三处理装置:将当前版本的用户核心词库与当前版本的下一个版本的用户核心词库之间的增量词库作为增量信息,或将当前版本的用户核心词库以及最新版本的服务器核心词库之间的增量词库作为增量信息。进一步地,还包括:第四处理装置:将所述增量信息增加至当前版本的用户核心词库,;第五处理装置:将增加增量信息的当前版本更替为当前版本。进一步地,还包括:第六处理装置:相隔时间t,重新执行a步骤。进一步地,还包括:第七处理装置:在用户下一次使用输入法时,重新执行步骤a。本专利技术通过基于用户词库当前版本以及服务器词库版本确定是否需要增量更新,并基于用户词库当前版本确定增量信息,所述增量信息为当前版本的用户核心词库与当前版本的下一个版本的用户核心词库之间的增量词库,或为当前版本的用户核心词库以及最新版本的服务器核心词库之间的增量词库,确定增量信息后,将所述增量信息更新至用户词库,其用于对输入法词库进行增量更新,本专利技术操作简单、实用性强,可以减少更新词库的步骤,缩短词库更新周期,具有极高的商业价值。附图说明通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1示出了本专利技术的具体实施方式的,一种增量更新词库数据的控制方法的具体流程示意图;图2示出了本专利技术的第一实施例的,将所述服务器核心词库版本进行分类,并确定服务器版本为m-n、m-n+1、m-n+2+…m-2、m-1、m,以及确定原始版本的服务器核心词库与最新版本的服务器核心词库中每相邻版本之间的词库增量信息S,即S1、S2、S3、S4…Sk的具体流程示意图;图3示出了本专利技术的第二实施例的,基于用户核心词库当前版本以及服务器核心词库最新版本确定是否需要增量更新的具体流程示意图;图4示出了本专利技术的第三实施例的,基于当前版本的用户核心词库以及一个或多个版本的服务器核心词库确定增量信息的具体流程示意图;图5示出了本专利技术的第四实施例的,将所述增量信息更新至当前版本的用户核心词库的具体流程示意图;图6示出了本专利技术的第五实施例的,相隔时间t,重新执行a步骤的具体流程示意图;图7示出了本专利技术的第六实施例的,在用户下一次使用输入法时,重新执行步骤a的具体流程示意图;以及图8示出了本专利技术的另一具体实施方式,一种增量更新词库数据的控制装置的模块连接示意图。具体实施方式为了更好的使本专利技术的技术方案清晰的表示出来,下面结合附图对本专利技术作进一步说明。图1示出了本专利技术的具体实施方式的,一种增量更新词库数据的控制方法的具体流程示意图,其用于对输入法词库进行增量更新,本领域技术人员理解,目前,多数输入法是通过网络爬虫抓取页面,然后进行分词处理,再将其中的有效部分制作成词库,只有当服务器端生成新版本的词库时,客户端的输入法词库才会更新,因而更新周期较长,流程复杂,且每次更新时,需要重复全部过程,更新周期较慢,而增量更新是指在进行本文档来自技高网...

【技术保护点】
1.一种增量更新词库数据的控制方法,其用于对输入法词库进行增量更新,其特征在于,包括如下步骤:a.基于用户核心词库当前版本以及服务器核心词库最新版本确定是否需要增量更新,若是,则进入步骤b;b.基于当前版本的用户核心词库以及一个或多个版本的服务器核心词库确定增量信息;c.将所述增量信息更新至当前版本的用户核心词库。

【技术特征摘要】
1.一种增量更新词库数据的控制方法,其用于对输入法词库进行增量更新,其特征在于,包括如下步骤:a.基于用户核心词库当前版本以及服务器核心词库最新版本确定是否需要增量更新,若是,则进入步骤b;b.基于当前版本的用户核心词库以及一个或多个版本的服务器核心词库确定增量信息;c.将所述增量信息更新至当前版本的用户核心词库。2.根据权利要求1所述的控制方法,其特征在于,在所述步骤a之前,还包括步骤:i:将所述服务器核心词库版本进行分类,并确定服务器版本为m-n、m-n+1、m-n+2+…m-2、m-1、m,其中,所述m为服务器核心词库最新版本,n为服务器核心词库原始版本与服务器核心词库最新版本之差,所述1≤n;ii:确定原始版本的服务器核心词库与最新版本的服务器核心词库中每相邻版本之间的词库增量信息S,即S1、S2、S3、S4…Sk,其中k为在原始版本的服务器核心词库与最新版本的服务器核心词库中每相邻版本之间的词库增量信息的个数,所述k等于所述n。3.根据权利要求1或2所述的控制方法,其特征在于,所述步骤a还包括:-当用户核心词库当前版本小于服务器核心词库版本时,进入步骤b;-当用户核心词库当前版本等于服务器核心词库版本时,停止更新。4.根据权利要求3所述的控制方法,其特征在于,所述步骤b包括:b1:判断所述用户核心词库是否进行过增量升级,若是,则执行步骤b2,若不是,则执行步骤b3;b2:确定当前版本的用户核心词库以及当前版本的下一个版本的用户核心词库,并将当前版本的用户核心词库与当前版本的下一个版本的用户核心词库之间的增量词库作为增量信息;b3:确定当前版本的用户核心词库以及最新版本的服务器核心词库,并将当前版本的用户核心词库以及最新版本的服务器核心词库之间的增量词库作为增量信息。5.根据权利要求4所述的控制方法,其特征在于,所述步骤c包括:c1:将所述增量信息增加至当前版本的用户核心词库;c2:将增加增量信息的当前版本更替为当前版本...

【专利技术属性】
技术研发人员:李卿黄修斌
申请(专利权)人:上海二三四五网络科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1