一种输入法词库的升级方法和装置制造方法及图纸

技术编号:6039018 阅读:178 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种输入法词库的升级方法和装置,在服务器端将基于服务器端上一词库版本的词库调整信息记录在服务器端当前词库版本中,词库调整信息包括:针对上一词库版本各词语的词频变化状况以及基于词频变化状况确定的词语更新状况;获取客户端的词库版本号;将客户端的词库版本与服务器端当前词库版本之间所有版本的词库调整信息进行汇总,将汇总后得到的词语更新信息以及所述服务器端当前词库版本的版本号发送给所述客户端。客户端能够根据词语更新信息将需要添加的词语添加入客户端的输入法词库,将需要删除的词语从客户端的输入法词库中删除,并更新客户端的词库版本号为服务器端当前词库版本的版本号。

【技术实现步骤摘要】
一种输入法词库的升级方法和装置
本专利技术涉及计算机
,特别涉及一种输入法词库的升级方法和装置。
技术介绍
随着计算机技术、互联网技术的普及与发展,以及人们信息交流的越加频繁,有着 越来越多新的词汇产生和被人们使用,例如会产生一些新的流行词汇、专业领域词汇或者 知名的人名、公司名等,为了满足用户对新词汇的使用需求,需要对输入法词库进行升级。现有对输入法词库进行升级的方式主要存在以下两种第一种升级方式通过更新输入法程序的方式来升级输入法程序中包含的词库。 显然在使用这种升级方式时,需要连带对整个输入法程序进行更新,升级过程复杂,升级效 率较低。第二种升级方式服务器端将新的词汇下发给客户端做增量更新,客户端将服务 器下发的新的词汇加入客户端的本地词库。这种方式中,客户端的词库会越来越庞大,可能 会加入大量很少使用的词汇,造成客户端所在终端的资源浪费。
技术实现思路
有鉴于此,本专利技术提供了一种输入法词库的升级方法和装置,以便于高效率地对 输入法词库进行升级,且避免造成客户端本地的词库臃肿和资源浪费。具体技术方案如下一种输入法词库的升级方法,该方法包括Al、将基于服务器端上一词库版本的词库调整信息记录在服务器端当前词库版本 中,所述词库调整信息包括针对所述上一词库版本各词语的词频变化状况以及基于词频 变化状况确定的词语更新状况;Bi、获取客户端的词库版本号;Cl、将所述客户端的词库版本与所述服务器端当前词库版本之间所有版本的词库 调整信息进行汇总,将汇总后得到的词语更新信息以及所述服务器端当前词库版本的版本 号发送给所述客户端;所述词语更新信息包括所述客户端需要添加的词语和需要删除的 词语中的至少一种。该方法还包括所述服务器端为发布的输入法程序配置一个基础版本号,当所述 输入法程序的词库发生调整时,为在一定时间后或词库调整到一定程度后形成的词库版本 配置基于所述基础版本号的子版本号。具体地,所述服务器通过以下方式中的一种或组合获取新的词语添加到所述服务 器端的词库中以及获取各词语的词频信息记录在所述服务器端词库中对语料库中的页面进行文本分析获取词语以及对各词语的出现词频进行统计,所 述语料库包括在设定时间段内从网络上抓取到的页面;或者,收集各客户端记录的输入词语和输入词频并进行汇总。其中,所述词频变化状况包括词语的词频相对于所述上一词库版本中该词语的 词频增加至或减少至的值,或者,词语的词频相对于所述上一词库版本中该词语的词频增 加或减少的幅值。所述词语更新状况包括所述服务器端当前词库版本相对于上一词库版本需要添 加的词语和需要删除的词语。具体地,所述服务器端当前词库版本相对于上一词库版本需要添加的词语由以下 方式中的一种或任意组合确定人工确定;将使用用户的数量达到预设的第一数量阈值且上一词库版本中不存在的词语确 定为所述服务器端当前词库版本相对于上一词库版本需要添加的词语;或者,将所述服务器端当前词库版本中词语的词频超过预设的第一词频阈值且上一词 库版本中不存在的词语确定为所述服务器端当前词库版本相对于上一词库版本需要添加 的词语。另外,所述服务器端当前词库版本相对于上一词库版本需要删除的词语由以下方 式中的一种或任意组合确定人工确定;将使用用户的数量低于预设的第二数量阈值且上一词库版本中存在的词语确定 为所述服务器端当前词库版本相对于上一词库版本需要删除的词语;或者,将所述服务器端当前词库版本中词语的词频低于预设的第二词频阈值且上一词 库版本中存在的词语确定为所述服务器端当前词库版本相对于上一词库版本需要删除的 词语。更进一步地,在所述Bl和步骤Cl之间还包括将所述客户端的词库版本与所述服 务器端当前词库版本进行比对,如果所述客户端的词库版本与所述服务器端当前词库版本 不具有相同的基础版本号,则执行步骤Dl ;如果所述客户端的词库版本与所述服务器端当 前词库版本具有相同的基础版本号且具有相同的子版本号,则执行步骤El ;如果所述客户 端的词库版本与所述服务器端当前词库版本具有相同的基础版本号但不具有相同的子版 本号,则继续执行所述步骤Cl ;D1、向所述客户端发送更新输入法程序的通知,以使客户端通过更新输入法程序 来更新输入法词库,结束对所述客户端的输入法词库升级流程;E1、向所述客户端发送无需词库升级的通知,结束对所述客户端的输入法词库升 级流程。更优地,在所述步骤Cl中进一步将所述词语更新信息所包含词语的词频信息发 送给所述客户端。一种输入法词库的升级方法,该方法包括A2、将客户端的词库版本号发送给服务器端;B2、接收所述服务器端发送来的词语更新信息和所述服务器端当前词库版本的版 本号,其中所述词语更新信息包括所述客户端需要添加的词语和所述客户端需要删除的 词语;C2、根据所述服务器端发送来的词语更新信息,将所述客户端需要添加的词语添加入客户端的输入法词库,将所述客户端需要删除的词语从所述客户端的输入法词库中删 除;D2、将所述客户端的词库版本号更新为所述服务器端当前词库版本的版本号。具体地,所述步骤A2包括所述客户端在达到更新词库升级周期时,主动向所述服务器端发送包含所述客户 端的词库版本号的词库升级请求;或者,所述客户端在检测到所述服务器端具有更新的词库版本后,主动向所述服务器端 发送包含所述客户端的词库版本号的词库升级请求;或者,所述服务器端在新的词库版本生成完毕后,触发所述客户端向所述服务器端发送 包含所述客户端的词库版本号的词库升级请求。另外,在所述步骤B2中还接收所述服务器端发送的所述词语更新信息所包含词 语的词频信息;该方法还包括利用所述词语更新信息所包含词语的词频信息对所述客户端的输 入法词库中相同词语的词频信息进行更新。具体地,步骤C2中将所述客户端需要删除的词语从所述客户端的输入法词库中 删除可以包括将所述客户端需要删除的词语中客户端记录的输入词频低于预设的删除要求的 词语从所述客户端的输入法词库中删除,将所述客户端需要删除的词语中客户端记录的输 入词频不低于预设的删除要求的词语在所述客户端的输入法词库中保留。其中,所述客户端记录的输入词频为所述客户端的用户输入词库中记录的使用 该客户端的用户实际输入词语的词频;所述用户输入词库独立于所述客户端的输入法程序的安装包。一种输入法词库的升级装置,设置于服务器端,该装置包括调整信息维护单元、 客户端侧交互单元和升级信息确定单元;所述调整信息维护单元,用于将基于服务器端上一词库版本的词库调整信息记录 在服务器端当前词库版本中,所述词库调整信息包括针对所述上一词库版本各词语的词 频变化状况以及基于词频变化状况确定的词语更新状况;所述客户端侧交互单元,用于获取客户端的词库版本号,将所述升级信息确定单 元得到的词语更新信息以及所述服务器端当前词库版本的版本号发送给所述客户端;所述升级信息确定单元,用于将所述客户端的词库版本与所述服务器端当前词库 版本之间所有版本的词库调整信息进行汇总,得到的词语更新信息;所述词语更新信息包 括所述客户端需要添加的词语和需要删除的词语中的至少一种。更进一步地,该装置还包括版本配置单元,用于为发布的输入法程序配置一个基 础版本号,当所述输入法程序的词库发生调整时,为在一定时间后或词库调整到一定程度 后形成本文档来自技高网...

【技术保护点】
一种输入法词库的升级方法,其特征在于,该方法包括:A1、将基于服务器端上一词库版本的词库调整信息记录在服务器端当前词库版本中,所述词库调整信息包括:针对所述上一词库版本各词语的词频变化状况以及基于词频变化状况确定的词语更新状况;B1、获取客户端的词库版本号;C1、将所述客户端的词库版本与所述服务器端当前词库版本之间所有版本的词库调整信息进行汇总,将汇总后得到的词语更新信息以及所述服务器端当前词库版本的版本号发送给所述客户端;所述词语更新信息包括:所述客户端需要添加的词语和需要删除的词语中的至少一种。

【技术特征摘要】

【专利技术属性】
技术研发人员:彭立志徐新意秦添
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1