细胞词库推送方法和服务器技术

技术编号:10101434 阅读:135 留言:0更新日期:2014-05-30 17:38
本发明专利技术公开了一种细胞词库推送方法和服务器。所述服务器用于接收客户端发送的输入法日志信息;获取输入法日志信息中的客户端ID和客户端选中词;查找与客户端ID对应的未下载细胞词库列表中的未下载细胞词库,获取未下载细胞词库中包括客户端选中词的第一匹配词库,将第一匹配词库对应于所述客户端ID的词库权值增加第一权值;当词库权值大于推送阈值时,将第一匹配词库推送至对应的客户端;在未下载细胞词库列表中,删除被推送的第一匹配词库。本发明专利技术在客户端不主动下载细胞词库的情况下,将客户端实际需要的细胞词库推送至客户端,增加了客户端对某一类别词条的输入精度,提高了客户端的输入效率。

【技术实现步骤摘要】
细胞词库推送方法和服务器
本专利技术涉及通信技术和计算机领域,尤其涉及一种细胞词库推送方法和服务器。
技术介绍
随着计算机技术的普及,计算机设备已经走入人们的工作、学习和生活中。输入法系统作为人机对话的接口,提供了将各种文字输入计算机或者其他移动终端的编码方法。因此,输入法已经成为用户与计算机交互的重要手段。当前的输入法系统一般是基于其词库中的候选词以及与候选词对应的候选词权重值为用户在输入过程中提供候选词及其排序。候选词及其排序是用户在输入过程中首选词命中高低的一个重要指标。由于不同的用户对于输入法的候选词条存在个性化的领域需求,例如,一个计算机领域的用户在日常生活中需要频繁使用到计算机相关的专业术语,而这些词语并不是每个用户都需要的。因此,对于这部分需求,输入法系统一般是通过细胞词库来满足。所述细胞词库,是指可细分化词库的功能名称,一个细胞词库就是一个细分类别的词汇集合,细胞词库的类别可以是某个专业领域(如医学领域词库),也可以是某个地区(如北京地名词库),也可以是某个游戏(如魔兽世界词汇)等。用户端通过对不同领域的专业词库有选择的下载,能够方便的使用输入法提供的细胞词库,提高了用户端的输入效率。在现有技术中,用户主要通过主动下载的方式获取需要的细胞词库,但是,随着社会节奏的加快,人们对于软件的学习时间也越来越短,很多人根本意识不到自己对某一类细胞词库的使用需求;同时,用户仅能通过细胞词库的命名主观判断是否需要下载相应的细胞词库,在一些特定情况下,用户是很难仅通过细胞词库的命名来获取该词库所有信息的,因此,用户的主观判断也是不尽准确的;另外,如果用户将所有的细胞词库均下载到用户词典中,不仅会增加输入法软件的负担,也会在用户日常的输入过程中出现一些不常用的候选词,增加了用户对于候选词的选择成本。
技术实现思路
有鉴于此,本专利技术提供一种细胞词库推送方法和服务器,在客户端不主动下载细胞词库的情况下,将客户端实际需要的细胞词库推送至客户端,增加了客户端对某一类别词条的输入精度,提高了客户端的输入效率。在第一方面,本专利技术实施例提供了一种细胞词库推送服务器,包括:日志接收单元,用于接收客户端发送的输入法日志信息;参数获取单元,用于获取所述输入法日志信息中的客户端ID和客户端选中词;第一词库权值累加单元,用于查找与所述客户端ID对应的未下载细胞词库列表中的未下载细胞词库,获取所述未下载细胞词库中包括所述客户端选中词的第一匹配词库,将所述第一匹配词库对应于所述客户端ID的词库权值增加第一权值;词库推送单元,用于将对应于所述客户端ID的词库权值大于推送阈值的第一匹配词库推送至与所述客户端ID对应的客户端;列表删除单元,用于在与所述客户端ID对应的未下载细胞词库列表中,删除被推送的第一匹配词库。在第二方面,本专利技术实施例提供了一种细胞词库推送方法,包括:接收客户端发送的输入法日志信息,其中,所述输入法日志信息包括客户端ID和客户端选中词;获取所述输入法日志信息中的客户端ID和客户端选中词;查找与所述客户端ID对应的未下载细胞词库列表中的未下载细胞词库,获取所述未下载细胞词库中包括所述客户端选中词的第一匹配词库,将所述第一匹配词库对应于所述客户端ID的词库权值增加第一权值;将对应于所述客户端ID的词库权值大于推送阈值的第一匹配词库推送至与所述客户端ID对应的客户端;在与所述客户端ID对应的未下载细胞词库列表中,删除被推送的第一匹配词库。本专利技术实施例通过获取客户端输入法日志信息中的客户端选中词,查找所述客户端选中词所属的细胞词库,当判断客户端频繁使用某个未被客户端下载的细胞词库中的候选词时,将该细胞词库推送至相应的客户端的技术手段,实现了在客户端不主动下载细胞词库的情况下,将客户端实际需要的细胞词库推送至客户端的技术效果,增加了客户端对某一类别词条的输入精度,提高了客户端的输入效率。附图说明图1是本专利技术第一实施例细胞词库推送系统的示意图;图2是本专利技术第一实施例的一种优选实施方式的应用场景;图3是本专利技术第一实施例的一种服务器向客户端推送细胞词库的数据交互过程;图4是本专利技术第一实施例的另一种服务器向客户端推送细胞词库的数据交互过程;图5是本专利技术第二实施例的细胞词库推送方法的流程图;图6是本专利技术第二实施例的一种删除客户端细胞词库方法的流程图;图7是可用于实施本专利技术方案的服务器的结构示意图。具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图对本专利技术具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。第一实施例图1是本专利技术第一实施例的细胞词库推送系统的示意图。如图1所示,细胞词库推送系统10包括:客户端11和服务器12。其中,客户端11和服务器12通过有线或者无线数据网络连接。以上所述通过有线或者无线数据网络连接是指服务器12可以通过网络即时地接收客户端11发送的消息,或者,服务器12可以通过网络间接地、非即时地(例如,通过消息存储服务器中转)接收客户端11发送的消息。其中,客户端11用于向服务器12发送输入法日志信息;接收服务器12推送的细胞词库;根据接收到的细胞词库,更新自身的用户词库。具体地,当客户端11满足预定的时间触发条件后,向服务器12发送输入法日志信息,例如:设定客户端11每隔一天向服务器12发送输入法日志信息;或者当客户端11满足预定的事件触发条件后,向服务器12发送输入法日志信息,例如:当客户端11自身存储的输入法日志信息大于1M时,向服务器12发送输入法日志信息;或者当客户端11检测到网络连接后,向服务器发送输入法日志信息。优选的,客户端11向服务器12成功发送输入法日志信息后,删除自身存储的输入法日志信息。具体地,客户端11发送的输入法日志信息中包括客户端ID和客户端选中词。表1中示出了一种输入法日志信息的数据格式。如表1所示,客户端ID为客户端的设备标示,客户端选中词为客户端在一次输入中选择的候选词。表1客户端ID客户端选中词07f52scz进栈当然,本领域技术人员应该理解,输入法日志信息中的客户端ID还可以使用客户端物理地址或者客户端网络地址等其他形式的可唯一标示客户端身份的ID,对此并不限定。具体地,客户端11接收的细胞词库为一个细分类别的候选词集合,其中,细胞词库中每一个候选词具有预设的候选词权重值(例如,50)。表2中示出了一种细胞词库的数据格式。表2在本实施例中,客户端输入法系统中存储有用户词库,该用户词库中存储有相应的候选词,每个候选词具有与之对应的候选词权重值。客户端11接收到服务器12发送的细胞词库后,将细胞词库中的候选词加入用户词库中,当客户端通过输入法系统输入字符串时,获取用户词库中与输入字符串对应的候选词,根据候选词的权重值,排序显示相应的候选词。举例而言,当客户端11未下载计算机类细胞词库之前,客户端11输入字符串“jinzhan”后,优选显示的候选词为“进展”和“进站”等常用的生活词汇,当客户端11下载安装计算机类细胞词库后,计算机词汇“进栈”也会优先显示。通过在用户词库中添加细胞词库的方式,当客户端需要频繁使用某个特殊领域的候本文档来自技高网
...
细胞词库推送方法和服务器

【技术保护点】

【技术特征摘要】
1.一种细胞词库推送服务器,其特征在于,包括:日志接收单元,用于接收客户端发送的输入法日志信息,其中,所述输入法日志信息包括客户端ID和客户端选中词;参数获取单元,用于获取所述输入法日志信息中的客户端ID和客户端选中词;未下载词库权值累加单元,用于查找与所述客户端ID对应的未下载细胞词库列表中的未下载细胞词库,获取所述未下载细胞词库中包括所述客户端选中词的第一匹配词库,将所述第一匹配词库对应于所述客户端ID的词库权值增加第一权值;词库推送单元,用于将对应于所述客户端ID的词库权值大于推送阈值的第一匹配词库无感知的推送至与所述客户端ID对应的客户端;列表删除单元,用于在与所述客户端ID对应的未下载细胞词库列表中,删除被推送的第一匹配词库;所述服务器还包括:已下载词库权值累加单元,用于查询与所述客户端ID对应的已下载细胞词库列表中的已下载细胞词库,获取所述已下载细胞词库中包括所述客户端选中词的第二匹配词库,将所述第二匹配词库对应于所述客户端ID的词库权值增加第二权值;词库删除单元,用于在预定的时间阈值内,获取所述已下载细胞词库中对应于所述客户端ID的词库权值的增量值小于删除阈值的待删除细胞词库,发送删除所述待删除细胞词库的指令至与所述客户端ID对应的客户端,在与所述客户端ID对应的已下载细胞词库列表中,删除所述待删除细胞词库;其中,所述已下载列表和所述未下载列表,通过客户端ID存储的词库下载标识确定。2.根据权利要求1所述的细胞词库推送服务器,其特征在于,所述服务器还包括:未下载词库修改单元,用于将所述被推送的第一匹配词库加入与所述客户端ID对应的已下载细胞词库列表中,将所述被推送的第一匹配词库对应于所述客户端ID的词库权值设置为初始值;已下载词库修改单元,用于将所述待删除细胞词库加入所述客户端ID对应的未下载细胞词库中,将所述待删除细胞词库对应于所述客户端ID的词库权值设置为初始值。3.根据权利要求1所述的细胞词库推送服务器,其特征在于,所述客户端发送的输入法日志信息中还包括与所述客户端选中词对应的系统时间,所述参数获取单元还用于获取所述输入法日志信息中的与所述客户端选中词对应的系统时间;所述服务器还包括:第一权值计算单元,用于根据所述系统时间,计算所述第一权值;第二权值计算单元,用于根据所述系统时间,计算所述第二权值。4.一种细胞词库推送方法,其特...

【专利技术属性】
技术研发人员:陈龙
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1