一种分类词库系统及其更新和维护方法、以及客户端技术方案

技术编号:3855370 阅读:341 留言:1更新日期:2012-04-11 18:40
本发明专利技术公开了一种分类词库系统,包括:输入法核心处理模块、分类词库维护模块和分类词库存储模块;其中,输入法核心处理模块,用于实现输入法的基本功能;分类词库存储模块,用于存储一个或一个以上分类词库文件,并存储含有分类词库元信息的分类词库列表文件;每个分类词库文件对应一个分类词库,用于保存所对应分类词库的词的信息;分类词库列表文件,用于记录用户启用的各个分类词库的元信息,支持分类词库的维护和更新;分类词库维护模块,用于对分类词库列表文件进行维护管理。本发明专利技术还同时公开了一种分类词库的更新方法和维护方法、以及客户端,采用本发明专利技术能根据用户需求提供不同的个性化词库,方便用户的使用。

【技术实现步骤摘要】

本专利技术涉及输入法词库,特别是涉及一种分类词库系统及其更新和维护方 法、以及客户端。
技术介绍
计算机用户通常利用中文输入软件将汉字输入到智能设备,中文输入软 件是运行于计算机操作系统上的一个工具软件,将键盘输入的编码或其他非 键盘输入的媒体数据转换成汉字输入的软件。中文输入软件可分为键盘输入 软件和非键盘输入软件。目前比较成熟且使用最广的就是键盘中文输入软件,键盘中文输入软件 就是利用键盘,根据一定的编码规则来输入汉字的一种方法。具体来说,对于英文字母输入,由于对应着键盘上的26个字母,直接输入即可;而对于 汉字输入,由于汉字的字数有几万个,且与键盘没有任何对应关系,因此为 了向计算机中输入汉字,必须对汉字进行编码,并将这些编码与键盘上的键 联系起来,然后就能通过键盘输入某个汉字的编码,再根据编码转换成汉字。 现有汉字编码方案已经有数百种,其中在电脑上已经运行的就有几十种,作 为一种图形文字,汉字是由字的音、形、义来共同表达的,汉字输入的编码 方法,基本上都是釆用将音、形、义与特定的键相联系,再根据不同汉字进 行组合来完成汉字的输入的。非键盘中文输入软件包括手写输入软件、光学字符识别技术(OCR)输 入软件、和语音输入软件等。其中,手写输入软件是一种笔式环境下的手写 中文识别输入软件,只要在手写板上按日常习惯写字,计算机就能将其识别 显示出来。 一般,手写输入软件需要配套的硬件手写板,在配套的手写板上用笔来书写录入汉字,不仅方便、快捷,且错字率也比较低。此外,用鼠标 在指定区域内也可以写出文字来,然后通过手写软件转换成汉字,只是这种 方法要求鼠标搡作非常熟练。OCR输入软件是先将要输入的文稿通过扫描仪转化为图形,然后将图 形转换为文字。因此,这种输入方法需要配备扫描仪,而且原稿的印刷质量 越髙,识别的准确率就越高, 一般最好是印刷体的文字,比如图书、杂志等, 如果原稿的纸张较薄,那么有可能在扫描时纸张背面的图形、文字也透射过 来,干扰最后的识别效果。语音输入方法是根据操作者的语音,由计算机将语音识别成汉字的输入 方法,因此又称声控输入方法。语音输入方法通过与计算机相连的话简向计 算机输入汉字的语音,利用语音识别系统分析辩识汉字或词组,把识别后的 汉字显示在编辑区中,再通过"发送"功能将编辑区的文字传到计算机其它文 档的编辑中。语音输入法只要会读出汉字的读音即可,使用起来简单、快捷。无论采用上述哪种输入方法,输入软件都会根据用户输入的字或字的组 合在自身已有的词库中进行检索,根据检索结果生成候选词供用户选择,确 定最终输入的词句。对于每种输入方法,都对应有自己的基本词库,存储有各种常用字词的信息;用于完成从基本词库读取字词并生成候选词的模块一般称为输入法核心处理模块。随着时代的飞速发展,各种各样的新词层出不穷,而且,对于不同的用 户来说,由于他们各自关注的信息点、话题等等都不同,必然会在使用输入 法进行沟通时,希望能更准确的获得自己所需的热点字词,而这些字词有很多可能是原有基本词库中没有的;或者,不容易查找到的。显然,仅仅基于各种输入法的原有基本词库进行输入,已经不能满足用户的需求,用户希望有针对自身需求提供不同类别字词的个性化词库,比如有的用户比较喜欢成语,经常会用到成语,希望设置专门的成语词库;有的用户比较关心足球 相关信息,希望设置专用的足球信息词库;再比如某个车友会的成员,所 有成员都会关注自己车型的相关信息以及车友会的相关信息,那么,对于这个群组的人员就希望设置车友会专用词库,目前还没有人提出能根据用户需 求提供专用个性化词库的相关实现方案。
技术实现思路
有鉴于此,本专利技术的主要目的在于提供一种分类词库系统及其更新和维护 方法、以及客户端,能根据用户需求提供不同的个性化词库,方便用户的使用。 为达到上述目的,本专利技术的技术方案是这样实现的本专利技术提供了一种分类词库系统,包括输入法核心处理模块、分类词库 维护模块和分类词库存储模块;其中,输入法核心处理模块,用于实现输入法的基本功能;分类词库存储模块,用于存储一个或一个以上分类词库文件,并存储含有 分类词库元信息的分类词库列表文件;分类词库维护模块,用于对分类词库列表文件进行维护管理;其中,每个分类词库文件对应一个分类词库,用于保存所对应分类词库的 词的信息;分类词库列表文件,用于记录用户启用的各个分类词库的元信息, 支持分类词库的维护和更新。上述方案中,该分类词库系统还包括分类词库更新模块和分类词库更新服 务器;其中,分类词库更新模块,用于更新客户端的分类词库;分类词库更新 服务器,用于提供需更新的分类词库的信息和分类词库文件。其中,所述更新 为手动触发更新、或为自动更新;所述更新为周期性更新、或按指定时间更新、 或根据用户请求在需要时进行更新。上述方案中,所述元信息包括分类词库的版本标识、分类词库的名称、分 类词库的类别。所述维护管理包括增加分类词库、删除分类词库、启用分类词 库、禁用分类词库。所述分类词库在客户端本地生成,或由服务器端生成推送 给客户端。本专利技术还提供了一种分类词库的更新方法,包括分类词库更新服务器将 需更新的分类词库信息发送给分类词库更新模块;分类词库更新模块接收分类词库更新服务器返回的信息,确定需更新的分类词库;分类词库更新模块遍历待更新分类词库列表,分别向分类词库更新服务器发起请求,下载每个待更新的分类词库并覆盖本地的分类词库文件;下载完成后,设置需要重新加载分类词库的标志位。在分类词库更新服务器将需更新的分类词库信息发送给分类词库更新模块之前,该方法还包括分类词库更新模块构造请求更新分类词库版本标识的列表信息,并将所构造的列表信息发送给分类词库更新服务器;相应的,所述分类词库更新服务器将需更新的分类词库信息发送给分类词库更新模块为分类词库更新服务器根据收到的分类词库更新模块的请求,获取自身存储的需更新的分类词库信息,并将获取的分类词库信息和需要推荐的分类词库的信息发送给分类词库更新模块。上述方案中,所述确定需更新的分类词库具体为对每个分类词库,对比分类词库更新服务器返回信息中的版本标识和本地分类词库文件中的版本标识;如果分类词库更新服务器返回的版本标识更新,则将此分类词库版本标识添加到待更新分类词库列表中;如果本地没有分类词库更新服务器返回的分类词库信息对应的词库,则将此分类词库版本标识添加到待更新分类词库列表中。本专利技术还提供了一种分类词库的维护方法,包括设置分类词库列表文件,根据需对分类词库进行的维护搡作更新所述分类词库列表文件存储的分类词库元信息。本专利技术又提供了一种客户端,该客户端中设置有分类词库系统,所述分类词库系统包括输入法核心处理模块、分类词库维护模块和分类词库存储模块;其中,输入法核心处理模块,用于实现输入法的基本功能;分类词库存储模块,用于存储一个或一个以上分类词库文件,并存储含有分类词库元信息的分类词库列表文件;分类词库维护模块,用于对分类词库列表文件进行维护管理;其中,每个分类词库文件对应一个分类词库,用于保存所对应分类词库的8词的信息;分类词库列表文件,用于记录用户启用的各个分类词库的元信息,支持分类词库的维护和更新。本专利技术所提供的分类词库系统及其更新和维护方法、以及客户端,根据用户需求设置本文档来自技高网
...

【技术保护点】
一种分类词库系统,其特征在于,该分类词库系统包括:输入法核心处理模块、分类词库维护模块和分类词库存储模块;其中, 输入法核心处理模块,用于实现输入法的基本功能; 分类词库存储模块,用于存储一个或一个以上分类词库文件,并存储含有分 类词库元信息的分类词库列表文件; 分类词库维护模块,用于对分类词库列表文件进行维护管理; 其中,每个分类词库文件对应一个分类词库,用于保存所对应分类词库的词的信息;分类词库列表文件,用于记录用户启用的各个分类词库的元信息,支持分 类词库的维护和更新。

【技术特征摘要】

【专利技术属性】
技术研发人员:张会鹏
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:94[]

网友询问留言 已有1条评论
  • 来自[天津市联通] 2014年12月07日 11:19
    词库是词语资料的集合存贮于数据库中以备特定的程序检索调用
    0
1