一种分类词库实现的方法和输入法客户端技术

技术编号:4131915 阅读:179 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种分类词库实现的方法和输入法客户端,属于输入法领域。方法包括:输入法客户端获得分类词库文件;根据获得的分类词库文件,生成合并词库文件;接收用户输入的字符串,在合并词库文件中查找匹配的候选词;将查找到的候选词提供给用户,当接收到用户的选择确认后,将用户选择的候选词输入到计算机。装置包括:获得模块、生成模块、查找模块以及输入模块。本发明专利技术实施例提供的分类词库文件格式简单,通过对各分类词库文件进行合并得到合并词库文件,进行候选词查找时,只需要查找该合并词库文件,从而有效避免了传统的分类词库系统中,分类词库数目较大时对输入法输入效率的影响,提高了输入法的输入速度,提高了用户的使用体验。

【技术实现步骤摘要】

本专利技术涉及输入法领域,特别涉及一种分类词库实现的方法和输入法客户端
技术介绍
用户借助中文输入软件,可以实现将汉字输入到计算机,该软件可以把键 盘输入的编码或其他非键盘输入的媒体数据转换成汉字输入到计算机中。中文输入软件可分为键盘输入和非键盘输入,其中,非^r建盘中文输入软件包括手写输入软件、语音输入软件、OCR (Optical Character Recognition,光学字符 识别技术)输入软件等。其中,中文输入软件在实现汉字的生成时,根据用户输入的字符串,查找 中文输入软件自带的系统词库生成候选词,然后将查找到的候选词提供给用户, 由用户进行选择确认后,将用户所期望获取的词输入到计算机。随着信息化的 迅猛发展,信息的种类越来越多,新兴热门词越来越多,也被人们越来越多的 使用,原有中文输入软件自带的系统词库已经不能满足用户的个性化输入的需 求,于是在系统词库的基础上出现了分类词库。所谓分类词库,是指由某一特 定应用范围下会使用到的词的相关信息组成的词库,例如,分类词库为电影名 称词库,即该词库中只记录关于电影名称的词的相关信息;再如股票基金词库, 该词库中只记录关于股票基金相关的词的相关信息。为了便于查询,该分类词 库中还保存有各词的索引等信息,相应地,中文输入软件在根据用户输入的字 符串进行候选词生成时,会依次遍历当前可用的各分类词库,从而形成候选词, 供用户进行选^^确认。专利技术人在实现本专利技术的过程中发现,现有技术在对当前分类词库进行遍历, 进行匹配的候选词查找时,如果分类词库数目较多时,需要对分类词库依照顺 序进行遍历,大大影响了单词的输入速度,输入效率降低,从而导致用户体验 下降。
技术实现思路
为了提高输入法的速度,提高用户的使用体验,本专利技术实施例提供了一种分类词库实现的方法和输入法客户端。所述技术方案如下一方面,本专利技术实施例提供了一种分类词库实现的方法,所述方法包括 输入法客户端获得分类词库文件; 根据所述获得的所述分类词库文件,生成合并词库文件; 接收用户输入的字符串,在所述合并词库文件中查找与所述字符串匹配的 候选词;将查找到的候选词提供给所述用户,当接收到用户的选择确认后,将 所述用户选择的候选词输入到计算机。其中,所述输入法客户端获得分类词库文件的步骤之前,所述方法还包括 根据用户选择的分类词库的词库名称,向分类词库服务器发起获取分类词 库的请求,所述请求中携带所述分类词库的词库标识;所述分类词库服务器接 收所述获取分类词库的请求,根据所述词库标识,向所述输入法客户端下发所 述词库标识对应的分类词库文件;或,所述输入法客户端向所述分类词库服务器发生更新请求,所述更新请求中 携带分类词库标识,所述分类词库服务器接收所迷更新请求, 一艮据所述分类词 库标识,向所述输入法客户端返回所述分类词库标识对应的版本标识,当所述 输入法客户端判断所述接收的版本标识高于本地保存的所述分类词库自身的版 本标识时,向所述分类词库服务器请求所述接收的版本标识对应的分类词库文 件;或,所述分类词库服务器主动向所述输入法客户端推送分类词库文件;或, 所述输入法客户端接收用户添加的文本格式的词库文件,对所述接收的用 户添加的文本格式的词库文件进行转换得到分类词库文件。其中,所述生成合并词库文件的步骤之前,所述方法还包括 为所述分类词库文件分配启用标识位;根据所述分类词库文件的启用标识位,从所述获得的所述分类词库文件中 选择出启用的分类词库文件;相应地,所述生成合并词库文件的步骤,包括根据所述选择出的启用的分类词库文件,生成合并词库文件。其中,任一所述分类词库文件携带拼音、词以及词频,所述根据所述获得的所述分类词库文件,生成合并词库文件的步骤,包括在所述获取的所述分类词库文件中,根据所述拼音、词以及词频,得到所 述词在所述合并词库文件中的相关信息;根据得到的所述词在所述合并词库文件中的相关信息,生成合并词库文件。其中,所述根据所述拼音、词以及词频,得到所述词在所述合并词库文件 中的相关信息的步骤,包括根据所述拼音和词,判断所述当前分类词库中的当前词是否在其他分类词 库中存在相同的词,如果是,则对所述当前词在不同分类词库中的词频进行叠 加或对所述当前词在不同分类词库中的词频取大,得到所述当前词在所述合并 词库文件中的词频;根据所述得到的当前词在所述合并词库文件中的词频、所 述当前词的拼音以及所述当前词,生成所述当前词所述合并词库文件中的相关 信息;如果否,则将所述当前分类词库中的当前词的词频、拼音以及所述当前词, 作为所述当前词所述合并词库文件中的相关信息。其中,所述根据得到的所述词在所述合并词库文件中的相关信息,生成合 并词库文件的步骤,包括生成合并词库文件。其中,所述生成合并词库文件的步骤之后,所述方法还包括为所述生成的合并词库文件分配文件名称;相应地,所述在所述合并词库 文件中查找与所述字符串匹配的候选词的步骤,包括根据所述文件名称,在所述文件名称对应的合并词库文件中查找与所述字 符串匹配的候选词。其中,所述在所述合并词库文件中查找与所述字符串匹配的候选词的步骤 之前,所述方法还包括根据预设的共享内存标志位,判断是否存在新的合并词库文件,如果是, 则在所述新的合并词库文件中查找与所述字符串匹配的候选词。其中,所述判断是否存在新的合并词库文件的步骤之前,所述方法包括生 成新的合并词库文件,为所述新的合并词库文件分配新的文件名称,将所述生并词库文件中查找与所述字符串匹配的候选词的步骤,包括根据所述新的文件名称,在所述新的文件名称对应的新的合并词库文件中查找与所述字符串匹配的候选词。其中,所述合并词库文件格式和所述输入法客户端的系统词库格式相同。 再一方面,本专利技术实施例提供了一种输入法客户端,所述输入法客户端包括获得模块,用于获得分类词库文件;生成模块,用于根据所述获得模块获得的所述分类词库文件,生成合并词 库文件;查找模块,用于接收用户输入的字符串,在所述生成模块生成的合并词库 文件中查找与所述字符串匹配的候选词;输入模块,用于将所述查找模块查找到的候选词提供给所述用户,当接收 到用户的选择确认后,将所述用户选择的候选词输入到计算机。其中,所述获得模块包括第一获得子模块,用于接收分类词库服务器下发的分类词库文件,其中, 根据用户选择的分类词库的词库名称,向分类词库服务器发起获取分类词库的 请求,所述请求中携带所述分类词库的词库标识;所述分类词库服务器接收所 述获取分类词库的请求,根据所述词库标识,下发所述词库标识对应的分类词 库文件;或,第二获得子模块,用于向所述分类词库服务器发生更新请求,所述更新请 求中携带分类词库标识,所述分类词库服务器接收所述更新请求,根据所述分 类词库标识,返回所述分类词库标识对应的版本标识,当所述输入法客户端判 断所述接收的版本标识高于本地保存的所述分类词库自身的版本标识时,向所 述分类词库服务器请求所述接收的版本标识对应的分类词库;或,第三获得子模块,用于接收所述分类词库服务器主动向所述输入法客户端 推送的分类词库文件;或,第四获得子模块,用于接收用户添加的文本格式的词库文件,对所述接收 的用户添加的文本格式的词库文件进行格式转换,得到所述分类词库文件。其中,输入本文档来自技高网
...

【技术保护点】
一种分类词库实现的方法,其特征在于,所述方法包括: 输入法客户端获得分类词库文件; 根据所述获得的所述分类词库文件,生成合并词库文件; 接收用户输入的字符串,在所述合并词库文件中查找与所述字符串匹配的候选词;将查找到的候选 词提供给所述用户,当接收到用户的选择确认后,将所述用户选择的候选词输入到计算机。

【技术特征摘要】
1、一种分类词库实现的方法,其特征在于,所述方法包括输入法客户端获得分类词库文件;根据所述获得的所述分类词库文件,生成合并词库文件;接收用户输入的字符串,在所述合并词库文件中查找与所述字符串匹配的候选词;将查找到的候选词提供给所述用户,当接收到用户的选择确认后,将所述用户选择的候选词输入到计算机。2、 如权利要求l所述的方法,其特征在于,所述输入法客户端获得分类词 库文件的步骤之前,所述方法还包括根据用户选择分类词库的词库名称,向分类词库服务器发起获取分类词库 的请求,所述请求中携带所述分类词库的词库标识;所述分类词库服务器接收 所述获取分类词库的请求,根据所述词库标识,向所述输入法客户端下发所述词库标识对应的分类词库文件;或,所述输入法客户端向所述分类词库服务器发生更新请求,所述更新请求中 携带分类词库标识,所述分类词库服务器接收所述更新请求,纟艮据所述分类词 库标识,向所述输入法客户端返回所述分类词库标识对应的版本标识,当所述 输入法客户端判断所述接收的版本标识高于本地保存的所述分类词库自身的版 本标识时,向所述分类词库服务器请求所述接收的版本标识对应的分类词库文件;或,所述输入法客户端接收用户添加的文本才各式的词库文件,对所述4矣收的用 户添加的文本^式的词库文件进行转换得到分类词库文件。3、 如权利要求l所述的方法,其特征在于,所述生成合并词库文件的步骤 之前,所述方法还包括为所述分类词库文件分配启用标识位;根据所述分类词库文件的启用标识位,从所述获得的所述分类词库文件中 选择出启用的分类词库文件;相应地,所述生成合并词库文件的步骤,包括 根据所述选择出的启用的分类词库文件,生成合并词库文件。4、 如权利要求l所述的方法,其特征在于,任一所述分类词库文件携带拼 音、词以及词频,所述根据所述获得的所述分类词库文件,生成合并词库文件 的步骤,包括在所述获取的所述分类词库文件中,根据所述拼音、词以及词频,得到所 述词在所述合并词库文件中的相关信息;根据得到的所述词在所述合并词库文件中的相关信息,生成合并词库文件。5、 如权利要求4所述的方法,其特征在于,所述才艮据所述拼音、词以及词 频,得到所述词在所述合并词库文件中的相关信息的步骤,包括根据所述拼音和词,判断所述当前分类词库中的当前词是否在其他分类词 库中存在相同的词,如果是,则对所述当前词在不同分类词库中的词频进行叠 加或对所述当前词在不同分类词库中的词频取大,得到所述当前词在所述合并 词库文件中的词频;根据所述得到的当前词在所述合并词库文件中的词频、所 述当前词的拼音以及所述当前词,生成所述当前词所述合并词库文件中的相关 信息;如果否,则将所述当前分类词库中的当前词的词频、拼音以及所述当前词, 作为所述当前词所述合并词库文件中的相关信息。6、 如权利要求4或5所述的方法,其特征在于,所述根据得到的所述词在 所述合并词库文件中的相关信息,生成合并词库文件的步骤,包括根据字典顺序以及所述词在所述合并词库文件中的词频、拼音以及所述词, 生成合并词库文件。7、 如权利要求l所述的方法,其特征在于,所述生成合并词库文件的步骤 之后,所述方法还包括为所述生成的合并词库文件分配文件名称;相应地,所述在所述合并词库 文件中查找与所述字符串匹配的候选词的步骤,包括根据所述文件名称,在所述文件名称对应的合并词库文件中查找与所述字符串匹配的候选词。8、 如权利要求l所述的方法,其特征在于,所述在所述合并词库文件中查 找与所述字符串匹配的候选词的步骤之前,所述方法还包括根据预设的共享内存标志位,判断是否存在新的合并词库文件,如果是, 则在所述新的合并词库文件中查找与所述字符串匹配的候选词。9、 如权利要求8所述的方法,其特征在于,所述判断是否存在新的合并词 库文件的步骤之前,所述方法包括生成新的合并词库文件,为所述新的合并词 库文件分配新的文件名称,将所述生成新的合并词库文件写入所述新的文件名 称对应的文件;相应地,所述新的合并词库文件中查找与所述字符串匹配的候 选词的步骤,包括根据所述新的文件名称,在所述新的文件名称对应的新的合并词库文件中 查找与所述字...

【专利技术属性】
技术研发人员:张会鹏
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:94[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1