五笔输入系统及方法技术方案

技术编号:4167536 阅读:197 留言:0更新日期:2012-04-11 18:40
一种五笔输入系统,属于输入法领域。该五笔输入系统包括:缓存词库,存储一位码和两位码的常用词的词条信息及索引信息;核心词库,存储所有五笔编码的词条信息及索引信息;取词模块,用于当输入一位码或两位码时,根据所述缓存词库中的索引信息从缓存词库中取词;当输入三位码或四位码时,根据所述核心词库中的索引信息从核心词库中取词。此外还涉及一种五笔输入方法,根据用户输入的五笔编码,分别向缓存词库和核心词库取词。加入缓存词库后,根据用户输入可优先检索缓存词库,使用户在输入一位码或两位码时,显示常用词条,不用查找大量词条即可增大用户预期词条命中率,提高五笔输入速度。

Five pen input system and method

The utility model relates to a five pen input system, which belongs to the field of input method. Including the five pen input system: cache thesaurus, entry information and index information stored in a common word code and two bit code; the core lexicon, store all five pen encoding entry information and index information; translation module, when the input for a code or two bit code, according to the index information of the cache in the lexicon the lexicon word from the cache; when the input code three or four bit code, according to the index information of the core vocabulary from the core vocabulary in translation. The invention also relates to a five stroke input method, based on user input five encoding, respectively to the cache and core vocabulary word thesaurus. Join the cache according to user input thesaurus, priority cache retrieval thesaurus, the user input in a code or two bit code display, commonly used terms, do not search for a large number of entries can be expected to increase user entry hit rate, improve five pen input speed.

【技术实现步骤摘要】

本专利技术涉及输入法,尤其是涉及一种。
技术介绍
五笔字型输入法,简称五笔,是王永民教授专利技术的一种依照汉字字形进行编码的 汉字输入方法,是目前中国以及一些东南亚的国家,最常用的一种汉字输入法之一。 五笔的基本原理汉字都是由笔划或部首组成的。为了输入这些汉字,我们把汉字 拆成一些最常用的基本单位,叫做字根,字根可以是汉字的偏旁部首,也可以是部首的一部 分,甚至是笔划。取出这些字根后,把它们按一定的规律分类;再把这些字根依据科学原理 分配在键盘上,作为输入汉字的基本单位。五笔基本字根有130种,加上一些基本字根的变 型,共有200个左右,这些字根分布在除Z之外的25个键上。当要输入汉字时,我们就按照 汉字的书写顺序依次按键盘上与字根对应的键,组成一个编码;系统根据输入字根组成的 编码,在五笔输入法的字库中检索出所要的字。 五笔输入法以其重码率低而能够快速找到用户预期的词条,在熟悉该输入法的前 提下可大大提高输入的速度,不过这需要用户能够熟练地拆解字词,同时一般需要三到四 个五笔码才能快速确定所需要的词。在不熟练的情况下,用户只能通过一码或两码来获得 大量的候选词条,并通过筛选来找到需要的词条,降低了输入速度。
技术实现思路
鉴于此,有必要针对传统的五笔输入法在一码或两码输入情况下重码率较高,影 响输入速度的问题,提供一种能够提高用户输入速度的五笔输入系统。 —种五笔输入系统,包括缓存词库,存储一位码和两位码的常用词的词条信息及索引信息;核心词库,存储所有五笔编码的词条信息及索引信息;取词模块,用于当输入一位码或两位码时,根据所述缓存词库中的索引信息从缓存词库中取词并显示;当输入三位码或四位码时,根据所述核心词库中的索引信息从核心词库中取词并显示。 加入缓存词库后,根据用户输入可优先检索缓存词库,使用户在输入一位码或两位码时,显示常用词条,不用查找大量词条即可增大用户预期词条命中率,提高五笔输入速度。 优选地,所述缓存词库包括缓存编码索引区,存储常用词的索引信息;缓存词条 存储区,存储常用词的词条信息,所述常用词以五笔编码的前两码作为索引,并按照词频由 高到低顺序存储。 优选地,所述核心词库包括核心编码索引区,存储所有五笔编码的词条信息的索 引信息;核心词条存储区,存储所有五笔编码的词条信息,所有词条以其五笔编码的前三码 作为索引按序存储,对前三码相同的词条按照词频由高到低顺序存储。 优选地,所述取词模块包括索引计算模块,根据输入的五笔编码得到索引信息; 候选词输出模块,根据索引信息获得并显示词条。 优选地,还包括判断模块,所述判断模块用于根据输入的一位码或二位码判断缓存词库中是否存在用户预期的词条。 此外还提供一种五笔输入方法。 —种五笔输入方法,包括如下步骤接收五笔编码输入;当所输入的五笔编码为 一位码或二位码时,向存储了一位码和两位码的常用词的词条信息及索引信息的缓存词库 取词;当所输入的五笔编码为三位码或四位码时,向存储了所有五笔编码的词条信息及索 引信息的核心词库取词。 由于优先处理一位码或二位码,向缓存词库取词,因此根据用户输入可优先检索 缓存词库,使用户在输入一码或两码时,显示常用词条,不用查找大量词条即可增大用户预 期词条命中率,提高五笔输入速度。 优选地,向所述缓存词库取词的步骤之后还包括判断所述缓存词库是否包含用户预期的词条,若缓存词库未包含用户预期的词条,则向所述核心词库取词。 优选地,所述向缓存词库取词的步骤具体是将缓存词库中的词以五笔编码的前两码作为索引,并按照词频由高到低进行存储,将输入的五笔编码转换为索引信息,然后根据索引信息将词条按序读取并显示。 优选地,所述向核心词库取词的步骤具体是将核心词库中的词以五笔编码的前 三码作为索引顺序存储,并对前三码相同的词条按照词频由高到低顺序存储,如果输入的 五笔编码为三位码,则将该三位码转换为索引信息,然后根据索引信息获得的词条按照词 频由高到低进行排序显示;如果输入的五笔编码为四位码,则将由三码输入获得的词条中 第四码与用户输入的第四码不匹配的所有词条过滤,获得与该四码输入相应的所有词条, 将所获得的词条按照词频由高到低进行排序显示。 优选地,所述向核心词库取词的步骤还包括如果输入的五笔编码为一位码或二 位码,则将该一位码或二位码转换为索引信息,然后根据索引信息将获得的词条按照词条 在核心词库中的存储顺序依次读取并显示。附图说明 图1为实施例1的五笔输入系统的结构示意图; 图2为实施例1的五笔输入方法的流程图; 图3为实施例2的五笔输入系统的结构示意图; 图4为实施例2的五笔输入方法的流程图。具体实施方式实施例1 如图l所示,为本实施例的五笔输入系统结构示意图。该五笔输入系统包括取词 模块100、核心词库200以及缓存词库300。核心词库200存储所有五笔编码的词条信息及 索引信息,缓存词库300存储一位码和两位码的常用词的词条信息及索引信息。当输入一 位码或两位码时,取词模块100根据缓存词库300中的索引信息从缓存词库300中取词;当 输入三位码或四位码时,取词模块100根据核心词库200中的索引信息从核心词库200中 取词。 取词模块100包括索引计算模块110和候选词输出模块120。其中索引计算模块 110根据用户输入将五笔编码转换为索引信息。如将一位码或二位码转换为向缓存词库 300取词的索引信息,将三位码或四位码转换为向核心词库200取词的索引信息。候选词输 出模块120根据索引信息获得词条并进行显示输出。 核心词库200包括核心编码索引区210和核心词条存储区220。核心编码索引区 210存储所有五笔编码的词条信息的索引信息;核心词条存储区220存储所有五笔编码的 词条信息,所有词条以其五笔编码的前三码作为索引按序存储,对前三码相同的词条按照 词频由高到低顺序存储。 缓存词库300包括缓存编码索引区310和缓存词条存储区320。缓存编码索引区 310存储常用词的索引信息;缓存词条存储区320存储常用词的词条信息,常用词以五笔编 码的前两码作为索引,并按照词频由高到低顺序存储。 本实施例中核心编码索引区210和缓存编码索引区310都是一段连续的数组区 域,数组的每个元素占4个字节,其中记录的是五笔编码所对应词条在核心词条存储区220 或缓存词条存储区320中的起始位置。 索引信息即是指数组中存储的词条的起始位置,相应的,核心编码索引区210中 存储的索引信息即是指核心词条存储区220中词条存储的起始位置;缓存编码索引区310 中存储的索引信息即是指缓存词条存储区320中词条存储的起始位置。 核心词条存储区220和缓存词条存储区320中保存的是具体词条信息,包括词条 的五笔编码,Unicode文本,词频和其它一些附加信息。词条的五笔编码用于与用户输入 对比确定是否匹配,Unicode文本用于显示词条,词频则可根据统计结果预先定义,也可在 用户使用过程中实时更新,表示该词条使用的频率,因此词频较高的词条满足用户预期的 可能性非常大。(Unicode是一种文本编码标准,每个字符用两个字节表示,是一种定长的 2Byte多文种(语言)字符集编码,也属于现有技术) 相应的五笔输入方法,如图2所示包括如下步骤 S本文档来自技高网...

【技术保护点】
一种五笔输入系统,其特征在于,包括:缓存词库,存储一位码和两位码的常用词的词条信息及索引信息;核心词库,存储所有五笔编码的词条信息及索引信息;取词模块,用于当输入一位码或两位码时,根据所述缓存词库中的索引信息从缓存词库中取词;当输入三位码或四位码时,根据所述核心词库中的索引信息从核心词库中取词。

【技术特征摘要】
一种五笔输入系统,其特征在于,包括缓存词库,存储一位码和两位码的常用词的词条信息及索引信息;核心词库,存储所有五笔编码的词条信息及索引信息;取词模块,用于当输入一位码或两位码时,根据所述缓存词库中的索引信息从缓存词库中取词;当输入三位码或四位码时,根据所述核心词库中的索引信息从核心词库中取词。2. 根据权利要求1所述的五笔输入系统,其特征在于,所述缓存词库包括 缓存编码索引区,存储常用词的索引信息;缓存词条存储区,存储常用词的词条信息,所述常用词以五笔编码的前两码作为索引, 并按照词频由高到低顺序存储。3. 根据权利要求1或2所述的五笔输入系统,其特征在于,所述核心词库包括 核心编码索引区,存储所有五笔编码的词条信息的索引信息; 核心词条存储区,存储所有五笔编码的词条信息,所有词条以其五笔编码的前三码作 为索引按序存储,对前三码相同的词条按照词频由高到低顺序存储。4. 根据权利要求1或2所述的五笔输入系统,其特征在于,所述取词模块包括 索引计算模块,根据输入的五笔编码得到索引信息;候选词输出模块,根据索引信息获得并显示词条。5. 如权利要求1所述的五笔输入系统,其特征在于,还包括判断模块,所述判断模块用 于根据输入的一位码或二位码判断缓存词库中是否存在用户预期的词条。6. —种五笔输入方法,包括如下步骤 接收五笔编码输入;当所输入的五笔编码为一位码或二位码时,向存储了一位码和两位码的常用词的词条 信息及索引信息的...

【专利技术属性】
技术研发人员:张靖邓欣
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1