一种拼音输入法及拼音输入法的用户词添加方法和系统技术方案

技术编号:7272246 阅读:212 留言:0更新日期:2012-04-15 19:51
本发明专利技术提出了一种拼音输入法及拼音输入法的用户词添加方法和系统,属于输入法领域。本发明专利技术包括:获取用户通过拼音输入法输入时输入错误的字符串;获取用户输入正确的字符串时选择的字词;将所述输入错误的字符串与所述字词对应存储在词库中。本发明专利技术实施例通过将用户输入错误的字符串存储起来,并将其与用户输入正确的字词对应存储在词库中。这样可以使拼音输入法无需预先设置多个模糊词以及易错词,以降低拼音输入法的词库所占用的空间,提高输入时检索的效率。同时,又可以针对不同用户的使用习惯生成个人的词库,以更贴近用户的个性使用习惯。

【技术实现步骤摘要】

本专利技术涉及输入法领域,特别涉及一种拼音输入法及拼音输入法的用户词添加方法和系统
技术介绍
现有技术中为了实现汉语输入,都需要通过输入软件以匹配用户输入的字符串 (英文字符串组成的拼音串),并获取与其相匹配的汉语文字。而输入法中,拼音输入法具有输入方式灵活、无需记录词根、入门快等优点,现在已经被广泛应用。但是拼音输入法同样具有其缺点,即中国地域广泛,且方言众多,因此在输入时经常会由于拼音不准确造成输入时多次尝试才能找到自己所需的字词。例如“模板”对应的正确拼音应为mu ban,而很多用户都会将其读为mo ban,这样会造成用户在输入时费时费力。为此,很多拼音输入法设置了模糊此输入,即预估计用户容易输错的拼音,以及方言中容易混淆的拼音(例如很多地区Z和zh、C和ch、s和Sh不分),并将该多个正确和错误的字符串都与字词对应存储在预设的字词库中。这样无论用户输入的字符串是正确的还是错误的,都可以将该字词显示给用户。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题现有技术中对虽然可以解决一部分拼音不准确的用户输入时的问题,但是这种方式只能针对普遍存在的少数情况,而无法针对不同用户的使用习惯定制相应的字词库。这样无法适用于不同地区、不同使用习惯、不同发音习惯的用户,因此对用户输入的帮助性差。
技术实现思路
为了解决现有技术中的字词库只能针对普遍情况而无法针对不同用户的使用习惯,本专利技术实施例提出了一种拼音输入法及拼音输入法的用户词添加方法和系统。所述技术方案如下本专利技术实施例提出了一种拼音输入法的用户词添加方法,包括获取用户通过拼音输入法输入时输入错误的字符串;获取用户输入正确的字符串时选择的字词;将所述输入错误的字符串与所述字词对应存储在词库中。作为上述技术方案的优选,所述获取用户通过拼音输入法输入时输入错误的字符串包括读取预置的日志,获取日志中用户输入的所有字符串;获取日志中用户选择的两个字词之间输入的所有字符串,并获取其中的所有删除操作;并以该删除操作作为分隔,获取其中的每一段字符串。作为上述技术方案的优选,所述方法还包括判断所述每一字符串在所述词库中是否有相同的记录,如果是则忽略该字符串。作为上述技术方案的优选,所述方法还包括判断所述词库中的字符串的使用次数,当使用次数低于预设阈值时,将所述字符串删除。本专利技术实施例还提出了一种拼音输入法的用户词添加系统,包括获取模块,用于获取用户通过拼音输入法输入时输入错误的字符串;记录模块,用于获取用户输入正确的字符串时选择的字词; 词库更新模块,用于将所述输入错误的字符串与所述字词对应存储。作为上述技术方案的优选,所述获取模块包括日志单元,用于读取预设的日志,获取日志中用户输入的所有字符串;拆分单元,用于获取日志中用户选择的两个字词之间输入的所有字符串,以获取其中的所有删除操作;并以该删除操作作为分隔,获取其中的每一段字符串。作为上述技术方案的优选,所述获取模块还包括匹配单元,用于判断所述每一字符串在所述词库中是否有相同的记录,如果是则忽略该字符串。作为上述技术方案的优选,所述系统还包括删除模块,用于获取所述词库中添加的字符串及对应的字词使用的次数;当所述次数低于预设阈值时,将所述字符串删除。本专利技术实施例还提出了一种拼音输入法,包括输入模块、显示模块、词库;还包括获取模块,用于获取用户通过拼音输入法输入时输入错误的字符串;记录模块,用于获取用户输入正确的字符串时选择的字词;词库更新模块,用于将所述输入错误的字符串与所述字词对应存储。作为上述技术方案的优选,所述获取模块包括日志单元,用于读取预设的日志,获取日志中用户输入的所有字符串;拆分单元,用于获取日志中用户选择的两个字词之间输入的所有字符串,以获取其中的所有删除操作;并以该删除操作作为分隔,获取其中的每一段字符串。作为上述技术方案的优选,所述获取模块还包括匹配单元,用于判断所述每一字符串在所述词库中是否有相同的记录,如果是则忽略该字符串。作为上述技术方案的优选,所述拼音输入法还包括删除模块,用于获取所述词库中添加的字符串及对应的字词使用的次数;当所述次数低于预设阈值时,将所述字符串删除。本专利技术实施例提供的技术方案的有益效果是本专利技术实施例通过将用户输入错误的字符串存储起来,并将其与用户输入正确的字词对应存储在词库中。这样可以使拼音输入法无需预先设置多个模糊词以及易错词,以降低拼音输入法的词库所占用的空间,提高输入时检索的效率。同时,又可以针对不同用户的使用习惯生成个人的词库,以更贴近用户的个性使用习惯。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中使用的附图作一简单地介绍,显而易见地,下面所列附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术第一实施例的流程示意图;图2为本专利技术第二实施例中获取用户复制的内容的流程示意图;图3为本专利技术第三实施例的结构示意图;图4为本专利技术第四实施例的结构示意图。 图5为本专利技术第五实施例的结构示意图图6为本专利技术第六实施例的结构示意图。具体实施例方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。本专利技术实施例的设计思路是用户在输入时,如果输入的字符串错误导致显示的候选字词中没有所需的字词,会将输入的字符串删除,并重新输入其他字符串,并选择所需的字词。例如蔡智恒的《槲寄生》中的“槲”字(hu)很多人一开始都错拼成“jie”。用户一般会做如下的删除重写行为输入jie_>候选字中找不到“槲” _>删除jie_>输入hu_> 选择目标字“槲”。本专利技术实施例中就是利用了这一过程来更新用户的词库,即记录用户删除的字符串,并将该删除的字符串与正确的目标词对应起来并存储到词库中。这样生成的词库更为接近用户的使用习惯,以下通过实施例对本专利技术进行进一步的说明。实施例1本专利技术第一实施例提出了一种拼音输入法的用户词添加方法,其流程如图1所示,包括步骤101、获取用户通过拼音输入法输入时输入错误的字符串;步骤102、获取用户输入正确的字符串时选择的字词;步骤103、将所述输入错误的字符串与所述字词对应存储在词库中。本专利技术实施例通过将用户输入错误的字符串存储起来,并将其与用户输入正确的字词对应存储在词库中。这样可以使拼音输入法无需预先设置多个模糊词以及易错词,以降低拼音输入法的词库所占用的空间,提高输入时检索的效率。同时,又可以针对不同用户的使用习惯生成个人的词库,以更贴近用户的个性使用习惯。实施例2本专利技术第二实施例提出了一种拼音输入法的用户词添加方法,是在第一实施例基础上改进而来,其流程如图2所示,包括步骤201、获取用户通过拼音输入法输入时输入错误的字符串。其中,输入错误的字符串可以通过以下方式获得获取用户通过拼音输入法输入时的字符串,以及选择的字词。这样可以获得两个用户选择的字词之间的所有字符串。如果该字符串中包含用户的删除操作,则可以认为该字符串中包含了用户输入错误的字符串。在本专利技术的一个实施例中,可以在拼音输入法中设置一个日志,以记录用户输入的字符串。例如在该拼音输入法启动时,同时启动一个监控用户键盘输入的进程。该进程在日志本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:林吓洪
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术