一种字符输入的方法和输入法系统技术方案

技术编号:2821406 阅读:207 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种字符输入的方法,具体可以包括以下步骤:获取当前系统环境中,应用程序所涉及的文本数据;对所述文本数据进行分析,生成临时词库;加载输入法已有词库和所述临时词库;接收用户的输入信息;依据所接收的输入信息,在输入法已有词库和所述临时词库中进行检索,得到相应的候选项;接收用户的选择信息,将指定的候选项上屏输出。应用本发明专利技术,当用户使用输入法时,输入法就可以自动学习对应环境中的这些文本内容,形成一个临时词语关系库,供用户使用。通过这种方式,用户在每一个新的会话中,都可以得到很好的输入体验,从而可以从根本上解决现有的输入法词库综合性太强、个性化较弱的问题。

【技术实现步骤摘要】

本专利技术涉及计算机信息输入领域,特别是涉及一种字符输入的方法和系 统, 一种临时词库的生成方法和系统,以及一种优化输入法词库的方法和系统。
技术介绍
随着计算机技术以及互联网技术的普及与发展,不同专业领域、不同 兴趣以及使用习惯的用户对于输入法系统的智能性和个性化要求越来越高。在现有技术中,输入法系统一般包括系统词库,所述系统词库通过对众多 文档集合(例如,传统新闻、报纸)的分析得到比较通用的词频及排序,从而 保证输入法系统的首选词命中率。但是由于生成词库所依赖的文档集合来源都是封闭的、特定的,所以不能满足人们生活中信息迅速膨胀、词汇变化频繁的 情况。中国专利文件CN1936893中公开了 "一种基于互联网信息的输入法词频库 的生成方法和系统",其输入法词库可以从浩瀚的互联网信息中统计分析得到, 从而能够满足信息快速传播的需要,提高了使用者的首选词的命中率,提高了 输入速度和效率。但是上面的两种输入法词库都存在一个共同的问题,即在一段时间内是一 个固定的综合词库。也就是说,现有的输入法词库没有考虑到输入法用户在 不同的应用环境中需要不同的词汇集合,比如,用户是在聊天、回邮件、写文 档......等等。输入法用户在不同的应用环境中,面临的是一些不同的词语,比如输入拼音"ciba",在计算机领域"词霸"的可能性更大一些,而在谈论食品时 是"糨粑"的可能性更大一些,再比如,写论文时所使用的词汇和聊天时所使用的词汇肯定不相同。总之,迫切需要本领域技术人员解决的一个技术问题就是如何改进现有 的输入法词库,使其能够满足不同应用环境用户的需求,更好的实现用户的个 性化输入。
技术实现思路
本专利技术所要解决的技术问题是提供一种字符输入的方法和输入法系统,能 够使输入法用户在不同的应用环境中都能最快最好的得到希望输入的字词。相应的,本专利技术的一个目的在于,提供一种临时词库的生成方法和系统, 以及一种优化输入法词库的方法和系统,用于帮助得到最佳的输入法词库,从 而使得输入法用户在不同的应用环境中都能得到非常好的体验。为了解决上述问题,依据本专利技术的实施例,公开了一种字符输入的方法,具体可以包括以下步骤获取当前系统环境中,应用程序所涉及的文本数据; 对所述文本数据进行分析,生成临时词库;加载输入法已有词库和所述临时词 库;接收用户的输入信息;依据所接收的输入信息,在输入法已有词库和所述 临时词库中进行检索,得到相应的候选项;接收用户的选择信息,将指定的候 选项上屏输出。其中,可以通过以下方式获取所述文本数据当显示文本数据时,通过预 置函数,截获操作系统中文本输出函数的输出内容。或者,也可以通过以下步骤获取所述文本数据获取文件的路径;通过操 作系统提供的接口读取该文件的文本内容,或者直冲矣读取该文件的文本内容。 优选的,通过扫描进程获得文件路径或者通过监控应用程序获取新接收文件的 路径。或者,也可以通过以下方式获取所述文本数据模拟复制操作;从操作系 统緩存中获取应用程序所涉及的文本数据。优选的,该方法中,可以针对当前系统环境中的一个应用程序文档生成一 个临时词库;或者,也可以针对当前系统环境中的一个应用程序生成一个临时 词库;或者,也可以针对当前系统环境中的多个应用程序生成一个临时词库。优选的,所述临时词库包括词序信息、二元或多元关系信息。优选的,该方法还可以包括针对临时词库中的每个词条,依据临时词库 中的词频信息和输入法已有词库中的词频信息,得到权重参数,所述权重参数 用于候选项排序。优选的,该方法还可以包括存储所述临时词库,以及;整理分析所述临 时词库,获取有效信息。其中,所述有效信息可以包括新词;或者,当临时词库记录有词条相应的输入环境信息时,所述有效信息也可以包括针对词条及其 输入环境的分析结果。优选的,该方法还可以包括对应用程序进行筛选;和/或,对应用程序 的文本数据进行筛选。依据本专利技术另一实施例,公开了一种输入法系统,具体可以包括 文本数据获取模块,用于获取当前系统环境中,应用程序所涉及的文本数据;临时词库生成模块,用于对所述文本数据进行分析,生成临时词库; 输入接口模块,用于接收用户的输入信息;信息转换模块,用于依据所接收的输入信息,在输入法已有词库和所述临 时词库中进行;险索,得到相应的候选项;显示输出模块,用于显示所述候选项,以及接收用户的选择信息,将指定 的候选项上屏输出。其中,可以通过以下方式获取所述文本数据当显示文本数据时,通过预 置函数,截获操作系统中文本输出函数的输出内容;或者,获取文件的路径; 通过操作系统提供的接口读取该文件的文本内容,或者直接读取该文件的文本 内容;或者,模拟复制操作;从操作系统緩存中获取应用程序所涉及的文本数 据。优选的,所述的系统还可以包括系统监控^^莫块,用于监控系统当前的状 态,以及当符合预置条件时,通知启动文本数据获取模块;和/或,用于监控 所获取的文本数据,以及当符合预置条件时,通知启动临时词库生成模块。优选的,所述的系统还可以包括权重参数生成模块,用于针对临时词库 中的每个词条,依据临时词库中的词频信息和输入法已有词库中的词频信息, 得到权重参数,所述权重参数用于候选项排序。优选的,所述的系统还可以包括临时存储模块,用于存储所述临时词库; 优化模块,用于整理分析所述临时词库,获取有效信息。其中,所述有效信息 可以包括新词;或者,当临时词库记录有词条相应的输入环境信息时,所述有 效信息也可以包括针对词条及其输入环境的分析结果。依据本专利技术的另一实施例,公开了一种临时词库的生成方法,可以包括获取当前系统环境中,应用程序所涉及的文本数据;对所述文本数据进行分析, 生成临时词库;所述临时词库用于检索获得输入法候选项。其中,可以通过以下方式获取所述文本数据当显示文本数据时,通过预 置函数,截获操作系统中文本输出函数的输出内容;或者,获取文件的路径; 通过操作系统提供的接口读取该文件的文本内容,或者直接读取该文件的文本 内容;或者,模拟复制操作;从操作系统緩存中荻取应用程序所涉及的文本数 据。依据本专利技术的另一实施例,公开了一种临时词库的生成系统,可以包括.-文本数据获取单元,用于获取当前系统环境中,应用程序所涉及的文本数据;临时词库生成单元,用于对所述文本数据进行分析,生成临时词库;所述 临时词库,用于同输入法已有词库一起,检索获得输入法候选项。其中,可以通过以下方式获取所述文本数据当显示文本数据时,通过预 置函数,截获操作系统中文本输出函数的输出内容;或者,获取文件的路径; 通过操作系统提供的接口读取该文件的文本内容,或者直接读取该文件的文本 内容;或者,模拟复制操作;从操作系统緩存中获取应用程序所涉及的文本数 据。依据本专利技术的另一实施例,公开了 一种优化输入法词库的方法,可以包括 获取当前系统环境中,应用程序所涉及的文本数据;对所述文本数据进行分析, 生成临时词库;整理分析所述临时词库,获取有效信息。其中,所述有效信息 可以包括新词;或者,当临时词库记录有词条相应的输入环境信息时,所述有 效信息也可以包括针对词条及其输入环境的分析结果。依据本专利技术的另 一实施例,公开了 一种优化输入法词库的系统,可以包括 文本数据获取单元,用于获取当前系统环境中,应用程序所涉及的文本数本文档来自技高网
...

【技术保护点】
一种字符输入的方法,其特征在于,包括: 获取当前系统环境中,应用程序所涉及的文本数据; 对所述文本数据进行分析,生成临时词库; 加载输入法已有词库和所述临时词库; 接收用户的输入信息; 依据所接收的输入信息,在输入法已有词库和所述临时词库中进行检索,得到相应的候选项; 接收用户的选择信息,将指定的候选项上屏输出。

【技术特征摘要】

【专利技术属性】
技术研发人员:张智敏
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1