一种向用户词库中记录信息的方法和装置制造方法及图纸

技术编号:2917256 阅读:255 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种向用户词库中记录信息的方法和装置,该方法包括:预置用户词库的记录格式,将每个字词的属性信息存储空间划分为多个子空间,用于记录该字词在不同类别下的属性信息;当用户利用输入法系统进行字符输入时,依据所采集的用户当前输入环境的相关信息,确定该用户的当前输入类别;将该用户在当前类别下所输入的字词及相应的属性信息记录至用户词库中。本发明专利技术创新性的提出,将用户的输入习惯信息(例如,输入字词及其词频等)分环境记录至用户词库中,从而可以更好的更准确的记录用户的输入习惯。进而,当采用本发明专利技术的用户词库进行输入时,可以动态的与用户输入环境或者输入内容相匹配,大大提高用户输入过程中首选词准确率。

【技术实现步骤摘要】

本专利技术涉及计算机字符输入
,特别是涉及一种向用户词库中记录信息的方法和装置,一种用户词库以及利用该用户词库进行字符输入的方法和系统。
技术介绍
随着计算机技术以及互联网技术的普及与发展,输入法已经成为用户与计算机交互的重要手段,不同专业领域、不同兴趣以及使用习惯的用户对于输入法的智能性要求越来越高。现有技术一般通过提高系统词库中的词条的更新程度以及词频信息的准确度,来提高用户向计算机完成字符输入时的效率——可以通过首选词的准确率进行评价。例如,申请号为200610086577.4,名称为“基于互联网信息的输入法词频库的生成方法和系统”的中国专利就公开了这样的一种提高系统词库性能的技术方案。但是由于系统词库是相对固定的,针对每一个用户而言,难以达到精确匹配;为了增强个性化的输入效率,现有技术提出了用户词库的解决方案。用户词库的形成方法通常包括以下步骤:记录用户输入的字词,学习某个用户适用的词汇;通过一段时间地不断学习,将词库逐渐收敛到某个用户输入的最佳状态,从而形成用户词库。显然,这种用户词库的形成过程可以在一定程度上调整候选项的排序,使其逐渐适应该用户,从而提高输入效率,但是对于同一个词,在不同的输入环境下,即使同一用户也可能需要不同的候选项排序。例如,对于“语料”和“预料”,在日常输入中,用户输入“预料”一词的情况较高,在系统词库和用户词库中都是“预料”的词频或者排序要高于“语料”;但是当该用户在输入专业文档时(例如,语言分析相关专业),则就期望“语料”候选项排序在前,而无论系统词库还是用户词库仍然会按照通常的排序输出,无法随着用户输入需求的变化而变化。因此,现阶段需要本领域技术人员迫切解决的一个技术问题就是,如-->何改变现有输入法系统的智能性不高的现状,提供一种能够动态的与用户输入环境或者输入内容相匹配,大大提高用户输入过程中首选词准确率的输入法解决方案。
技术实现思路
本专利技术所要解决的技术问题是提供一种向用户词库中记录信息的方法和装置,以及一种用户词库,能够方便快捷的记录用户输入字词的分环境信息,从而提供更加适应该用户输入习惯的用户词库。相应的,本专利技术还提供了一种利用上述用户词库完成字符输入的方法和系统,能够动态的与用户输入环境或者输入内容相匹配,大大提高用户输入过程中首选词准确率。为了解决上述问题,依据本专利技术的实施例,本专利技术公开了一种向用户词库中记录信息的方法,具体可以包括:预置用户词库的记录格式,将每个字词的属性信息存储空间划分为多个子空间,用于记录该字词在不同类别下的属性信息;当用户利用输入法系统进行字符输入时,依据所采集的用户当前输入环境的相关信息,确定该用户的当前输入类别;将该用户在当前类别下所输入的字词及相应的属性信息记录至用户词库中。优选的,该方法还可以包括:汇集一字词在各个类别下的属性信息并进行处理,得到针对该字词的通用属性信息。优选的,该方法还可以包括:动态调整对所述子空间的划分。优选的,该方法还可以包括:通过用户选择的方式确定当前输入类别。进一步,可以通过以下步骤确定该用户的当前输入类别:预置对应信息表,所述对应信息表用以存储类别信息及对应的输入环境相关信息;所述输入环境相关信息包括应用程序名称、网站地址、当前窗口的标题、文档位置或者文档名称中的至少一个;根据所采集的当前输入环境相关信息,在所述对应信息表查找对应的类别信息,得到当前输入类别。如果所采集的当前输入环境的相关信息包括用户在当前输入环境中所涉及的文本数据;则通过对所述文本数据进行分析,确定该用户的当前输入类别。优选的,可以通过以下方式获取用户在当前输入环境中所涉及的文本数-->据:通过相应的系统函数获取剪贴板中的数据;或者,通过相应的系统函数获取当前应用程序所操作的文件名称及其路径,进而扫描获取该文件的内容数据;或者,通过相应的系统函数获取当前应用程序向屏幕输出的数据;或者,通过网页浏览器的接口对象,获取当前页面的内容数据。优选的,当所确定的当前输入类别为多个时,则将词频信息同时记录至多个相应子空间或者分权重记录至多个相应子空间。依据本专利技术的实施例,还公开了一种向用户词库中记录信息的装置,包括:用户词库,所述用户词库中每个字词的属性信息存储空间由多个子空间构成,用于存储该字词在不同类别下的属性信息;类别确定模块,用于当用户利用输入法系统进行字符输入时,依据所采集的用户当前输入环境的相关信息,确定该用户的当前输入类别;记录模块,用于将该用户在当前类别下所输入的字词及相应的属性信息记录至用户词库中。优选的,所述的装置还可以包括:汇集处理模块,用于汇集一字词在各个类别下的属性信息并进行处理,得到针对该字词的通用属性信息。优选的,所述的装置还可以包括:类别调整模块,用于动态调整对所述子空间的划分。其中,所述类别确定模块进一步可以包括:对应信息表,所述对应信息表用以存储类别信息及对应的输入环境相关信息;所述输入环境相关信息包括应用程序名称、网站地址、当前窗口的标题、文档位置或者文档名称中的至少一个;查找匹配子模块,用于根据所采集的当前输入环境相关信息,在所述对应信息表查找对应的类别信息,得到当前输入类别。如果所采集的当前输入环境的相关信息包括用户在当前输入环境中所涉及的文本数据;则所述类别确定模块通过对所述文本数据进行分析,确定该用户的当前输入类别。本专利技术还提供了一种用户词库,包括:字词存储空间;以及针对每个字词的属性信息存储空间,该属性信息存储空间由多个子空间构成,一子空间对应一输入类别,用于记录该字词在不同输入类别下的属性信息。依据本专利技术的另一实施例,还公开了一种字符输入的方法,具体可以包括-->以下步骤:加载系统词库和用户词库,所述用户词库中针对每个字词的属性信息存储空间由多个子空间构成,用于记录该字词在不同输入类别下的属性信息;所述属性信息包括词频信息;采集用户当前输入环境的相关信息,确定该用户的当前输入类别;接收用户的输入信息;依据所接收的输入信息,在系统词库和用户词库中进行检索,得到相应的候选项;依据系统词库中的通用属性信息以及用户词库中当前输入类别的属性信息,对所述候选项进行排序并显示;接收用户的选择信息,输出指定的候选项。如果所述当前输入环境的相关信息包括该用户在一输入环境下的输入历史文本数据;则,通过分析该输入历史文本数据,确定用户当前输入类别。优选的,所述的方法还可以包括:通过用户选择的方式确定当前输入类别。进一步,可以通过以下步骤确定该用户的当前输入类别:预置对应信息表,所述对应信息表用以存储类别信息及对应的输入环境相关信息;所述输入环境相关信息包括应用程序名称、网站地址、当前窗口的标题、文档位置或者文档名称中的至少一个;根据所采集的当前输入环境相关信息,在所述对应信息表查找对应的类别信息,得到当前输入类别。如果所采集的当前输入环境的相关信息包括用户在当前输入环境中所涉及的文本数据;则通过对所述文本数据进行分析,确定该用户的当前输入类别。其中,可以通过以下方式获取用户在当前输入环境中所涉及的文本数据:通过相应的系统函数获取剪贴板中的数据;或者,通过相应的系统函数获取当前应用程序所操作的文件名称及其路径,进而扫描获取该文件的内容数据;或者,通过相应的系统函数获取当前应用程序向屏幕输出的本文档来自技高网
...

【技术保护点】
一种向用户词库中记录信息的方法,其特征在于,包括: 预置用户词库的记录格式,将每个字词的属性信息存储空间划分为多个子空间,用于记录该字词在不同类别下的属性信息; 当用户利用输入法系统进行字符输入时,依据所采集的用户当前输入环境的相关信息,确定该用户的当前输入类别; 将该用户在当前类别下所输入的字词及相应的属性信息记录至用户词库中。

【技术特征摘要】
1、一种向用户词库中记录信息的方法,其特征在于,包括:预置用户词库的记录格式,将每个字词的属性信息存储空间划分为多个子空间,用于记录该字词在不同类别下的属性信息;当用户利用输入法系统进行字符输入时,依据所采集的用户当前输入环境的相关信息,确定该用户的当前输入类别;将该用户在当前类别下所输入的字词及相应的属性信息记录至用户词库中。2、如权利要求1所述的方法,其特征在于,还包括:汇集一字词在各个类别下的属性信息并进行处理,得到针对该字词的通用属性信息。3、如权利要求1所述的方法,其特征在于,还包括:动态调整对所述子空间的划分。4、如权利要求1所述的方法,其特征在于,还包括:通过用户选择的方式确定当前输入类别。5、如权利要求1所述的方法,其特征在于,通过以下步骤确定该用户的当前输入类别:预置对应信息表,所述对应信息表用以存储类别信息及对应的输入环境相关信息;所述输入环境相关信息包括应用程序名称、网站地址、当前窗口的标题、文档位置或者文档名称中的至少一个;根据所采集的当前输入环境相关信息,在所述对应信息表查找对应的类别信息,得到当前输入类别。6、如权利要求1所述的方法,其特征在于,所采集的当前输入环境的相关信息包括用户在当前输入环境中所涉及的文本数据;则通过对所述文本数据进行分析,确定该用户的当前输入类别。7、如权利要求6所述的方法,其特征在于,通过以下方式获取用户在当前输入环境中所涉及的文本数据:通过相应的系统函数获取剪贴板中的数据;或者,通过相应的系统函数获取当前应用程序所操作的文件名称及其路径,进而扫描获取该文件的内容数据;或者,通过相应的系统函数获取当前应用程序向屏幕输出的数据;或者,通过网页浏览器的接口对象,获取当前页面的内容数据。8、如权利要求1所述的方法,其特征在于:当所确定的前输入类别为多个时,则将词频信息同时记录至多个相应子空间或者分权重记录至多个相应子空间。9、一种向用户词库中记录信息的装置,其特征在于,包括:用户词库,所述用户词库中每个字词的属性信息存储空间由多个子空间构成,用于存储该字词在不同类别下的属性信息;类别确定模块,用于当用户利用输入法系统进行字符输入时,依据所采集的用户当前输入环境的相关信息,确定该用户的当前输入类别;记录模块,用于将该用户在当前类别下所输入的字词及相应的属性信息记录至用户词库中。10、如权利要求9所述的装置,其特征在于,还包括:汇集处理模块,用于汇集一字词在各个类别下的属性信息并进行处理,得到针对该字词的通用属性信息。11、如权利要求9所述的装置,其特征在于,还包括:类别调整模块,用于动态调整对所述子空间的划分。12、如权利要求9所述的装置,其特征在于,所述类别确定模块进一步包括:对应信息表,所述对应信息表用以存储类别信息及对应的输入环境相关信息;所述输入环境相关信息包括应用程序名称、网站地址、当前窗口的标题、文档位置或者文档名称中的至少一个;查找匹配子模块,用于根据所采集的当前输入环境相关信息,在所述对应信息表查找对应的类别信息,得到当前输入类别。13、如权利要求9所述的装置,其特征在于,所采集的当前输入环境的相关信息包括用户在当前输入环境中所涉及的文本数据;则所述类别确定模块通过对所述文本数据进行分析,确定该用户的当前输入类别。14、一种用户词库,其特征在于,包括:字词存储空间;针对每个字词的属性信息存储空间,该属性信息存储空间由多个子空间构成,一子空间对应一输入类别,用于记录该字词在不同输入类别下的属性信息。15、一种字符输入的方法,其特征在于,包括:加载系统词库和用户词库,所述用户词库中针对每个字词的属性信息存储空间由多个子空间构成,用于记录该字词在不同输入类别下的属性信息;所述属性信息包括词频信息;采集用户当前输入环境...

【专利技术属性】
技术研发人员:杨磊
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1