输入法词序优化方法、装置及输入法系统制造方法及图纸

技术编号:7682497 阅读:206 留言:0更新日期:2012-08-16 05:51
本发明专利技术提供一种输入法词序优化方法,包括:获取用户输入环境的文字信息;将所述文字信息拆分成词汇,并计算各个词汇的词频;根据所述词频对输入法的候选词的词序进行优化。本发明专利技术还提供一种输入法词序优化装置及输入法系统,通过本发明专利技术的技术,实现了将输入法与用户当前输入环境之间的紧密结合,能够更加准确地满足用户的文字输入需求,在进行文字输入时,用户可以快速地选择到合适的词汇,提高了文字输入的速度。

【技术实现步骤摘要】

本专利技术涉及输入法技术,特别是涉及一种输入法词序优化方法、装置及输入法系统
技术介绍
在现今的信息时代,人们对键盘输入的依赖越来越多,对于输入速度的要求也是越来越高,目前,一些输入法都能够根据用户对于某些词汇的使用频率进行记录,在进行候选词排序时将以往选择频率较高的词汇排在靠前的位置。但用户在不同的输入环境中对于词汇的使用都是不同的,往往出现在进行某个文档编辑时,所需的词汇并非以往使用频率较高的词汇,而是与当前所处的输入环境有关,例如,用户当前正在处理与计算机相关的文档时,此时用户的所处的输入环境是与计算机领域相关的文字信息,此时如果按以往使用频率来对候选词汇进行排序,则用户需要对候选词作较多的选择才可以选择到合适的词汇,导致输入速度变慢。
技术实现思路
基于此,有必要针对上述只按以往使用频率来对候选词汇进行排序,则用户需要对候选词作较多的选择才可以选择到合适的词汇,导致输入速度变慢的问题,提供ー种输入法词序优化方法、装置及输入法系统。一种输入法词序优化方法,包括如下步骤获取用户输入环境的文字信息;将所述文字信息拆分成词汇,并计算各个词汇的词频;根据所述词频对输入法的候选词的词序进行优化。一种输入法词序优化装置,包括输入环境获取单元,用于获取用户输入环境的文字信息;智能学习单元,用于将所述文字信息拆分成词汇,并计算各个词汇的词频;词序优化単元,用于根据所述词频对输入法的候选词的词序进行优化。一种输入法系统,包括如上述的输入法词序优化装置。上述输入法词序优化方法、装置及输入法,针对用户在不同的输入环境中对于词汇的使用都是不同的情况,通过获取用户的输入环境的文字信息,对文字信息进行智能学习,分词并计算词频,根据该分词的词汇及其词频对输入法的候选词进行优化,实现了将输入法与用户当前输入环境之间的紧密结合,能够更加准确地满足用户的文字输入需求,在进行文字输入时,用户可以快速地选择到合适的词汇,提高了文字输入的速度。附图说明图I为本专利技术的输入法词序优化方法的实施例的流程图;图2为本专利技术的输入法词序优化装置的实施例的结构示意图。具体实施例方式下面结合附图对本专利技术的输入法词序优化方法的具体实施方式作详细描述。如图I所示,图I是本专利技术的输入法词序优化方法的一个实施例的流程图,包括如下步骤 S101、获取用户输入环境的文字信息;在一个实施例中,在当前用户输入环境下,获取各种格式的文档、网页上等文字信息,例如在用户当前输入环境下,有文档D,则对文档D上的文字信息进行识别和读取。S102、将所述文字信息拆分成词汇,并计算各个词汇的词频;在一个实施例中,将所获取的文字信息拆分为常用的词汇,并计算各词汇及其对应的词频,其中,词频可以用出现的次数直接表示,如某词汇出现次数三次,则记词频为3,进一步地,将词汇及其词频以关系组的形式存储在数据库中。S103、根据所述词频对输入法的候选词的词序进行优化。在一个实施例中,优化的过程具体包括以下步骤(I)从数据库中抽取与输入法的候选词的相同的词汇及其词频组成优化集合;例如,用户想输入文字W,在当前输入法中键入编码a,可以得到候选词序列qn,从数据库中取出与序列qn相同的词汇及其词频得到优化集合;(2)根据词频的大小顺序对上述优化集合中的词汇进行排序;例如,将从数据库中提取的与上述序列qn相同的词汇,进行排序得到序列N ;(3)将优化集合与由候选词构成的候选集合进行合并;即将候选词的序列qn与序列N组合,其中,qn中的词频都为0,N中的词频为数据库中的记录数据;(4)对合并得到的并集中词汇的词频重新排序获得优化词序的候选词;即取qn与N两个集合的并集,并重新计算词频,对该并集按词频大小进行重新排序得到优化序列qn',用户即可以在词汇序列qn'中选择词汇W,然后更新数据库,在数据库中将词汇W的词频增加I。下面结合附图对本专利技术的输入法词序优化方法对应的装置的具体实施方式作详细描述。如图2所示,图2是本专利技术的输入法词序优化装置的一个实施例的结构示意图,包括输入环境获取单元,用于获取用户输入环境的文字信息;智能学习单元,用于将所述文字信息拆分成词汇,并计算各个词汇的词频;词序优化单元,用于根据所述词频对输入法的候选词的词序进行优化。优选地,本专利技术的输入法词序优化装置还可以包括存储单元,用于将所述词汇及其词频以关系组的形式存储在数据库中。优选地,对于所述词序优化单元,具体包括集合设置模块,用于从数据库中抽取与所述输入法的候选词的相同的词汇及其词频组成优化集合;排序模块,用于根据所述词频的大小顺序对所述优化集合中的词汇进行排序;集合合并模块,用于将所述优化集合与由所述候选词构成的候选集合进行合并;重排模块,用于对所述合并得到的并集中词汇的词频重新排序获得优化词序的候选词。为了更清晰本专利技术的技术,下面列举一个应用实例来做详细的描述。如用户在编辑一份与计算机相关的文档,在其当前输入环境下,浏览其它的与计算机有关的文档、以及相关网页等,假设用户当前使用拼音输入法,此时,用户想输入“计算机”时,在键盘上输入编码为“jsj”,由于用户以往输入较多的词汇是“建设局”、“技术局”、“计生局” “缉私局”……所以,此时输入“jsj”时,排在最前面的候选词是上述词汇,而“计算机”可能会排在词序的较后位置,所以用户可能需要进行多次翻页才能选择到词汇“计算机”,而采用本专利技术的技术后,由于已经对当前输入环境中的文字信息进行智能学习,“计算机”的词频较高,且已经经过计算并存储在数据库中,此时,利用数据库记录的数据对候选词进行重新排序,则“计算机”将排在词序的前面,用户即可以快速地选择到所需词汇,提高了输入法的输入速度。另外,本专利技术的输入法词序优化技术支持跨输入法应用,由于分词以及词频计算是基于用户输入环境下完成,因此,当用户切换输入法时,与输入法编码无关,在输入环境相同情况下,就可以进行词序优化。下面对本专利技术的输入法系统的具体实施方式作详细描述。一种输入法系统,包括如上述实施例的输入法词序优化装置;该输入法系统与用户当前输入环境紧密结合,能够更加准确地满足用户的文字输入需求。以上所述实施例仅表达了本专利技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本专利技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本专利技术构思的前提下,还可以做出若干变形和改进,这些都属于本专利技术的保护范围。因此,本专利技术专利的保护范围应以所附权利要求为准。权利要求1.一种输入法词序优化方法,其特征在于,包括如下步骤 获取用户输入环境的文字信息; 将所述文字信息拆分成词汇,并计算各个词汇的词频; 根据所述词频对输入法的候选词的词序进行优化。2.根据权利要求I所述的输入法词序优化方法,其特征在于,还包括将所述词汇及其词频以关系组的形式存储在数据库中。3.根据权利要求2所述的输入法词序优化方法,其特征在于,所述根据所述词频对输入法的候选词的词序进行优化的步骤包括 从数据库中抽取与所述输入法的候选词的相同的词汇及其词频组成优化集合; 根据所述词频的大小顺序对所述优化集合中的词汇进行排序; 将所述优化集合与由所述候选词构成的候选集合进行合并; 对所述合并得到的并集中词汇的词频重新排序获得优化词序的候选词。4.一本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:曾相宗
申请(专利权)人:广东威创视讯科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1