对输入法的候选项进行排序的方法和装置制造方法及图纸

技术编号:15547110 阅读:58 留言:0更新日期:2017-06-05 20:53
本发明专利技术实施例提供了一种对输入法的候选项进行排序的方法和装置,其中的方法具体包括:获取用户的输入串;根据所述输入串在词库或者词库和模型中进行查询,以得到与所述输入串相匹配的多个候选项;生成所述候选项的排序特征向量和排序特征向量对应的排序权重向量;其中,所述排序特征向量中排序特征与所述候选项对应的词库和/或模型相应,所述排序权重向量中排序权重用于表示排序特征对于候选项排序的影响权重;依据所述排序特征向量及所述排序权重向量,对所述多个候选项进行排序;根据所述排序结果将所述多个候选项进行展现。本发明专利技术实施例使得排序结果随着用户的使用将越来越贴合于用户的输入习惯,且使得排序结果将越来越符合用户的输入意图。

Method and apparatus for sorting entries of an input method

The embodiment of the invention provides a candidate for an input method for sorting method and device, the method includes: acquiring user input string; according to the input query string in the lexicon or dictionary and model, input a plurality of candidate string matching is obtained by the ranking; the weight vector sorting feature vector and sorted eigenvectors corresponding to generate the candidate; wherein, the sorting feature ordering feature vector and the corresponding candidate thesaurus and / or the corresponding model, the weight vector in the ranking weight for sorting characteristics for said candidate ranking according to the weight; the sorting feature vector and the weight vector, the plurality of candidate items are sorted according to the ranking results; the plurality of candidate items to show. The embodiment of the invention makes the ordering result more and more fit with the user's input habit as the user uses, and makes the sorting result more and more accord with the input intention of the user.

【技术实现步骤摘要】
对输入法的候选项进行排序的方法和装置
本专利技术涉及输入法
,特别是涉及一种对输入法的候选项进行排序的方法和一种对输入法的候选项进行排序的装置。
技术介绍
对于中文、日文、韩文等语言的用户而言,一般都需要通过输入法与计算机进行交互。例如,用户可以通过键盘键入输入串,然后由输入法依据其预置的标准映射规则将该输入串转换为相应语言的候选项并展示,进而将用户选择的候选项上屏。用户在使用输入法的过程中,现有技术已经存在多种候选项的排序方式,如:固定顺序排序、按照候选项类型排序等;其中,按固定顺序排序时,候选项的顺序是固定的,能够便于用户对常用字的输入,但大多应用场景下,候选项固定顺序必然会影响到用户的输入速度;例如,每次针对输入串“jiji”的输入,向用户推送的候选项排序基本是一样的,其中,排在前几位的候选项依次为:“积极”、“基极”、“几级”、“几集”等,这样,用户所需的目标候选项为“记记”时,需要翻页才能选择该目标候选项,由于无法向用户提供合理的候选项排序,因此降低了用户的输入速度;按照候选项类型排序遵循的排序策略为:用户使用过的词被再次选用的概率往往更高,所以用户词库中用户词条的优先级高于其他词库中词条的优先级,故该排序策略通常一律地将用户词条固定排在其他词库的词条的前面,那么在用户第一次选择上屏“记记”这个词条后,第二次输入“jiji”时,用户词条“记记”将被排在首位,即排在其他系统词条(包括较高频的“积极”)的前面;然而,对于一个用户仅使用过1次的词条(比如“记记”),其不一定比同音下高频的系统词条更合理、更符合用户的输入意图。
技术实现思路
鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的,对输入法的候选项进行排序的方法、相应的对输入法的候选项进行排序的装置和相应的用于对输入法的候选项进行排序的装置,使得排序结果随着用户的使用将越来越贴合于用户的输入习惯,且使得排序结果将越来越符合用户的输入意图,从而便于用户快速选择其所需的候选项,提高用户的输入速度。为了解决上述问题,本专利技术公开了一种对输入法的候选项进行排序的方法,包括:获取用户的输入串;根据所述输入串在词库或者词库和模型中进行查询,以得到与所述输入串相匹配的多个候选项;生成所述候选项的排序特征向量和所述排序特征向量对应的排序权重向量;其中,所述排序特征向量中排序特征与所述候选项对应的词库和/或模型相应,所述排序权重向量中排序权重用于表示依据用户的历史输入行为数据得到的、所述排序特征对于候选项排序的影响权重;依据所述排序特征向量及所述排序权重向量,对所述多个候选项进行排序;根据所述排序结果将所述多个候选项进行展现。可选地,所述依据所述排序特征向量及所述排序权重向量,对所述多个候选项进行排序的步骤,包括:依据所述排序特征的特征值和与所述排序特征相对应的排序权重,得到所述排序特征向量对应候选项的得分;依据所述排序特征向量对应候选项的得分,对所述多个候选项进行排序。可选地,所述排序权重包括:所述排序特征在用户的历史上屏行为数据中的上屏分布;和/或将用户的历史输入行为数据作为训练样本,依据所述训练样本和所述训练样本对应的排序特征的特征值训练得到的排序权重。可选地,所述排序特征的特征值包括:所述候选项在对应的词库或模型中的词频,和/或,所述候选项在对应的词库或模型中的概率,和/或,所述候选项在对应的词库或模型中的概率的对数。可选地,所述词库或者模型用于描述与所述候选项相关的两个及两个以上元素之间的转换概率,则所述排序特征的特征值包括:所述转换概率,和/或,所述转换概率的对数。可选地,所述候选项对应的词库和/或模型包括:所述候选项所属的词库和/或模型,或者,所述候选项和上文所属的词库和/或模型;所述词库包括:系统词库、用户词库和细胞词库中的至少一种;所述模型包括:纠错模型、模糊音模型、组词模型和上下文模型中的至少一种。可选地,所述方法还包括:依据用户对于所展现的候选项的上屏行为,对所述排序特征的特征值和排序权重进行更新。可选地,所述对所述排序特征的特征值和排序权重进行更新的步骤,包括:在所述上屏行为对应候选项的排序特征与用户词库或用户模型相应时,依据候选项及其排序特征,更新所述候选项在所述用户词库或者用户模型中的属性参数,并依据所述候选项的当前属性参数,更新所述排序特征的特征值和排序权重;或者在所述上屏行为对应候选项的排序特征与系统词库或系统模型相应时,依据候选项及其排序特征,更新所述候选项在所述系统词库对应的用户词库或者所述系统模型对应的用户模型中的属性参数,并依据所述候选项的当前属性参数,更新所述排序特征的特征值和排序权重;或者依据所述上屏行为对应的数据更新历史输入行为数据和排序特征的特征值,并依据当前历史行为数据和当前排序特征的特征值训练得到当前排序权重;或者依据所述上屏行为对应的数据更新历史输入行为数据,并依据当前历史行为数据训练得到当前排序特征和当前排序权重。另一方面,本专利技术还公开了一种对输入法的候选项进行排序的装置,包括:获取模块,用于获取用户的输入串;查询模块,用于根据所述输入串在词库或者词库和模型中进行查询,以得到与所述输入串相匹配的多个候选项;生成模块,用于生成所述候选项的排序特征向量和所述排序特征向量对应的排序权重向量;其中,所述排序特征向量中排序特征与所述候选项对应的词库和/或模型相应,所述排序权重向量中排序权重用于表示依据用户的历史输入行为数据得到的、所述排序特征对于候选项排序的影响权重;排序模块,用于依据所述排序特征向量及所述排序权重向量,对所述多个候选项进行排序;及展现模块,用于根据所述排序结果将所述多个候选项进行展现。再一方面,本专利技术还公开了一种用于对输入法的候选项进行排序的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:获取用户的输入串;根据所述输入串在词库或者词库和模型中进行查询,以得到与所述输入串相匹配的多个候选项;生成所述候选项的排序特征向量和所述排序特征向量对应的排序权重向量;其中,所述排序特征向量中排序特征与所述候选项对应的词库和/或模型相应,所述排序权重向量中排序权重用于表示依据用户的历史输入行为数据得到的、所述排序特征对于候选项排序的影响权重;依据所述排序特征向量及所述排序权重向量,对所述多个候选项进行排序;根据所述排序结果将所述多个候选项进行展现。本专利技术实施例包括以下优点:本专利技术实施例依据排序特征组成的排序特征向量、及排序权重向量对多个候选项进行排序;上述排序权重为依据用户的历史输入行为数据得到,与上述排序特征相匹配的词库和/或模型也会随着用户累积的历史输入行为数据而动态调整,也即,本专利技术实施例的上述排序特征及其排序权重均可以随着用户的历史输入行为而动态调整和学习成长,因此,随着历史输入行为的积累,本专利技术实施例提供的排序结果将越来越贴合于用户的输入习惯,且提供的排序结果将越来越符合用户的输入意图,从而便于用户快速选择其所需的候选项,提高用户的输入效率。附图说明图1是本专利技术的一种对输入法的候选项进行排序的方法实施例一的步骤流程图;图本文档来自技高网...
对输入法的候选项进行排序的方法和装置

【技术保护点】
一种对输入法的候选项进行排序的方法,其特征在于,包括:获取用户的输入串;根据所述输入串在词库或者词库和模型中进行查询,以得到与所述输入串相匹配的多个候选项;生成所述候选项的排序特征向量和所述排序特征向量对应的排序权重向量;其中,所述排序特征向量中排序特征与所述候选项对应的词库和/或模型相应,所述排序权重向量中排序权重用于表示依据用户的历史输入行为数据得到的、所述排序特征对于候选项排序的影响权重;依据所述排序特征向量及所述排序权重向量,对所述多个候选项进行排序;根据所述排序结果将所述多个候选项进行展现。

【技术特征摘要】
1.一种对输入法的候选项进行排序的方法,其特征在于,包括:获取用户的输入串;根据所述输入串在词库或者词库和模型中进行查询,以得到与所述输入串相匹配的多个候选项;生成所述候选项的排序特征向量和所述排序特征向量对应的排序权重向量;其中,所述排序特征向量中排序特征与所述候选项对应的词库和/或模型相应,所述排序权重向量中排序权重用于表示依据用户的历史输入行为数据得到的、所述排序特征对于候选项排序的影响权重;依据所述排序特征向量及所述排序权重向量,对所述多个候选项进行排序;根据所述排序结果将所述多个候选项进行展现。2.根据权利要求1所述的方法,其特征在于,所述依据所述排序特征向量及所述排序权重向量,对所述多个候选项进行排序的步骤,包括:依据所述排序特征的特征值和与所述排序特征相对应的排序权重,得到所述排序特征向量对应候选项的得分;依据所述排序特征向量对应候选项的得分,对所述多个候选项进行排序。3.根据权利要求1或2所述的方法,其特征在于,所述排序权重包括:所述排序特征在用户的历史上屏行为数据中的上屏分布;和/或将用户的历史输入行为数据作为训练样本,依据所述训练样本和所述训练样本对应的排序特征的特征值训练得到的排序权重。4.根据权利要求1或2所述的方法,其特征在于,所述排序特征的特征值包括:所述候选项在对应的词库或模型中的词频,和/或,所述候选项在对应的词库或模型中的概率,和/或,所述候选项在对应的词库或模型中的概率的对数。5.根据权利要求1或2所述的方法,其特征在于,所述词库或者模型用于描述与所述候选项相关的两个及两个以上元素之间的转换概率,则所述排序特征的特征值包括:所述转换概率,和/或,所述转换概率的对数。6.根据权利要求1或2所述的方法,其特征在于,所述候选项对应的词库和/或模型包括:所述候选项所属的词库和/或模型,或者,所述候选项和上文所属的词库和/或模型;所述词库包括:系统词库、用户词库和细胞词库中的至少一种;所述模型包括:纠错模型、模糊音模型、组词模型和上下文模型中的至少一种。7.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:依据用户对于所展现的候选项的上屏行为,对所述排序特征的特征值和排序权重进行更新。8.根据权利要求7所述的方法,其特征在于,所述对所述排序特征的特征值和排序权重进行更新的步骤,包括:在...

【专利技术属性】
技术研发人员:马尔胡甫·曼苏尔汤沛张扬
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1