The embodiment of the invention provides a candidate for an input method for sorting method and device, the method includes: acquiring user input string; according to the input query string in the lexicon or dictionary and model, input a plurality of candidate string matching is obtained by the ranking; the weight vector sorting feature vector and sorted eigenvectors corresponding to generate the candidate; wherein, the sorting feature ordering feature vector and the corresponding candidate thesaurus and / or the corresponding model, the weight vector in the ranking weight for sorting characteristics for said candidate ranking according to the weight; the sorting feature vector and the weight vector, the plurality of candidate items are sorted according to the ranking results; the plurality of candidate items to show. The embodiment of the invention makes the ordering result more and more fit with the user's input habit as the user uses, and makes the sorting result more and more accord with the input intention of the user.
【技术实现步骤摘要】
对输入法的候选项进行排序的方法和装置
本专利技术涉及输入法
,特别是涉及一种对输入法的候选项进行排序的方法和一种对输入法的候选项进行排序的装置。
技术介绍
对于中文、日文、韩文等语言的用户而言,一般都需要通过输入法与计算机进行交互。例如,用户可以通过键盘键入输入串,然后由输入法依据其预置的标准映射规则将该输入串转换为相应语言的候选项并展示,进而将用户选择的候选项上屏。用户在使用输入法的过程中,现有技术已经存在多种候选项的排序方式,如:固定顺序排序、按照候选项类型排序等;其中,按固定顺序排序时,候选项的顺序是固定的,能够便于用户对常用字的输入,但大多应用场景下,候选项固定顺序必然会影响到用户的输入速度;例如,每次针对输入串“jiji”的输入,向用户推送的候选项排序基本是一样的,其中,排在前几位的候选项依次为:“积极”、“基极”、“几级”、“几集”等,这样,用户所需的目标候选项为“记记”时,需要翻页才能选择该目标候选项,由于无法向用户提供合理的候选项排序,因此降低了用户的输入速度;按照候选项类型排序遵循的排序策略为:用户使用过的词被再次选用的概率往往更高,所以用户词库中用户词条的优先级高于其他词库中词条的优先级,故该排序策略通常一律地将用户词条固定排在其他词库的词条的前面,那么在用户第一次选择上屏“记记”这个词条后,第二次输入“jiji”时,用户词条“记记”将被排在首位,即排在其他系统词条(包括较高频的“积极”)的前面;然而,对于一个用户仅使用过1次的词条(比如“记记”),其不一定比同音下高频的系统词条更合理、更符合用户的输入意图。
技术实现思路
鉴于上述问 ...
【技术保护点】
一种对输入法的候选项进行排序的方法,其特征在于,包括:获取用户的输入串;根据所述输入串在词库或者词库和模型中进行查询,以得到与所述输入串相匹配的多个候选项;生成所述候选项的排序特征向量和所述排序特征向量对应的排序权重向量;其中,所述排序特征向量中排序特征与所述候选项对应的词库和/或模型相应,所述排序权重向量中排序权重用于表示依据用户的历史输入行为数据得到的、所述排序特征对于候选项排序的影响权重;依据所述排序特征向量及所述排序权重向量,对所述多个候选项进行排序;根据所述排序结果将所述多个候选项进行展现。
【技术特征摘要】
1.一种对输入法的候选项进行排序的方法,其特征在于,包括:获取用户的输入串;根据所述输入串在词库或者词库和模型中进行查询,以得到与所述输入串相匹配的多个候选项;生成所述候选项的排序特征向量和所述排序特征向量对应的排序权重向量;其中,所述排序特征向量中排序特征与所述候选项对应的词库和/或模型相应,所述排序权重向量中排序权重用于表示依据用户的历史输入行为数据得到的、所述排序特征对于候选项排序的影响权重;依据所述排序特征向量及所述排序权重向量,对所述多个候选项进行排序;根据所述排序结果将所述多个候选项进行展现。2.根据权利要求1所述的方法,其特征在于,所述依据所述排序特征向量及所述排序权重向量,对所述多个候选项进行排序的步骤,包括:依据所述排序特征的特征值和与所述排序特征相对应的排序权重,得到所述排序特征向量对应候选项的得分;依据所述排序特征向量对应候选项的得分,对所述多个候选项进行排序。3.根据权利要求1或2所述的方法,其特征在于,所述排序权重包括:所述排序特征在用户的历史上屏行为数据中的上屏分布;和/或将用户的历史输入行为数据作为训练样本,依据所述训练样本和所述训练样本对应的排序特征的特征值训练得到的排序权重。4.根据权利要求1或2所述的方法,其特征在于,所述排序特征的特征值包括:所述候选项在对应的词库或模型中的词频,和/或,所述候选项在对应的词库或模型中的概率,和/或,所述候选项在对应的词库或模型中的概率的对数。5.根据权利要求1或2所述的方法,其特征在于,所述词库或者模型用于描述与所述候选项相关的两个及两个以上元素之间的转换概率,则所述排序特征的特征值包括:所述转换概率,和/或,所述转换概率的对数。6.根据权利要求1或2所述的方法,其特征在于,所述候选项对应的词库和/或模型包括:所述候选项所属的词库和/或模型,或者,所述候选项和上文所属的词库和/或模型;所述词库包括:系统词库、用户词库和细胞词库中的至少一种;所述模型包括:纠错模型、模糊音模型、组词模型和上下文模型中的至少一种。7.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:依据用户对于所展现的候选项的上屏行为,对所述排序特征的特征值和排序权重进行更新。8.根据权利要求7所述的方法,其特征在于,所述对所述排序特征的特征值和排序权重进行更新的步骤,包括:在...
【专利技术属性】
技术研发人员:马尔胡甫·曼苏尔,汤沛,张扬,
申请(专利权)人:北京搜狗科技发展有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。