一种候选项确定方法和装置制造方法及图纸

技术编号:21431191 阅读:22 留言:0更新日期:2019-06-22 11:38
本申请实施例公开了一种候选项确定方法,该方法根据所输入编码串切分得到的多个词编码串,若相邻的两个编码串例如第一词编码串和第二词编码串中包括简拼部分,可以计算该第一词编码串和第二词编码串各自对应词构成的词组的关联程度,若前述构成的某一词组的关联程度满足第一预设条件,可以明确组成该词组的两个词在输入时同时出现的概率较大,那么该词组与用户编码串所希望上屏词组相符的可能性较高,故将该词组作为第一词编码串和第二词编码串对应的候选项更有可能满足用户的输入需求,从而提高了用户的输入体验。本申请实施例还公开了一种候选项确定装置。

【技术实现步骤摘要】
一种候选项确定方法和装置
本申请涉及输入法领域,特别是涉及一种候选项确定方法和装置。
技术介绍
输入法是指为将各种符号输入计算机或其他设备(如手机)而采用的编码方法,用户可以使用输入法便利的将需要的字符输入电子设备。例如在汉字输入法中,可以通过输入编码串将汉字输入到电子设备中。用户在使用输入法时,会有自己的使用习惯。一些用户习惯于通过纯简拼或者半简拼的形式输入编码串,而且一次性会输入较多的编码串,例如通过输入纯简拼编码串“wxxzsgsrf”上屏文字“我想下载搜狗输入法”。在用户使用类似上述纯简拼或半简拼输入编码串时,由于包括了纯简拼或半简拼的编码串对应着很多可能的全编码串的组合形式,若对每种可能的组合形式都进行全面的认定,需要较长的处理时间,导致输入法在展示对应的候选项时出现卡顿,降低了用户的输入体验。故针对包括了纯简拼或半简拼的编码串时,传统方式采用只取出一定数目的高频词条作为候选项,例如用户希望通过输入纯简拼编码串“sjwc”上屏“实际完成”,若该编码串被切分为“sj”和“wc”两部分,输入法将选取“sj”对应的高频词条例如“手机”,以及选取“wc”对应的高频词条例如“我才”构成“sjwc”的候选项“手机我才”展示给用户。显然这一候选项并没有实际含义,往往也不是用户所需要的。可见,传统方式中针对包括了纯简拼或半简拼的编码串确定的候选项通常难以满足用户需求,难以提高用户的输入体验。
技术实现思路
为了解决上述技术问题,本申请提供了一种候选项确定方法和装置,使得确定的候选项更有可能满足用户的输入需求,从而提高了用户的输入体验。本申请实施例公开了如下技术方案:第一方面,本申请实施例提供了一种候选项确定方法,所述方法包括:根据获取的编码串切分得到多个词编码串,其中一个词编码串对应一个词,所述多个词编码串中包括相邻的第一词编码串和第二词编码串,所述第一词编码串和所述第二词编码串中的至少一个词编码串包括简拼部分;计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度;将第一关联程度满足第一预设条件的词组作为所述第一词编码串和所述第二词编码串对应的候选项。可选的,在所述根据获取的编码串切分得到多个词编码串之前,所述方法包括:判断编码库中是否存在与所述编码串相匹配的编码串;若否,则执行所述根据获取的编码串切分得到多个词编码串的步骤。可选的,所述计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度包括:根据全编码串组合的第二关联程度计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度,所述全编码串组合是由所述第一词编码串扩展的全编码串和所述第二词编码串扩展的全编码串组成的。可选的,所述根据全编码串组合的第二关联程度计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度包括:计算全编码串组合的第二关联程度;计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度,所述第一关联程度包括所述第二关联程度。可选的,所述根据全编码串组合的第二关联程度计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度包括:计算全编码串组合的第二关联程度;若目标全编码串组合的第二关联程度满足第二预设条件,计算由所述第一词编码串扩展的目标全编码串所对应词和所述第二词编码串扩展的目标全编码串所对应词构成词组的第一关联程度,所述目标全编码串是由所述第一词编码串扩展的目标全编码串和所述第二词编码串扩展的目标全编码串组成的。可选的,所述第一词编码串和所述第二词编码串均为纯简拼编码串。第二方面,本申请实施例提供了一种候选项确定装置,所述装置包括切分单元、计算单元和确定单元:所述切分单元,用于根据获取的编码串切分得到多个词编码串,其中一个词编码串对应一个词,所述多个词编码串中包括相邻的第一词编码串和第二词编码串,所述第一词编码串和所述第二词编码串中的至少一个词编码串包括简拼部分;所述计算单元,用于计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度;所述确定单元,用于将第一关联程度满足第一预设条件的词组作为所述第一词编码串和所述第二词编码串对应的候选项。可选的,所述装置还包括判断单元:所述判断单元,用于判断编码库中是否存在与所述编码串相匹配的编码串;若否,则触发所述切分单元。可选的,所述计算单元用于:根据全编码串组合的第二关联程度计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度,所述全编码串组合是由所述第一词编码串扩展的全编码串和所述第二词编码串扩展的全编码串组成的。可选的,所述计算单元包括第一计算子单元和第二计算子单元:所述第一计算子单元,用于计算全编码串组合的第二关联程度;所述第二计算子单元,用于计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度,所述第一关联程度包括所述第二关联程度。可选的,所述计算单元包括第三计算子单元和第四计算子单元:所述第三计算子单元,用于计算全编码串组合的第二关联程度;所述第四计算子单元,用于若目标全编码串组合的第二关联程度满足第二预设条件,计算由所述第一词编码串扩展的目标全编码串所对应词和所述第二词编码串扩展的目标全编码串所对应词构成词组的第一关联程度,所述目标全编码串是由所述第一词编码串扩展的目标全编码串和所述第二词编码串扩展的目标全编码串组成的。可选的,所述第一词编码串和所述第二词编码串均为纯简拼编码串。第三方面,本申请实施例提供了一种用于候选项确定的处理设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:根据获取的编码串切分得到多个词编码串,其中一个词编码串对应一个词,所述多个词编码串中包括相邻的第一词编码串和第二词编码串,所述第一词编码串和所述第二词编码串中的至少一个词编码串包括简拼部分;计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度;将第一关联程度满足第一预设条件的词组作为所述第一词编码串和所述第二词编码串对应的候选项。第四方面,本申请实施例提供了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行第一方面中的一个或多个所述的候选项确定方法。由上述技术方案可以看出,针对根据所输入编码串切分得到的多个词编码串,若相邻的两个编码串例如第一词编码串和第二词编码串中包括简拼部分,可以计算该第一词编码串和第二词编码串各自对应词构成的词组的关联程度,若前述构成的某一词组的关联程度满足第一预设条件,可以明确组成该词组的两个词在输入时同时出现的概率较大,那么该词组与用户编码串所希望上屏词组相符的可能性较高,故将该词组作为第一词编码串和第二词编码串对应的候选项更有可能满足用户的输入需求,从而提高了用户的输入体验。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性本文档来自技高网...

【技术保护点】
1.一种候选项确定方法,其特征在于,所述方法包括:根据获取的编码串切分得到多个词编码串,其中一个词编码串对应一个词,所述多个词编码串中包括相邻的第一词编码串和第二词编码串,所述第一词编码串和所述第二词编码串中的至少一个词编码串包括简拼部分;计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度;将第一关联程度满足第一预设条件的词组作为所述第一词编码串和所述第二词编码串对应的候选项。

【技术特征摘要】
1.一种候选项确定方法,其特征在于,所述方法包括:根据获取的编码串切分得到多个词编码串,其中一个词编码串对应一个词,所述多个词编码串中包括相邻的第一词编码串和第二词编码串,所述第一词编码串和所述第二词编码串中的至少一个词编码串包括简拼部分;计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度;将第一关联程度满足第一预设条件的词组作为所述第一词编码串和所述第二词编码串对应的候选项。2.根据权利要求1所述的方法,其特征在于,在所述根据获取的编码串切分得到多个词编码串之前,所述方法包括:判断编码库中是否存在与所述编码串相匹配的编码串;若否,则执行所述根据获取的编码串切分得到多个词编码串的步骤。3.根据权利要求1或2所述的方法,其特征在于,所述计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度包括:根据全编码串组合的第二关联程度计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度,所述全编码串组合是由所述第一词编码串扩展的全编码串和所述第二词编码串扩展的全编码串组成的。4.根据权利要求3所述的方法,其特征在于,所述根据全编码串组合的第二关联程度计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度包括:计算全编码串组合的第二关联程度;计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度,所述第一关联程度包括所述第二关联程度。5.根据权利要求3所述的方法,其特征在于,所述根据全编码串组合的第二关联程度计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度包括:计算全编码串组合的第二关联程度;若目标全编码串组合的第二关联程度满足第二预设条件,计算由所述第一词编码串扩展的目标全编码串所对应词和所述第二词编码串扩展的目标全编码...

【专利技术属性】
技术研发人员:王丹张扬
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1