候选词生成方法、装置以及用于候选词生成的装置制造方法及图纸

技术编号:16101391 阅读:32 留言:0更新日期:2017-08-29 22:20
本申请提供了一种候选词生成方法及装置,其中,候选词生成方法包括:响应于用户输入字符串的操作,获取当前输入环境,所述当前输入环境用于表示用户当前打开应用的所属类别;判断所述输入字符串是否有误,如果是,则结合所述当前输入环境对所述输入字符串进行纠错,得到目标字符串,如果否,则将所述输入字符串确定为目标字符串;参考当前输入环境对应的领域词库,将所述目标字符串生成对应的目标候选词;所述领域词库为所述当前输入环境对应的环境词库。采用本申请实施例,可以提高用户的输入速度,提升用户的输入体验。

【技术实现步骤摘要】
候选词生成方法、装置以及用于候选词生成的装置
本申请涉及输入法
,特别涉及一种候选词生成方法、装置以及一种用于候选词生成的装置。
技术介绍
随着互联网技术的飞速发展,用户使用互联网设备进行交流的机会越来越多,也因此对输入法有越来越多的输入需求。可是目前的输入法在使用时,如果用户的字符串输入错误,会结合系统词库中的常用候选词,比如使用概率较大的候选词来对字符串进行纠错,最后再根据纠错后的字符串来生成最终的候选词。
技术实现思路
但是专利技术人在研究过程中发现,随着移动设备和各种类型APP的广泛应用,输入环境与用户输入需求之间的关系越来越密切,而现有技术的纠错及获取候选往往是一个相对孤立的过程,没有考虑到输入环境因素对用户输入需求的影响,不足以提供用户在不同输入场景下的最优候选。例如同一输入串往往会对应多种类型的候选词,例如地点、歌名,还有可能是饭店的名字,现有技术在所有输入环境下提供的候选结果及排序都是相同的,往往与用户实际想要输入的内容相差甚远,用户体验较差。基于此,本申请提供了一种候选词生成方案,依据当前输入环境得到纠错结果并生成候选项,有效提高了首项或者首页候选词命中用户目标词的可能性,从而提高用户的输入效率,进一步提升用户的输入体验。本申请还提供了一种生成候选词的装置,用以保证上述方法在实际中的实现及应用。本申请公开的一种候选词生成方法,该方法包括:响应于用户在当前输入框中输入字符串的操作,获取当前输入环境,所述当前输入环境用于表示用户当前打开应用的所属类别;判断所述输入字符串是否有误,如果是,则结合所述当前输入环境对所述输入字符串进行纠错,得到目标字符串,如果否,则将所述输入字符串确定为目标字符串;参考当前输入环境对应的领域词库,将所述目标字符串生成对应的目标候选词;所述领域词库为所述当前输入环境对应的环境词库。其中,所述结合所述当前输入环境对所述输入字符串进行纠错,得到目标字符串,包括:确定所述输入字符串对应的纠错候选串;获取所述纠错候选串被输入成所述输入字符串的纠错概率,以及,纠错候选串对应的词频;所述纠错概率用于表示所述输入字符串是某一个纠错候选串的可能性,所述词频用于表示所述纠错候选串在所述当前输入法的语料库中出现的次数;依据所述纠错概率得分和词频确定最佳纠错串。其中,所述参考当前输入环境对应的领域词库,将所述目标字符串生成对应的目标候选词,包括:判断所述目标字符串在所述当前输入环境的领域词库中是否存在对应的优选候选词,如果是,则将所述优选候选词对应的词频乘以预设激励值,得到优选词频;比较所述优选词频与原始候选词对应的原始词频的大小,所述原始候选词为所述目标字符串在非领域词库中对应的候选词;如果优选词频大于所述原始词频,则将优选候选词确定为目标候选词中的最佳候选词;如果优选词频不大于所述原始词频,则将所述原始候选词确定为目标候选词中的最佳候选词。其中,在生成对应的目标候选词之后,还包括:将所述目标候选词在预设显示位置进行显示,其中,所述最佳候选词在显示序列中的顺序大于目标候选词中的非最佳候选词。其中,在显示目标候选词之后,还包括:响应于用户在最佳候选词上的选择操作,将所述最佳候选词输入至当前输入框中。本申请公开的一种候选词生成装置,包括:获取环境模块,用于响应于用户输入字符串的操作,获取当前输入环境,所述当前输入环境用于表示用户当前打开应用的所属类别;判断模块,用于判断所述输入字符串是否有误;纠错模块,用于在所述判断结果为是的情况下,结合所述当前输入环境对所述输入字符串进行纠错,得到目标字符串;确定模块,用于在所述判断模块为否的情况下,将所述输入字符串确定为目标字符串;生成候选词模块,用于参考当前输入环境对应的领域词库,将所述目标字符串生成对应的目标候选词;所述领域词库为所述当前输入环境对应的环境词库。其中,还包括:输入模块,用于响应于用户在最佳候选词上的选择操作,将所述最佳候选词输入至当前输入框中。本申请公开的一种用于生成候选词的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:响应于用户在当前输入框中输入字符串的操作,获取当前输入环境,所述当前输入环境用于表示用户当前打开应用的所属类别;判断所述输入字符串是否有误,如果是,则结合所述当前输入环境对所述输入字符串进行纠错,得到目标字符串,如果否,则将所述输入字符串确定为目标字符串;参考当前输入环境对应的领域词库,将所述目标字符串生成对应的目标候选词;所述领域词库为所述当前输入环境对应的环境词库。在本申请实施例中,在生成候选词的过程中,通过获取到的当前输入环境,来对用户输入错误的字符串进行纠错,从而将与输入环境对应的字符串纠错为最佳候选串,进而将与输入环境对应的候选词纠错为最佳候选词;或者,在不需要对用户输入的字符串进行纠错的情况下,直接依据与输入环境匹配的领域词库来生成候选词,从而使得本申请生成的目标候选词与用户打开的应用类别匹配,这样就能更容易命中用户的目标词,从而尽量减少用户输入时的出错次数,也可以加快用户的输入速度,从而提升用户体验。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本申请的候选词生成方法实施例的流程图;图2是本申请的生成候选词的界面示意图一;图3是本申请的生成候选词的界面示意图二;图4是本申请的一种候选词生成装置实施例的结构框图;图5是本申请中根据一示例性实施例示出的一种用于生成候选词的装置800的框图;图6是本申请实施例中服务器的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。参考图1,示出了本申请一种候选词生成方法实施例的流程图,本实施例可以包括以下步骤:步骤101:响应于用户输入字符串的操作,获取当前输入环境,所述当前输入环境用于表示用户当前打开应用的所属类别。本申请实施例可以应用于用户在终端上进行字符输入的输入过程中。例如,用户在使用智能手机的过程中,打开了某一个第三方应用程序APP(即当本文档来自技高网...
候选词生成方法、装置以及用于候选词生成的装置

【技术保护点】
一种候选词生成方法,其特征在于,该方法包括:响应于用户输入字符串的操作,获取当前输入环境,所述当前输入环境用于表示用户当前打开应用的所属类别;判断所述输入字符串是否有误,如果是,则结合所述当前输入环境对所述输入字符串进行纠错,得到目标字符串,如果否,则将所述输入字符串确定为目标字符串;参考当前输入环境对应的领域词库,将所述目标字符串生成对应的目标候选词;所述领域词库为所述当前输入环境对应的环境词库。

【技术特征摘要】
1.一种候选词生成方法,其特征在于,该方法包括:响应于用户输入字符串的操作,获取当前输入环境,所述当前输入环境用于表示用户当前打开应用的所属类别;判断所述输入字符串是否有误,如果是,则结合所述当前输入环境对所述输入字符串进行纠错,得到目标字符串,如果否,则将所述输入字符串确定为目标字符串;参考当前输入环境对应的领域词库,将所述目标字符串生成对应的目标候选词;所述领域词库为所述当前输入环境对应的环境词库。2.根据权利要求1所述的方法,其特征在于,所述结合所述当前输入环境对所述输入字符串进行纠错,得到目标字符串,包括:确定所述输入字符串对应的纠错候选串;获取所述纠错候选串被输入成所述输入字符串的纠错概率,以及,纠错候选串对应的词频;所述纠错概率用于表示所述输入字符串是某一个纠错候选串的可能性,所述词频用于表示所述纠错候选串在所述当前输入法的语料库中出现的次数;依据所述纠错概率得分和词频确定最佳纠错串。3.根据权利要求1所述的方法,其特征在于,所述参考当前输入环境对应的领域词库,将所述目标字符串生成对应的目标候选词,包括:判断所述目标字符串在所述当前输入环境的领域词库中是否存在对应的优选候选词,如果是,则将所述优选候选词对应的词频乘以预设激励值,得到优选词频;比较所述优选词频与原始候选词对应的原始词频的大小,所述原始候选词为所述目标字符串在非领域词库中对应的候选词;如果优选词频大于所述原始词频,则将优选候选词确定为目标候选词中的最佳候选词;如果优选词频不大于所述原始词频,则将所述原始候选词确定为目标候选词中的最佳候选词。4.根据权利要求3所述的方法,其特征在于,在生成对应的目标候选词之后,还包括:将所述目标候选词在预设显示位置进...

【专利技术属性】
技术研发人员:王丹张扬
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1