本发明专利技术的目的是提供一种用于基于本地词库提供输入候选词条的方法与设备;获取用户输入的输入字符串;根据该输入字符串,在本地词库中进行匹配查询,获取对应的候选词条,其中,该本地词库根据用户历史分段上屏的输入词条记录建立或更新;根据该候选词条中所包括的末节子词条,在该本地词库中匹配查询得到对应的下文词条;将该候选词条与该下文词条进行合并处理,得到输入候选词条并提供给该用户。与现有技术相比,本发明专利技术准确、有效地扩大了提供的输入候选词条的范围,使得提供的输入候选词条更符合用户的输入需求,提升了用户的输入体验。
【技术实现步骤摘要】
一种基于本地词库提供输入候选词条的方法与设备
本专利技术涉及输入法
,尤其涉及一种用于基于本地词库提供输入候选词条的技术。
技术介绍
现有技术中,输入法一般仅对用户某次完整输入的内容进行学习,但没对分段上屏的上下文关系进行学习。例如用户分别输入输入字符串ab,上屏ab对应的输入词条al,紧接着该用户输入输入字符串Cd,并上屏Cd对应的输入词条a2,现有输入法并不会对该两个分段上屏的输入词条al、a2间的上下文关系进行学习;仅当该用户一次输入输入字符串abed,并上屏输入词条ala2时,现有输入法才会对该输入词条ala2进行学习。显然,现有技术的该种方式不利于本地词库的更新,使得匹配得到的输入候选词条受到了限制,影响了用户的输入体验。并且,现有技术的输入法不会基于用户历史分段上屏的输入词条记录,给出预测的输入候选词条,进一步使得提供给用户的输入候选词条受到了限制,影响了用户的输入体验。因此,如何有效地基于本地词库提供输入候选词条,提升用户的输入体验,成为本领域技术人员亟需解决的一个问题。
技术实现思路
本专利技术的目的是提供一种用于基于本地词库提供输入候选词条的方法与设备。根据本专利技术的一个方面,提供了一种用于基于本地词库提供输入候选词条的方法,其中,该方法包括以下步骤:a获取用户输入的输入字符串;b根据所述输入字符串,在本地词库中进行匹配查询,获取对应的候选词条,其中,所述本地词库根据用户历史分段上屏的输入词条记录建立或更新;c对所述候选词条中所包括的末节子词条,在所述本地词库中进行匹配查询,确定所述末节子词条所对应的下文词条;d将所述候选词条与所述下文词条进行合并处理,以获得待提供给所述用户的输入候选词条;e将所述输入候选词条提供给所述用户。根据本专利技术的另一方面,还提供了一种用于基于本地词库提供输入候选词条的用户设备,其中,该设备包括:第一获取装置,用于获取用户输入的输入字符串;第一匹配装置,用于根据所述输入字符串,在本地词库中进行匹配查询,获取对应的候选词条,其中,所述本地词库根据用户历史分段上屏的输入词条记录建立或更新;第二匹配装置,用于对所述候选词条中所包括的末节子词条,在所述本地词库中进行匹配查询,确定所述末节子词条所对应的下文词条;合并装置,用于将所述候选词条与所述下文词条进行合并处理,以获得待提供给所述用户的输入候选词条;提供装置,用于将所述输入候选词条提供给所述用户。与现有技术相比,本专利技术根据用户输入的输入字符串,在根据用户历史分段上屏的输入词条记录建立或更新的本地词库中进行匹配查询,获取对应的候选词条,并进一步根据该候选词条中所包括的末节子词条,在该本地词库中匹配查询得到对应的下文词条,将该候选词条与该下文词条进行合并处理,得到输入候选词条并提供给该用户,准确、有效地扩大了提供的输入候选词条的范围,使得提供的输入候选词条更符合用户的输入需求,提升了用户的输入体验。进一步地,本专利技术对用户分段上屏的输入词条记录进行学习,利用输入词条记录的上下文关系,可以根据用户刚上屏的上文词条和输入历史中两个上屏词条之间的关系权值来确定预测的输入候选词条,从而提高当前输入的召回率,提高对预测的召回率。进一步地,本专利技术还可对完整输入的输入词条记录拆分成细粒度或合并粒度进行学习,即用户如果上屏一个较长的输入词条记录,本专利技术会对输入词条记录进行合理的粒度切分,取到每个合理粒度的词条粒度进行学习,这样就不会导致预测输入候选词条时预测出一个不合理长度的词条。【附图说明】通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1示出根据本专利技术一个方面的用于基于本地词库提供输入候选词条的设备示意图;图2示出根据本专利技术一个优选实施例的用于基于本地词库提供输入候选词条的设备不意图;图3示出根据本专利技术另一个方面的用于基于本地词库提供输入候选词条的方法流程图;图4示出根据本专利技术一个优选实施例的用于基于本地词库提供输入候选词条的方法流程图。附图中相同或相似的附图标记代表相同或相似的部件。【具体实施方式】下面结合附图对本专利技术作进一步详细描述。图1示出根据本专利技术一个方面的用于基于本地词库提供输入候选词条的设备示意图。用户设备I包括第一获取装置101、第一匹配装置102、第二匹配装置103、合并装置104和提供装置105。其中,该用户设备I包括但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板、或手写设备等方式进行人机交互的电子产品,例如计算机、手机、PDA、平板电脑、游戏机或IPTV等。本领域技术人员应能理解上述用户设备仅为举例,其他现有的或今后可能出现的用户设备如可适用于本专利技术,也应包含在本专利技术保护范围以内,并在此以引用方式包含于此。第一获取装置101获取用户输入的输入字符串。具体地,用户通过与用户设备I的交互,在用户设备I中输入输入字符串,第一获取装置101通过一次或多次调用该用户设备I所提供的应用程序接口(API),获取该用户输入的输入字符串。本领域技术人员应能理解上述输入及获取输入字符串的方式仅为举例,其他现有的或今后可能出现的输入或获取输入字符串的方式如可适用于本专利技术,也应包含在本专利技术保护范围以内,并在此以引用方式包含于此。第一匹配装置102根据所述输入字符串,在本地词库中进行匹配查询,获取对应的候选词条,其中,所述本地词库根据用户历史分段上屏的输入词条记录建立或更新。具体地,第一匹配装置102根据第一获取装置101所获取的输入字符串,在本地词库中进行匹配查询,获取与该输入字符串对应的候选词条,如根据该本地词库中所存储的读音与词条的映射关系,或通过遍历该本地词库中以树形结构存放的词条,匹配得到读音与该输入字符串匹配的候选词条。例如,用户通过与用户设备I的交互,输入输入字符串abcdef,其中,假设ab是al的读音,Cd是a2的读音,ef是a3的读音,则第一获取装置101通过与用户设备I的交互,获取该输入字符串abcdef ;第一匹配装置102根据该输入字符串,在本地词库中进行匹配查找,直接找到与该输入字符串读音匹配的候选词条ala2a3,;或者,第一匹配装置102分别找到与ab读音匹配的al、与cd读音匹配的a2、与ef读音匹配的a3,再将三者进行拼接,得到与该输入字符串abcdef读音匹配的候选词条ala2a3 ;或者,第一匹配装置102根据al找到al的下文词条a2,a2的读音和输入字符串abcdef中的cd匹配,则把它拼接al,组成ala2,接着,再根据a2找到a2的下文词条a3, a3的读音和输入字符串abcdef中的ef匹配,则把它拼接ala2,组成ala2a3,作为与该输入字符串匹配的候选词条。在此,该本地词库根据用户历史分段上屏的输入词条记录建立或更新,该分段上屏的输入词条记录为用户接连上屏的输入词条。例如,用户历史输入输入字符串ab,并选择了输入词条al上屏,紧接着,该用户又输入输入字符串Cd,并选择了输入词条a2上屏,则该输入词条al及a2即为分段上屏的输入词条记录,该用户设备I将该分段上屏的输入词条记录存入该本地词库中,以实现对该本地词库的建立或更新。具体建立或更新的方式将在图2对应的实施例中详细描述。本领域技术人员应能理解上述本文档来自技高网...
【技术保护点】
一种用于基于本地词库提供输入候选词条的方法,其中,该方法包括以下步骤:a获取用户输入的输入字符串;b根据所述输入字符串,在本地词库中进行匹配查询,获取对应的候选词条,其中,所述本地词库根据用户历史分段上屏的输入词条记录建立或更新;c对所述候选词条中所包括的末节子词条,在所述本地词库中进行匹配查询,确定所述末节子词条所对应的下文词条;d将所述候选词条与所述下文词条进行合并处理,以获得待提供给所述用户的输入候选词条;e将所述输入候选词条提供给所述用户。
【技术特征摘要】
1.一种用于基于本地词库提供输入候选词条的方法,其中,该方法包括以下步骤: a获取用户输入的输入字符串; b根据所述输入字符串,在本地词库中进行匹配查询,获取对应的候选词条,其中,所述本地词库根据用户历史分段上屏的输入词条记录建立或更新; c对所述候选词条中所包括的末节子词条,在所述本地词库中进行匹配查询,确定所述末节子词条所对应的下文词条; d将所述候选词条与所述下文词条进行合并处理,以获得待提供给所述用户的输入候选词条; e将所述输入候选词条提供给所述用户。2.根据权利要求1所述的方法,其中,所述本地词库以树形结构存放词条;其中,所述步骤b和步骤c中的匹配查询包括: -采用深度遍历算法,遍历所述本地词库中的所述树形结构。3.根据权利要求2所述的方法,其中,所述匹配查询包括: -根据所述树形结构的节点中所存放的词条的上下文关系,采用所述深度遍历算法,遍历所述本地词库中的所述树形结构。4.根据权利要求1至3中任一项所述的方法,其中,该方法还包括: X根据所述用户的历史输入顺序,确定所述输入候选词条的优先级; 其中,所述步骤e包括: -按照所述优先级,将所述输入候选词条提供给所述用户。5.根据泉流要求4所述的方法,其中,所述步骤X包括: -根据所述用户的历史输入顺序,并结合所述输入候选词条的词条属性,确定所述输入候选词条的优先级; 其中,所述词条属性包括以下至少任一项: -所述输入候选词条对应所述本地词库的概率属性; -所述用户历史输入所述输入候选词条的次数; -所述输入候选词条中所包括的子词条间的转移概率; -所述输入候选词条所对应的预测长度。6.根据权利要求1至5中任一项所述的方法,其中,该方法还包括: -获取所述用户历史分段上屏的输入词条记录; r根据所述历史分段上屏的输入词条记录间的上下文关系,建立或更新所述本地词库。7.根据权利要求6所述的方法,其中,该方法还包括: -对所述输入词条记录进行切词处理,以获得至少一个词条粒度; 其中,所述步骤r包括: -根据所述至少一个词条粒度间的上下文关系,建立或更新所述本地词库。8.根据权利要求7所述的方法,其中,所述步骤r包括: -判断由至少两个词条粒度合并后所获得的词条是否为高频词条,其中,所述至少两个词条粒度具有上下文关系; -若所述词条为高频词条,根据所述词条,建立或更新所述本地词库。9.一种用于基于本地词库提供输入候选词条的用户设备,其中,该设备包括:第一获取装置,用于获取用户输入的输...
【专利技术属性】
技术研发人员:何明哲,吴闯,邵玉珊,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。