【技术实现步骤摘要】
本专利技术涉及输入法
,尤其涉及一种用于确定地域词库的技术。
技术介绍
在输入法领域中,当用户输入了输入字符串之后,输入法会依据不同的词库来检索与该输入字符串相对应的输入候选项;而由于语言存在地域性,因此,不同地域的人,其常用的输入候选项也有所不同。而在当前输入法的使用过程中,无论是在北京、河北、河南等全国任何地方,所提供的输入候选项都是相同的;即使输入法提供不同的地域词库,所提供的地域词库也十分臃肿,难以符合用户对系统资源占用以及精确输入的需求。
技术实现思路
本专利技术的目的是提供一种用于确定地域词库的方法与装置。根据本专利技术的一个方面,提供了一种用于确定地域词库的方法,其中,该方法包括以下步骤:a获取多个用户的历史输入信息,其中,所述历史输入信息对应于所述用户的地域信息;b根据所述历史输入信息以及所述历史输入信息所对应的所述地域信息,确定一个或多个候选地域词库,其中,每个候选地域词库对应于一个地域信息;c根据所述历史输入信息,确定与全部所述地域信息相对应的一个或多个通用词条;d从所述候选地域词库中筛除所述通用词条,以确定一个或多个地域词库。可选地,所述步骤a包括:-获取多个用户的多个历史输入信息;-根据所述多个用户的每个历史输入信息的输入场景信息,确定与所述历史输入信息相对应的地域信息。可选地,所述输入场景信息包括以下至少任一项:-所述历史输入信息所对应的输入地点;-所述历史输入信息所对应的输入时间;-所述历史输入信息所对应的上下文信息;-所述历史输入信息所对应的交互对象信息。可选地,该方法还包括:x分别确定与多个用户相对应的地域信息;其中,所 ...
【技术保护点】
一种用于确定地域词库的方法,其中,该方法包括以下步骤:a获取多个用户的历史输入信息,其中,所述历史输入信息对应于所述用户的地域信息;b根据所述历史输入信息以及所述历史输入信息所对应的所述地域信息,确定一个或多个候选地域词库,其中,每个候选地域词库对应于一个地域信息;c根据所述历史输入信息,确定与全部所述地域信息相对应的一个或多个通用词条;d从所述候选地域词库中筛除所述通用词条,以确定一个或多个地域词库。
【技术特征摘要】
1.一种用于确定地域词库的方法,其中,该方法包括以下步骤:a获取多个用户的历史输入信息,其中,所述历史输入信息对应于所述用户的地域信息;b根据所述历史输入信息以及所述历史输入信息所对应的所述地域信息,确定一个或多个候选地域词库,其中,每个候选地域词库对应于一个地域信息;c根据所述历史输入信息,确定与全部所述地域信息相对应的一个或多个通用词条;d从所述候选地域词库中筛除所述通用词条,以确定一个或多个地域词库。2.根据权利要求1所述的方法,其中,所述步骤a包括:-获取多个用户的多个历史输入信息;-根据所述多个用户的每个历史输入信息的输入场景信息,确定与所述历史输入信息相对应的地域信息。3.根据权利要求2所述的方法,其中,所述输入场景信息包括以下至少任一项:-所述历史输入信息所对应的输入地点;-所述历史输入信息所对应的输入时间;-所述历史输入信息所对应的上下文信息;-所述历史输入信息所对应的交互对象信息。4.根据权利要求1所述的方法,其中,该方法还包括:x分别确定与多个用户相对应的地域信息;其中,所述步骤a包括:-当所述用户输入一条或多条输入信息时,将所述输入信息作为历史输入信息,并将所确定的地域信息作为所述历史输入信息所对应的地域信息。5.根据权利要求4所述的方法,其中,所述步骤x包括:-分别确定与多个用户相对应的候选地域信息;-当所述用户在所述候选地域信息的时间超过预定时间阈值时,将所述候选地域信息作为与所述用户相对应的地域信息。6.根据权利要求1至5中任一项所述的方法,其中,所述步骤b包括:-根据所述历史输入信息以及所述历史输入信息所对应的所述地域信息,将所述历史输入信息中超过预定频率的词条确定为候选词条信息,其中,所述预定频率与所述地域信息相对应;-根据所述候选词条信息,确定一个或多个候选地域词库,其中,每个候选地域词库对应于一个地域信息。7.根据权利要求1至6中任一项所述的方法,其中,所述步骤c包括:-若所述历史输入信息中的一个或多个词条包含在超过预定数目的候选地域词库中,则将所述词条确定为与全部所述地域信息相对应的一个或多个通用词条。8.根据权利要求7所述的方法,其中,所述步骤c包括:-若所述历史输入信息中的一个或多个词条包含在超过预定数目的多个候选地域词库中,且所述多个候选地域词库所对应的地域信息间的关联关系小于一定阈值,则将所述词条确定为与全部所述地域信息相对应的一个或多个通用词条。9.根据权利要求8所述的方法,其中,该方法还包括:-根据各个地域信息所对应的地理位置和/或人文信息,确定所述地域信息间的关联关系。10.根据权利要求1至9中任一项所述的方法,其中,该方法还包括:-根据所述一个或多个通用词条,确定或更新通用词库,其中,所述通用词库中包含所述一个或多个通用词条。11.一种用于确定地域词库的确定装置,其中,所述确定装置包括:获取装置,用于获取多个用户的历史输入信息,其中,所述历史输入信息对应于所述用户的地域信息...
【专利技术属性】
技术研发人员:崔红伟,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。