用户词库管理方法及装置、输入方法及装置制造方法及图纸

技术编号:24034748 阅读:73 留言:0更新日期:2020-05-07 01:35
本发明专利技术公开了一种用户词库管理方法及装置,还公开了一种输入方法及装置。所述输入方法包括:获取与用户的输入信息相匹配的候选词;确定所述候选词是否为用户词库中的用户词;所述用户词库包括:用户词及其属性信息、环境类别;如果是,则获取所述用户词的环境类别;如果所述用户词的环境类别为普通环境,则根据所述用户词的属性信息调整所述用户词的排序权重;如果所述用户词的环境类别为特定环境,则确定所述候选词的当前环境类别;如果所述当前环境类别与所述用户词的环境类别相同,则根据所述用户词的属性信息调整所述用户词的排序权重。利用本发明专利技术,可以提高输入法的智能性,使输出的候选词更准确,提升用户输入体验。

User lexicon management method and device, input method and device

【技术实现步骤摘要】
用户词库管理方法及装置、输入方法及装置
本专利技术涉及信息处理领域,具体涉及一种用户词库管理方法及装置、以及一种输入方法及装置。
技术介绍
输入法是一种将各种符号输入计算机或其他设备的编码方法,是人类和计算机打交道不可或缺的工具。对于输入法系统,通常都会设置通用词库及用户词库。用户词库是指根据用户的历史输入数据生成的用户个性化词库,其主要用于记录用户上屏的词,在输入法展现候选词时,优先展现用户词库里有的词。用户词库给用户输入带来方便,但在有些情况下却会对用户输入产生干扰,比如,有些词近期用户使用频次很多,根据现有的排序词频确定方式,这些词在用户输入时,总会排在靠前的位置,但有些输入场景下,如果用户想输入的其他词恰好与这些词的编码(如拼音、五笔等)相同,则这些词会排在比较靠前的位置,给用户输入带来干扰,用户可以需要进行翻页等操作才能够找到其想输入的候选项,输入的成本较高,影响用户体验。
技术实现思路
本专利技术实施例一方面提供一种用户词库管理方法及装置,以使用户词库中的信息更好地适应不同的输入环境。本专利技术实施例另一方面提供一种输入方法及装置,以提高输入法的智能性,使输出的候选词更准确,提升用户输入体验。为此,本专利技术提供如下技术方案:一种用户词库管理方法,所述方法包括:根据用户历史输入信息获取用户词及其属性信息;确定所述用户词的环境类别,所述环境类别包括:特定环境、普通环境;将所述用户词及其属性信息、环境类别添加到用户词库中。可选地,所述历史输入信息包括:用户词的词频信息、时间信息、环境信息;所述环境信息包括:语言环境、和/或应用环境;所述确定所述用户词的环境类别包括:对所述用户历史输入信息进行统计或聚类,得到所述用户词的环境类别。可选地,所述特定环境包括以下任意一种或多种:固定上文环境、固定应用环境;所述方法还包括按照以下方式确定所述用户词的特定环境:统计所述用户词的使用频次以及所述用户词与特定上文的二元共现次数N,如果所述共现次数N与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定上下文环境;统计所述用户词的使用频次以及在特定应用环境下所述用户词的共现次数M,如果所述共现次数M与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定应用环境。可选地,所述属性信息包括:词频信息、时间信息。一种输入方法,所述方法包括:获取与用户的输入信息相匹配的候选词;确定所述候选词是否为用户词库中的用户词;所述用户词库包括:用户词及其属性信息、环境类别,所述环境类别包括:特定环境、普通环境;如果是,则获取所述用户词的环境类别;如果所述用户词的环境类别为普通环境,则根据所述用户词的属性信息调整所述用户词的排序权重;如果所述用户词的环境类别为特定环境,并且所述候选词的环境类别与所述用户词的环境类别相同,则根据所述用户词的属性信息调整所述用户词的排序权重。可选地,所述方法还包括:根据所述用户的历史输入信息建立所述用户词库,所述历史输入信息包括:用户词的词频信息、时间信息、环境信息;所述环境信息包括:语言环境、和/或应用环境。可选地,所述特定环境包括以下任意一种或多种:固定上文环境、固定应用环境;所述方法还包括按照以下方式确定所述用户词的特定环境:统计所述用户词的使用频次以及所述用户词与特定上文的二元共现次数N,如果所述共现次数N与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定上下文环境;统计所述用户词的使用频次以及在特定应用环境下所述用户词的共现次数M,如果所述共现次数M与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定应用环境。可选地,所述方法还包括:根据所述用户词的排序权重及其通用词频信息对所述候选词进行排序,所述用户词的通用词频信息是指所述用户词在通用词库中的词频信息;根据排序结果输出所述候选词。可选地,所述方法还包括:如果所述候选词为用户词并且所述用户词的环境类别为特定环境,则生成符合所述特定环境的联想候选词;输出所述联想候选词。一种用户词库管理装置,所述装置包括:记录模块,用于记录用户历史输入信息;用户词获取模块,用于根据所述用户历史输入信息获取用户词及其属性信息;环境类别确定模块,用于确定所述用户词的环境类别,所述环境类别包括:特定环境、普通环境;词库维护模块,用于将所述用户词及其属性信息、环境类别添加到用户词库中。可选地,所述历史输入信息包括:用户词的词频信息、时间信息、环境信息;所述环境信息包括:语言环境、和/或应用环境;所述环境类别确定模块,具体用于对所述用户历史输入信息进行统计或聚类,得到所述用户词的环境类别。可选地,所述特定环境包括以下任意一种或多种:固定上文环境、固定应用环境;所述环境类别确定模块按照以下方式确定所述用户词的特定环境:统计所述用户词的使用频次以及所述用户词与特定上文的二元共现次数N,如果所述共现次数N与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定上下文环境;统计所述用户词的使用频次以及在特定应用环境下所述用户词的共现次数M,如果所述共现次数M与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定应用环境。可选地,所述属性信息包括:词频信息、时间信息。可选地,所述词库维护模块,还用于对所述用户词库进行实时更新或间隔一定时间更新。一种输入装置,所述装置包括:候选词获取模块、第一判断模块、环境信息获取模块、权重调整模块、环境确定模块、第二判断模块;所述候选词获取模块,用于获取与用户的输入信息相匹配的候选词;所述第一判断模块,用于确定所述候选词是否为用户词库中的用户词;所述用户词库包括:用户词及其属性信息、环境类别,所述环境类别包括:特定环境、普通环境;所述环境信息获取模块,用于获取所述用户词的环境类别;所述权重调整模块,用于在所述用户词的环境类别为普通环境时,根据所述用户词的属性信息调整所述用户词的排序权重;所述环境确定模块,用于在所述用户词的环境类别为特定环境时,确定所述候选词的环境类别;所述第二判断模块,用于确定所述候选词的环境类别与所述用户词的环境类别是否相同,并在相同时触发所述权重调整模块根据所述用户词的属性信息调整所述用户词的排序权重。可选地,所述装置还包括:用户词库管理模块,用于根据所述用户的历史输入信息建立所述用户词库,所述历史输入信息包括:用户词的词频信息、时间信息、环境信息;所述环境信息包括:语言环境、和/或应用环境。可选地,所述词库管理模块,还用于对所述用户词库进行实时更新或间隔一定时间更新。可选地,所述特定环境包括以下任意一种或多种本文档来自技高网...

【技术保护点】
1.一种用户词库管理方法,其特征在于,所述方法包括:/n根据用户历史输入信息获取用户词及其属性信息;/n确定所述用户词的环境类别,所述环境类别包括:特定环境、普通环境;/n将所述用户词及其属性信息、环境类别添加到用户词库中。/n

【技术特征摘要】
1.一种用户词库管理方法,其特征在于,所述方法包括:
根据用户历史输入信息获取用户词及其属性信息;
确定所述用户词的环境类别,所述环境类别包括:特定环境、普通环境;
将所述用户词及其属性信息、环境类别添加到用户词库中。


2.根据权利要求1所述的方法,其特征在于,所述历史输入信息包括:用户词的词频信息、时间信息、环境信息;所述环境信息包括:语言环境、和/或应用环境;
所述确定所述用户词的环境类别包括:
对所述用户历史输入信息进行统计或聚类,得到所述用户词的环境类别。


3.根据权利要求2所述的方法,其特征在于,所述特定环境包括以下任意一种或多种:固定上文环境、固定应用环境;
所述方法还包括按照以下方式确定所述用户词的特定环境:
统计所述用户词的使用频次以及所述用户词与特定上文的二元共现次数N,如果所述共现次数N与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定上下文环境;
统计所述用户词的使用频次以及在特定应用环境下所述用户词的共现次数M,如果所述共现次数M与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定应用环境。


4.一种输入方法,其特征在于,所述方法包括:
获取与用户的输入信息相匹配的候选词;
确定所述候选词是否为用户词库中的用户词;所述用户词库包括:用户词及其属性信息、环境类别,所述环境类别包括:特定环境、普通环境;
如果是,则获取所述用户词的环境类别;
如果所述用户词的环境类别为普通环境,则根据所述用户词的属性信息调整所述用户词的排序权重;
如果所述用户词的环境类别为特定环境,并且所述候选词的环境类别与所述用户词的环境类别相同,则根据所述用户词的属性信息调整所述用户词的排序权重。


5.根据权利要求4所述的输入方法,其特征在于,所述方法还包括:
根据所述用户的历史输入信息建立所述用户词库,所述历史输入信息包括:用户词的词频信息、时间信息、环境信息;所述环境信息包括:语言环境、和/或应用环境。


6.根据权利要求4所述的输入方法,其特征在于,所述特定环境包括以下任意一种或多种:固定...

【专利技术属性】
技术研发人员:费腾崔欣张扬
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1