【技术实现步骤摘要】
个性化词条的处理方法和装置
[0001]本专利技术涉及输入
,尤其涉及一种个性化词条的处理方法和装置。
技术介绍
[0002]随着计算机技术和互联网技术的普及和发展,输入法已经成为用户进行人机交互的重要工具。一般地,评价输入法的性能时,首选词的准确率以及候选排序的准确性是两个重要的评价指标。而记载有词条信息和词频信息的输入法词库是影响这两个评价指标的重要因素。在现有的输入法系统中,系统词库覆盖了绝大部分用户使用的常用词汇。但由于不同用户的专业领域、兴趣以及语言使用习惯的不同,因此对于输入法的词条存在个性化的需求。
[0003]为了满足不同用户的个性化输入需求,输入法系统提供了细胞词库。细胞词库一般是指细分化的词库,一个细胞词库就是一个细分类别的词汇集合,细胞词库的类别可以是某个专业领域(如医学领域词库),也可以是某个地区(如北京地名词库),也可以是某个游戏(如魔兽世界词汇)等。
[0004]专利技术人在实施本专利技术实施例的过程中发现,一个细胞词库中通常包含大量的词条,这使得细胞词库占用较多的存储空间; ...
【技术保护点】
【技术特征摘要】
1.一种个性化词条的处理方法,其特征在于,所述方法包括:从用户的已输入内容中确定出用户特征词;依据向量关系,确定所述用户特征词对应的相关词条;依据所述相关词条,确定所述用户对应的个性化词条。2.根据权利要求1所述的方法,其特征在于,所述从用户的已输入内容中确定出用户特征词,包括:对用户的已输入内容与特征词集合进行匹配,以得到所述已输入内容中包含的用户特征词。3.根据权利要求2所述的方法,其特征在于,所述特征词集合包括领域词条、自造词条和云词条中的至少一种。4.根据权利要求1至3中任一所述的方法,其特征在于,所述确定所述用户特征词对应的相关词条,包括:确定所述用户特征词对应的第一词向量;依据向量检索方法,确定与所述第一词向量相匹配的第二词向量,所述第二词向量对应的词条作为相关词条。5.根据权利要求1至3中任一所述的方法,其特征在于,所述确定所述用户对应的个性化词条,包括:依据所述用户特征词与所述相关词条之间的匹配度、和/或、所述用户特征词对应的权重参数,对所述相关词条进行排序,并依据排序结果,从所述相关词条中确定出个性化词条。6.根据权利要求5所述的方法,其特征在于,通过如下步骤确定所述权重参数:确定用户特征词在第一时间范围内的输入语料中的频率参数;确定用户特征词在第二时间范围内的输入语料中的区分参数;所述第二时间范围大于所述第一时间范围;依据所述频率参数和所述区分参数,确定所述权重参数。7.根据权利要求1至3中任一所述的方法,其特征在于,所述确定所述用户对应的个性化...
【专利技术属性】
技术研发人员:李鑫,
申请(专利权)人:北京搜狗科技发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。