个性化词条的处理方法和装置制造方法及图纸

技术编号:33016677 阅读:14 留言:0更新日期:2022-04-15 08:48
本发明专利技术实施例提供了一种个性化词条的处理方法、装置和用于处理个性化词条的装置。其中的方法具体包括:从用户的输入内容中确定出多个用户特征词;依据所述多个用户特征词分别对应的词向量和权重参数,确定用户向量;依据所述用户向量,确定所述用户对应的个性化词条。本发明专利技术实施例可以满足用户的深层兴趣需求,且可以降低存储空间。且可以降低存储空间。且可以降低存储空间。

【技术实现步骤摘要】
个性化词条的处理方法和装置


[0001]本专利技术涉及输入
,尤其涉及一种个性化词条的处理方法和装置。

技术介绍

[0002]随着计算机技术和互联网技术的普及和发展,输入法已经成为用户进行人机交互的重要工具。一般地,评价输入法的性能时,首选词的准确率以及候选排序的准确性是两个重要的评价指标。而记载有词条信息和词频信息的输入法词库是影响这两个评价指标的重要因素。在现有的输入法系统中,系统词库覆盖了绝大部分用户使用的常用词汇。但由于不同用户的专业领域、兴趣以及语言使用习惯的不同,因此对于输入法的词条存在个性化的需求。
[0003]为了满足不同用户的个性化输入需求,输入法系统提供了细胞词库。细胞词库一般是指细分化的词库,一个细胞词库就是一个细分类别的词汇集合,细胞词库的类别可以是某个专业领域(如医学领域词库),也可以是某个地区(如北京地名词库),也可以是某个游戏(如魔兽世界词汇)等。
[0004]专利技术人在实施本专利技术实施例的过程中发现,一个细胞词库中通常包含大量的词条,这使得细胞词库占用较多的存储空间;并且,细胞词库通常基于领域专家对词汇的认知而构建,这使得细胞词库的粒度较粗、以及与用户的相关性较弱,因此无法满足用户的深层兴趣需求。

技术实现思路

[0005]本专利技术实施例提供一种个性化词条的处理方法、装置和用于输入的装置,可以满足用户的深层兴趣需求,且可以降低存储空间。
[0006]为了解决上述问题,本专利技术实施例公开了一种个性化词条的处理方法,包括:
[0007]从用户的输入内容中确定出多个用户特征词;
[0008]依据所述多个用户特征词分别对应的词向量和权重参数,确定用户向量;
[0009]依据所述用户向量,确定所述用户对应的个性化词条。
[0010]另一方面,本专利技术实施例公开了一种个性化词条的处理装置,包括:
[0011]用户特征词确定模块,用于从用户的输入内容中确定出多个用户特征词;
[0012]用户向量确定模块,用于依据所述多个用户特征词分别对应的词向量和权重参数,确定用户向量;以及
[0013]个性化词条确定模块,用于依据所述用户向量,确定所述用户对应的个性化词条。
[0014]再一方面,本专利技术实施例公开了一种用于处理个性化词条的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
[0015]从用户的输入内容中确定出多个用户特征词;
[0016]依据所述多个用户特征词分别对应的词向量和权重参数,确定用户向量;
[0017]依据所述用户向量,确定所述用户对应的个性化词条。
[0018]又一方面,本专利技术实施例公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的个性化词条的处理方法。
[0019]本专利技术实施例包括以下优点:
[0020]本专利技术实施例从用户的角度出发,进行个性化词条的确定,可以提高个性推荐词与用户之间的相关性。
[0021]并且,本专利技术实施例依据多个用户特征词对应的多个词向量的组合,来表示用户向量,使得用户向量能够表征出用户更多的更潜在的信息。因此,本专利技术实施例能够依据用户向量挖掘出用户更多的深层兴趣爱好、专业领域等深层兴趣需求对应的词条,进而能够满足用户的深层兴趣需求。
[0022]例如,用户A的用户特征词包括“迪卡侬”、“冲锋衣”、“滑雪”等,本专利技术实施例可以依据多个用户特征词对应的多个词向量的组合,挖掘出“滑雪设备”对应的深层兴趣需求,并可以提供该深层兴趣需求对应的个性化词条,如“多威”、“冲锋裤”、“雪杖”、“护臀”、“护目镜”等。
[0023]另外,本专利技术实施例实施例基于用户特征词对应的词粒度,提供对应的个性化词条。上述个性化词条的数量通常小于细胞词库包含词条的数量,因此能够降低存储空间。
附图说明
[0024]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0025]图1是本专利技术实施例的一种个性化词条的处理方法的应用环境的示意;
[0026]图2是本专利技术的一种个性化词条的处理方法实施例的步骤流程图;
[0027]图3是本专利技术的一种个性化词条的处理装置实施例的结构框图;
[0028]图4是本专利技术的一种用于处理个性化词条的装置800的框图;及
[0029]图5是本专利技术的一些实施例中服务端的结构示意图。
具体实施方式
[0030]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0031]针对传统技术中细胞词库占用较多的存储空间、且无法满足用户的深层兴趣需求的技术问题,本专利技术实施例提供了一种个性化词条的处理方案,该方案可以从用户的输入内容中确定出多个用户特征词;依据上述多个用户特征词分别对应的词向量和权重参数,确定用户向量;依据上述用户向量,确定上述用户对应的个性化词条。
[0032]本专利技术实施例中,上屏指将预览窗口中的内容输出显示到应用程序窗口的操作。
具体到输入法,上屏可以指将候选窗口中的候选输出显示到应用程序窗口的操作。上屏对应的候选可以称为输入内容。本专利技术实施例的输入内容可以包括:一次或多次的上屏内容。上述输入内容可以对应字词、短语、句子等语言单位。
[0033]特征词可以表征具有专属特性的词。本专利技术实施例依据输入内容中的用户特征词,表征用户特征及用户输入需求。
[0034]本专利技术实施例从用户的角度出发,进行个性化词条的确定,可以提高个性推荐词与用户之间的相关性。
[0035]并且,本专利技术实施例依据多个用户特征词对应的多个词向量的组合,来表示用户向量,使得用户向量能够表征出用户更多的更潜在的信息。因此,本专利技术实施例能够依据用户向量挖掘出用户更多的深层兴趣爱好、专业领域等深层兴趣需求对应的词条,进而能够满足用户的深层兴趣需求。
[0036]例如,用户A的用户特征词包括“迪卡侬”、“冲锋衣”、“滑雪”等,本专利技术实施例可以依据多个用户特征词对应的多个词向量的组合,挖掘出“滑雪设备”对应的深层兴趣需求,并可以提供该深层兴趣需求对应的个性化词条,如“多威”、“冲锋裤”、“雪杖”、“护臀”、“护目镜”等。
[0037]另外,本专利技术实施例实施例基于用户特征词对应的词粒度,提供对应的个性化词条。上述个性化词条的数量通常小于细胞词库包含词条的数量,因此能够降本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种个性化词条的处理方法,其特征在于,所述方法包括:从用户的输入内容中确定出多个用户特征词;依据所述多个用户特征词分别对应的词向量和权重参数,确定用户向量;依据所述用户向量,确定所述用户对应的个性化词条。2.根据权利要求1所述的方法,其特征在于,所述从用户的输入内容中确定出多个用户特征词,包括:对用户的输入内容与特征词集合进行匹配,以得到所述输入内容中包含的多个用户特征词。3.根据权利要求2所述的方法,其特征在于,所述特征词集合包括领域词条、自造词条和云词条中的至少一种。4.根据权利要求1至3中任一所述的方法,其特征在于,所述确定用户向量,包括:依据所述多个用户特征词分别对应的权重参数,对所述多个用户特征词分别对应的词向量进行融合,以得到用户向量。5.根据权利要求1至3中任一所述的方法,其特征在于,通过如下步骤确定所述权重参数:确定用户特征词在第一时间范围内的输入语料中的频率参数;确定用户特征词在第二时间范围内的输入语料中的区分参数;所述第二时间范围大于所述第一时间范围;依据所述频率参数和所述区分参数,确定所述权重参数。6.根据权利要求1至3中任一所述的方法,其特征在于,所述确定所述用户对应的个性化词条,包括:依据向量检索方法,确定与用户向量相匹配的目标词向量;...

【专利技术属性】
技术研发人员:李鑫
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1