个性化词条的处理方法和装置制造方法及图纸

技术编号:33016680 阅读:13 留言:0更新日期:2022-04-15 08:48
本发明专利技术实施例提供了一种个性化词条的处理方法、装置和用于处理个性化词条的装置,其中的方法具体包括:从用户的已输入内容中确定出用户特征词;依据向量关系,确定所述用户特征词对应的相关词条;依据所述相关词条,确定所述用户对应的个性化词条。本发明专利技术实施例可以满足用户的精细输入需求,且能够降低存储空间。间。间。

【技术实现步骤摘要】
个性化词条的处理方法和装置


[0001]本专利技术涉及输入
,尤其涉及一种个性化词条的处理方法和装置。

技术介绍

[0002]随着计算机技术和互联网技术的普及和发展,输入法已经成为用户进行人机交互的重要工具。一般地,评价输入法的性能时,首选词的准确率以及候选排序的准确性是两个重要的评价指标。而记载有词条信息和词频信息的输入法词库是影响这两个评价指标的重要因素。在现有的输入法系统中,系统词库覆盖了绝大部分用户使用的常用词汇。但由于不同用户的专业领域、兴趣以及语言使用习惯的不同,因此对于输入法的词条存在个性化的需求。
[0003]为了满足不同用户的个性化输入需求,输入法系统提供了细胞词库。细胞词库一般是指细分化的词库,一个细胞词库就是一个细分类别的词汇集合,细胞词库的类别可以是某个专业领域(如医学领域词库),也可以是某个地区(如北京地名词库),也可以是某个游戏(如魔兽世界词汇)等。
[0004]专利技术人在实施本专利技术实施例的过程中发现,一个细胞词库中通常包含大量的词条,这使得细胞词库占用较多的存储空间;并且,细胞词库通常基于领域专家对词汇的认知而构建,这使得细胞词库的粒度较粗,进而导致无法满足用户的精细输入需求。

技术实现思路

[0005]本专利技术实施例提供一种个性化词条的处理方法、装置和用于输入的装置,可以满足用户的精细输入需求,且能够降低存储空间。
[0006]为了解决上述问题,本专利技术实施例公开了一种个性化词条的处理方法,包括:
[0007]从用户的已输入内容中确定出用户特征词;
[0008]依据向量关系,确定所述用户特征词对应的相关词条;
[0009]依据所述相关词条,确定所述用户对应的个性化词条。
[0010]另一方面,本专利技术实施例公开了一种个性化词条的处理装置,包括:
[0011]用户特征词确定模块,用于从用户的已输入内容中确定出用户特征词;
[0012]相关词条确定模块,用于依据向量关系,确定所述用户特征词对应的相关词条;以及
[0013]个性化词条确定模块,用于依据所述相关词条,确定所述用户对应的个性化词条。
[0014]再一方面,本专利技术实施例公开了一种用于处理个性化词条的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
[0015]从用户的已输入内容中确定出用户特征词;
[0016]依据向量关系,确定所述用户特征词对应的相关词条;
[0017]依据所述相关词条,确定所述用户对应的个性化词条。
[0018]又一方面,本专利技术实施例公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的个性化词条的处理方法。
[0019]本专利技术实施例包括以下优点:
[0020]本专利技术实施例利用以词推词的构思,依据向量关系,确定用户特征词对应的相关词条,并依据所述相关词条,确定所述用户对应的个性化词条。由于用户特征词表征用户特征及用户输入需求,故本专利技术实施例可以基于用户特征词对应的词粒度,进行个性化词条的推荐,因此得到的个性化词条能够满足用户的精细输入需求。
[0021]并且,本专利技术实施例实施例基于用户特征词对应的词粒度,提供对应的个性化词条。上述个性化词条的数量通常小于细胞词库包含词条的数量,因此能够降低存储空间。
附图说明
[0022]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0023]图1是本专利技术实施例的一种个性化词条的处理方法的应用环境的示意;
[0024]图2是本专利技术的一种个性化词条的处理方法实施例一的步骤流程图;
[0025]图3是本专利技术的一种个性化词条的处理方法实施例二的步骤流程图;
[0026]图4是本专利技术的一种个性化词条的处理装置实施例的结构框图;
[0027]图5是本专利技术的一种用于处理个性化词条的装置800的框图;及
[0028]图6是本专利技术的一些实施例中服务端的结构示意图。
具体实施方式
[0029]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0030]针对传统技术中细胞词库占用较多的存储空间、以及无法满足用户的精细输入需求的技术问题,本专利技术实施例提供了一种个性化词条的处理方案,该方案可以从用户的已输入内容中确定出用户特征词;依据向量关系,确定所述用户特征词对应的相关词条;依据所述相关词条,确定所述用户对应的个性化词条。
[0031]本专利技术实施例中,上屏指将预览窗口中的内容输出显示到应用程序窗口的操作。具体到输入法,上屏可以指将候选窗口中的候选输出显示到应用程序窗口的操作。上屏对应的候选可以称为已输入内容。本专利技术实施例的已输入内容可以包括:一次或多次的上屏内容。上述已输入内容可以对应字词、短语、句子等语言单位。
[0032]特征词可以表征具有专属特性的词。本专利技术实施例依据已输入内容中的用户特征词,表征用户特征及用户输入需求。
[0033]本专利技术实施例依据向量关系,确定用户特征词对应的相关词条,并依据所述相关
词条,确定所述用户对应的个性化词条。由于用户特征词表征用户特征及用户输入需求,故本专利技术实施例可以基于用户特征词对应的词粒度,进行个性化词条的推荐,因此得到的个性化词条能够满足用户的精细输入需求。
[0034]并且,本专利技术实施例实施例基于用户特征词对应的词粒度,提供对应的个性化词条。上述个性化词条的数量通常小于细胞词库包含词条的数量,因此能够降低存储空间。
[0035]本专利技术实施例提供的个性化词条的处理方法可应用于图1所示的应用环境中,如图1所示,客户端100与服务端200位于有线或无线网络中,通过该有线或无线网络,客户端100与服务端200进行数据交互。
[0036]可选地,客户端100可以运行在终端上,上述终端具体包括但不限于:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,Moving Picture Experts Group Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4,Moving Picture Experts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。客户端100可以对应于网站、或者APP(应用程序本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种个性化词条的处理方法,其特征在于,所述方法包括:从用户的已输入内容中确定出用户特征词;依据向量关系,确定所述用户特征词对应的相关词条;依据所述相关词条,确定所述用户对应的个性化词条。2.根据权利要求1所述的方法,其特征在于,所述从用户的已输入内容中确定出用户特征词,包括:对用户的已输入内容与特征词集合进行匹配,以得到所述已输入内容中包含的用户特征词。3.根据权利要求2所述的方法,其特征在于,所述特征词集合包括领域词条、自造词条和云词条中的至少一种。4.根据权利要求1至3中任一所述的方法,其特征在于,所述确定所述用户特征词对应的相关词条,包括:确定所述用户特征词对应的第一词向量;依据向量检索方法,确定与所述第一词向量相匹配的第二词向量,所述第二词向量对应的词条作为相关词条。5.根据权利要求1至3中任一所述的方法,其特征在于,所述确定所述用户对应的个性化词条,包括:依据所述用户特征词与所述相关词条之间的匹配度、和/或、所述用户特征词对应的权重参数,对所述相关词条进行排序,并依据排序结果,从所述相关词条中确定出个性化词条。6.根据权利要求5所述的方法,其特征在于,通过如下步骤确定所述权重参数:确定用户特征词在第一时间范围内的输入语料中的频率参数;确定用户特征词在第二时间范围内的输入语料中的区分参数;所述第二时间范围大于所述第一时间范围;依据所述频率参数和所述区分参数,确定所述权重参数。7.根据权利要求1至3中任一所述的方法,其特征在于,所述确定所述用户对应的个性化...

【专利技术属性】
技术研发人员:李鑫
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1