一种细胞词库推送方法及装置制造方法及图纸

技术编号:16885851 阅读:56 留言:0更新日期:2017-12-27 03:39
本发明专利技术实施例提供一种细胞词库推送方法和装置,所述方法包括:获取用户输入词的集合,确定与所述用户输入词对应的候选细胞词库的集合;计算用户输入词属于各所述候选细胞词库的概率值;判断所述概率值是否大于第一阈值;所述第一阈值与用户使用细胞词库的行为数据相关联;将大于第一阈值的概率值所对应的细胞词库作为推送细胞词库,向用户发送针对所述推送细胞词库的推送请求。本发明专利技术可以提高推送细胞词库的准确率,降低用户的输入成本,提高用户输入效率。

A cell word library push method and device

The embodiment of the invention provides a cell thesaurus pushing method and device, the method comprises: acquiring user input word set, determine the set of candidate cell thesaurus corresponding to the user input word; calculating the probability of user input word belongs to each of the candidate cell thesaurus value; judging whether the probability value is greater than the first threshold; associated behavior data of the first threshold and the user cell thesaurus; probability will be greater than the first threshold value corresponding to the cell thesaurus as push cell thesaurus, sent to the user for the push to send request to send cell thesaurus. The invention can improve the accuracy of the push cell word library, reduce the input cost of the user and improve the input efficiency of the user.

【技术实现步骤摘要】
一种细胞词库推送方法及装置
本专利技术实施例涉及计算机
,具体涉及一种细胞词库推送方法及装置。
技术介绍
随着计算机技术和互联网技术的普及和发展,输入法已经成为用户进行人机交互的重要工具。一般地,评价输入法的性能时,首选词的准确率以及候选项排序的准确性是两个重要的评价指标。而记载有词条信息和词频信息的输入法词库是影响这两个评价指标的重要因素。在现有的输入法系统中,系统基本词库覆盖了绝大部分用户使用的常用词汇。但由于不同用户的专业领域、兴趣以及语言使用习惯的不同,因此对于输入法的候选词条存在个性化的需求。为了满足不同用户的个性化输入需求,输入法系统提供了细胞词库。细胞词库一般是指细分化的词库,一个细胞词库就是一个细分类别的词汇集合,细胞词库的类别可以是某个专业领域(如医学领域词库),也可以是某个地区(如北京地名词库),也可以是某个游戏(如魔兽世界词汇)等。现有技术中,用户需要手动选择下载符合自己需求的细胞词库,操作较为繁琐。此外,用户选择的细胞词库不一定是完全满足用户使用需求的词库,由此带来输入的不便,增加了用户输入的成本。
技术实现思路
本专利技术实施例提供了一种细胞词库推送方法及本文档来自技高网...
一种细胞词库推送方法及装置

【技术保护点】
一种细胞词库推送方法,其特征在于,包括:获取用户输入词的集合,确定与所述用户输入词对应的候选细胞词库的集合;计算用户输入词属于各所述候选细胞词库的概率值;判断所述概率值是否大于第一阈值;所述第一阈值与用户使用细胞词库的行为数据相关联;将大于所述第一阈值的概率值所对应的候选细胞词库作为推送细胞词库,向用户发送针对所述推送细胞词库的推送请求。

【技术特征摘要】
1.一种细胞词库推送方法,其特征在于,包括:获取用户输入词的集合,确定与所述用户输入词对应的候选细胞词库的集合;计算用户输入词属于各所述候选细胞词库的概率值;判断所述概率值是否大于第一阈值;所述第一阈值与用户使用细胞词库的行为数据相关联;将大于所述第一阈值的概率值所对应的候选细胞词库作为推送细胞词库,向用户发送针对所述推送细胞词库的推送请求。2.根据权利要求1所述的方法,其特征在于,所述确定与所述用户输入词对应的候选细胞词库的集合包括:利用预先建立的索引查询与所述用户输入词对应的细胞词库作为候选细胞词库;其中,所述索引记录了所述用户输入词与一个或者多个细胞词库的对应关系。3.根据权利要求1所述的方法,其特征在于,所述计算用户输入词属于各所述候选细胞词库的概率值包括:获得所述候选细胞词库包含的用户输入词的数量与所述候选细胞词库包含的词语的总数之间的比值,将所述比值作为所述用户输入词属于所述候选细胞词库的概率值。4.根据权利要求1所述的方法,其特征在于,所述计算用户输入词属于所述候选细胞词库的概率值包括:计算所述候选细胞词库包含的各用户输入词的权重之和,获得第一和值;计算所述候选细胞词库包含的各词语的权重之和,获得第二和值;将所述第一和值与所述第二和值的比值作为所述用户输入词属于所述候选细胞词库的概率值;其中,所述权重与所述词语对应的细胞词库的数量相关联。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据用户使用细胞词库的行为数据,调整所述第一阈值的大小。6.根据权利要求5所述的方法,其特征在于,所述根据用户使用细胞词库的行为数据,调整所述第一阈值的大小包括:在将候选细胞词库作为推送细胞词库之前,获取所述候选细胞词库被用户接受的概率值;所述候选细胞词库被用户接受的概率值与所述细胞词库被推荐的次数以及被用户接受的次数相关联;若所述候选细胞词库被用户接受的概率值小于第二阈值时,调整所述第一阈值,使之大于调整前的数值;所述判断所述概率值是否大于第一阈...

【专利技术属性】
技术研发人员:费腾
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1