一种用户词库同步方法及用户词库同步服务器技术

技术编号:8703192 阅读:220 留言:0更新日期:2013-05-15 23:18
本发明专利技术涉及一种用户词库同步方法,其包括:在至少一个存储空间内存储第一云端用户词库;所述方法还包括:步骤一:对第一云端用户词库进行过滤或者扩展操作得到中间结果;以及步骤二:将中间结果保存至一个存储空间内的一个第二云端用户词库。上述同步方法既可以满足用户词库在不同设备端上的共性需求,又可以使用户词库针对不同的设备类型或者应用环境作优化。另外,本发明专利技术还提供一种用户词库同步服务器。

【技术实现步骤摘要】
一种用户词库同步方法及用户词库同步服务器
本专利技术涉及输入法
,尤其涉及一种用户词库同步方法及一种用户词库同步服务器。
技术介绍
当前对于非字母文字(包括中文、日文、韩文等)的输入都需要经由专门的输入法软件进行输入转换。以中文为例,一般可以采用拼音方式或者字形(五笔等)编码方式进行输入。然而无论采用何种输入方式,都不可避免的会出现重码的情形。例如,采用拼音方式输入会出现同音字的情形,采用五笔输入同样会有重码。因此,如何能使输入法的首选词符合用户的预期就成为评价输入法的一个非常重要的参数。为了尽量提高首选词命中率,当前的各种中文输入法软件都会对用户输入的文字进行统计并形成用户的词库文件,词库中除了保存有用户输入的词条外,还包括各词条的使用频率统计信息。根据用户的使用频率对候选词进行排序可以最大程度的提高首选词命中率。此外,为了使用户在切换不同的设备时仍然继续使用用户词库,现有的输入法软件都会将用户词库备份至服务器。另一方面,随着计算机硬件技术及互联网的飞速发展,互联网的接入设备中,各种移动设备,如手机、平板电脑等所占的份额本文档来自技高网...

【技术保护点】
一种用户词库同步方法,其包括:在至少一个存储空间内存储第一云端用户词库;其特征在于,所述方法还包括:步骤一:对所述第一云端用户词库进行过滤或者扩展操作得到中间结果;以及步骤二:将所述中间结果保存至一个存储空间内的一个第二云端用户词库。

【技术特征摘要】
1.一种用户词库同步方法,其包括:
在至少一个存储空间内存储第一云端用户词库;
其特征在于,所述方法还包括:
步骤一:对所述第一云端用户词库进行过滤操作得到中间结果,所述第一云端用户词库和第二云端用户词库针对同一用户,所述过滤操作包括先采用语言模型过滤器进行过滤后再采用统计信息过滤器或者自定义过滤器进行过滤,所述语言模型过滤器所使用的语言模型与第二云端用户词库对应的客户端所使用的语言模型一致,其中,所述语言模型过滤器对于所述第一云端用户词库中的每一词条判断所述语言模型的输出是否正确,如果所述语言模型的输出结果是正确的,则该词条被所述语言模型过滤器过滤掉,所述判断语言模型的输出是否正确是指针对该词条,所述语言模型的输入是该词条对应的编码,判断所述语言模型输出的候选词中是否具有该词条,如果该词条出现则视为输出正确,否则,输出不正确;所述统计信息过滤器用于根据所述第一云端用户词库中各词条的统计信息进行词条过滤;以及
步骤二:将所述中间结果保存至一个存储空间内的一个所述第二云端用户词库。


2.如权利要求1所述的用户词库同步方法,其特征在于,所述第一、第二云端用户词库分别对应于同一用户使用的第一客户端与第二客户端。


3.如权利要求2所述的用户词库同步方法,其特征在于,所述第一客户端为非移动客户端,所述第二客户端为移动客户端。


4.如权利要求2所述的用户词库同步方法,其特征在于,步骤二中所述中间结果覆盖所述第二云端用户词库。


5.如权利要求1所述的用户词库同步方法,其特征在于,所述统计信息过滤器根据其他用户的云端用户词库计算得到统计信息。


6.如权利要求1所述的用户词库同步方法,其特征在于,所述步骤一与步骤二是定期重复进行的,或者是根据用户的同步请求进行的。


7.一种用户词库同步方法,其特征在于,包括:
在至少一个存储空间内存储一个第一云端用户词库;
接收来自第一客户端的第一同步信息;
根据所述第一同步信息对所述第...

【专利技术属性】
技术研发人员:肖镜辉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1