确定需要加载的辅助词库的方法、装置及输入法系统制造方法及图纸

技术编号:4178103 阅读:265 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种确定需要加载的辅助词库的方法,该方法包括:采集用户的输入信息;分析采集到的信息,记录所述信息中能够表征用户兴趣的特征;根据所记录的特征确定需要加载的辅助词库。本发明专利技术还公开了一种确定需要加载的辅助词库的装置及输入法系统。通过本发明专利技术实施例,提高了判断用户兴趣的准确度,为确定需要加载的辅助词库提供了可靠的依据。

【技术实现步骤摘要】

本专利技术涉及输入法领域,特别是涉及确定需要加载的辅助词库的方法、装 置及输入法系统。
技术介绍
随着计算机技术的发展,输入法作为人机交互的重要手段受到了越来越高 的关注。用户对输入准确性和输入速度的要求,推动了输入法向着智能化、人 性化、个性化的方向发展。当前的输入法系统(包括中文、日文、韩文等)都是基于其词库系统为使 用者在输入过程中提供候选词的。为提升用户输入的流畅度,输入法软件的一 个发展方向是扩充收录的词条数量,尽可能减少逐字选词的次数,提高首选词 的准确率。因此,输入法系统除了基本词库外,还可以具有辅助词库,即通常 所说的细胞词库。其中,基本词库中的词条是大多数输入法用户接受并广为使 用的,具有一定的通用性。辅助词库中的词条具有专业化、个性化的特点,例 如化工词库、理财词库、欧美电影词库等等,这种词库针对不同专业领域、不 同兴趣的用户对于输入法智能化的要求而设计。充分、合理地利用这些词库可 以有助于提高用户输入准确性及输入速度。但是词库规模不能一味追求大而全,否则会带来重码冲突、性能下降、软 件规模变大等不利影响。同时用户的专业领域和兴趣也是多种多样的,统一到 一个大而全的词库并不现实。一种处理方案是才艮据每个用户在特定领域的具体 需要,加载相关的辅助词库,其中,如何判断用户需要加载哪些辅助词库成为 比较关键的问题。目前加载辅助词库的方法是,才艮据用户当前输入环境的相关信息,加载相 应的辅助词库,因为当前输入环境可能会表征用户的专业领域或兴趣。其中所 述当前输入环境包括当前应用程序名称、当前窗口名称、文件名称等。例如,用户当前的输入环境是某网络游戏界面,则自动加载该游戏的辅助词库;用户 在某文档中使用输入法时,则自动加载与该文档名称或者文档中的内容相匹配但是,由于文档的名称通常是由用户随意编辑的,简称"文档"、"工作"、 "备忘"等,有些文档则直接用默认的"新建文件l"、"新建文件2"等泛泛 的名称,因此从文件名、程序名来判断并加载相关辅助词库具有局限性。另夕卜, 根据文档中的内容进行判断也不够精确,因为该文档不一定是当前用户编辑 的,其内容不一定能表征当前用户的兴趣。而且可能造成错误的判断,例如文 档中出现了 "化工,,一词,于是加载了化工词库,但实际上文档中出现的是"流 程化工作,,,显然该文档并不一定与化工相关,这样加载反而会伤害用户体验。 因此,现阶段需要本领域技术人员迫切解决的一个技术问题是,如何准确 判断用户所属领域或用户兴趣,为加载需要的辅助词库提供可靠的依据。
技术实现思路
有鉴于此,本专利技术的目的在于提供确定需要加载的辅助词库的方法、装置 及输入法系统,以解决现有技术确定需要加载的用户词库时的不准确问题。为实现上述目的,本专利技术提供了如下方案 一种确定需要加载的辅助词库的方法,包括 采集用户的输入信息;分析采集到的信息,记录所述信息中能够表征用户兴趣的特征;才艮据所记录的特征确定需要加载的辅助词库。优选的判断所述信息中是否存在与预置特征列表中的特征相匹配的特征,如果存 在,则记录所述相匹配的特征。优选的,满足触发条件时,根据所记录的特征确定需要加载的辅助词库。 优选的,对所记录的特征进行统计,根据统计结果确定需要加载的辅助词库。优选的,基于预置的统计模型对所记录的特征进行统计。 优选的基于预置统计;f莫型,根据所记录的特征对每个辅助词库进行评分,将评分 结果高于预置阈值的辅助词库确定为需要加载的辅助词库。 优选的基于预置统计模型,根据所记录的特征对所有辅助词库进行综合评定,计 算每个辅助词库需要加载的概率,将概率排序在预置阈值前的辅助词库确定为需要加载的辅助词库。优选的,基于预置的规则模型对所记录的特征进行统计。优选的,所述用户的输入信息包括用户的输入序列、用户词库中的内容、用户输入的环境信息及输入行为。优选的,还包括推荐或自动加载所述需要加载的辅助词库。 优选的,将已加载辅助词库的相关信息保存到服务器。 一种确定需要加载的辅助词库的装置,包括 信息采集单元,用于采集用户的输入信息;分析单元,用于分析采集到的信息,记录所述信息中能够表征用户兴趣的 特征;判断单元,用于根据所记录的特征确定需要加载的辅助词库。 优选的,所述分析单元包括判断子单元,用于判断所述信息中是否存在与预置特征列表中的特征相匹 配的4争4正;记录子单元,用于记录所述相匹配的特征。 优选的,所述判断单元包括 触发子单元,用于判断是否满足触发条件;第一执行子单元,用于根据所记录的特征确定需要加载的辅助词库。优选的,所述判断单元包括统计子单元,用于对所记录的特征进行统计;第二执行子单元,用于根据统计结果确定需要加载的辅助词库。优选的所述统计子单元基于预置的统计^t型对所记录的特征进行统计。 优选的,所述统计子单元包括评分子单元,用于基于预置统计模型,根据所记录的特征对每个辅助词库 进行评分;比较子单元,用于将评分高于预置阈值的辅助词库确定为需要加载的辅助 词库。优选的,所述统计子单元包括概率计算子单元,用于基于预置统计模型,根据所记录的特征对所有辅助 词库进行综合评定,计算每个辅助词库可能需要加载的概率;选择子单元,用于将概率排序在预置阈值前的辅助词库确定为需要加载的 辅助词库。优选的所述统计子单元基于预置的规则模型对所记录的特征进行统计。 优选的所述信息采集单元采集用户的输入序列、用户词库中的内容、用户输入的 环境信息及输入行为。 优选的,还包括事件响应单元,用于推荐或自动加载所述需要加载的辅助词库。 优选的,还包括账户管理单元,用于绑定用户,并将已加载辅助词库的相关信息保存到服 务器。一种lt入法系统,包括信息采集单元,用于采集用户的输入信息,所述输入信息包括用户的输入 序列、用户词库中的内容、用户输入的环境信息及输入行为;分析单元,用于分析采集到的信息,记录所述信息中能够表征用户兴趣的 特征;判断单元,用于根据所记录的特征确定需要加载的辅助词库; 事件响应单元,用于推荐或自动加载所述需要加载的辅助词库。 优选的,所述判断单元包括 触发子单元,用于判断是否满足触发条件;第一执行子单元,用于根据所记录的特征确定需要加载的辅助词库。优选的,所述判断单元包括统计子单元,用于对所记录的特征进行统计;第二执行子单元,用于根据统计结果确定需要加载的辅助词库。优选的所述统计子单元基于预置的统计^f莫型对所记录的特征进行统计。 优选的所述统计子单元基于预置的规则模型对所记录的特征进行统计。 优选的,还包括账户管理单元,用于绑定用户,并将已加载辅助词库的相关信息保存到服 务器。根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果 第一,本专利技术对用户的输入信息进行分析,以此作为分析评判用户兴趣的 主要依据;由于用户的输入信息中能够更准确地提取到表征用户兴趣的特征, 因此提高了判断用户兴趣的准确度,为确定需要加载的辅助词库提供了可靠的 依据。第二,可以通过一段时期的数据积累,对记录的特征进行统计,可以进一 步提高判断的准确度。第三,采集用户输入信息时,不仅采集用户的输入序列,还可以结合用户 当前的输入环境、用户输入行为、用户词库中的词条(用户的长期输入)等综 合信息进行分析,有助于过滤掉干扰信息,使判断出的用户兴趣更加准确本文档来自技高网
...

【技术保护点】
一种确定需要加载的辅助词库的方法,其特征在于,包括: 采集用户的输入信息; 分析采集到的信息,记录所述信息中能够表征用户兴趣的特征; 根据所记录的特征确定需要加载的辅助词库。

【技术特征摘要】

【专利技术属性】
技术研发人员:张扬
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:11[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1