基于用户自有文档的智能输入法词库构建模式制造技术

技术编号:10106538 阅读:184 留言:0更新日期:2014-06-01 21:00
基于用户自有文档的智能输入法词库构建模式。本发明专利技术涉及一种基于用户自有文档的智能输入法词库构建方法,用于为用户构建个性化的输入法词库信息,包括:高速缓冲存储器单元,用于复制硬盘上的Word、Excel、PowerPoint文档、E-mail、缓存中的网页等文件;词汇导出模块,功能是读出用户文档中所有词汇,并保存为XML格式的文件,然后自动把它上传到数据库;词库下载模块,功能是把保存在数据库中的XML文件下载到客户端,并自动把该文件中的词汇导入到用户词库文件中;个性化词库存储单元,用于存储用户的独有个性化词库信息。本发明专利技术还提供一种对应的方法。本发明专利技术对用户自有文档价值进行了挖掘,使得输入法更有针对性,本输入法利于快速录入,有助于提升文字输入效率。

【技术实现步骤摘要】
【专利摘要】基于用户自有文档的智能输入法词库构建模式。本专利技术涉及一种基于用户自有文档的智能输入法词库构建方法,用于为用户构建个性化的输入法词库信息,包括:高速缓冲存储器单元,用于复制硬盘上的Word、Excel、PowerPoint文档、E-mail、缓存中的网页等文件;词汇导出模块,功能是读出用户文档中所有词汇,并保存为XML格式的文件,然后自动把它上传到数据库;词库下载模块,功能是把保存在数据库中的XML文件下载到客户端,并自动把该文件中的词汇导入到用户词库文件中;个性化词库存储单元,用于存储用户的独有个性化词库信息。本专利技术还提供一种对应的方法。本专利技术对用户自有文档价值进行了挖掘,使得输入法更有针对性,本输入法利于快速录入,有助于提升文字输入效率。【专利说明】基于用户自有文档的智能输入法词库构建模式
本专利技术涉及智能输入法领域,更具体地说,涉及一种个性化的输入法词库构建模式及方法。
技术介绍
输入法几乎是我们每一个中国人使用电脑时都会用到的软件。在电脑普及的过程中,有很多的输入法陪伴过用户撰写文档、冲浪、聊天。传统的输入法的词库是静态的、陈旧的,而本输入法的词库是动态的、个性化的。每个人电脑文档内容都有自己的特色,和其工作性质息息相关,诸如所存储的文档有行业属性偏好,医疗行业和金融行业用户所储存的文档内容都会包含一定的专业术语。本输入法利于快速录入,有助于提升文字输入效率。
技术实现思路
本专利技术要解决的技术问题在于,针对以往输入法缺乏个性化词库的问题,提供一种基于用户自有文档的智能输入法词库构建模式及方法。 本专利技术解决上述技术问题的技术方案是,提供一种基于用户自有文档的智能输入法词库构建模式,用于为用户构建个性化的输入法词库信息,包括:高速缓冲存储器单元,用于复制硬盘上的Word、Excel、PowerPoint文档、E-mail、缓存中的网页等文件;词汇导出模块的功能是读取用户文档中所有词汇,并保存为XML格式的文件,然后自动把它上传到数据库;词库下载模块的功能是把保存在数据库中的XML文件下载到客户端,并自动把该文件中的词汇导入到用户词库文件中;个性化词库存储单元,用于存储用户的独有个性化词库信息。在本专利技术所述的用户自有文档的智能输入法词库构建模式中,所述文档信息包含fford>Excel^PowerPoint等Office文档、E-mail、缓存中的网页等文件;同时软件提供了扫描范围自定义设置,用户可以禁止对电子邮件、聊天记录等比较敏感的项目信息进行收集。本专利技术提供基于用户自有文档的智能输入法词库构建模式,用于为用户构建个性化的输入法词库信息,包括以下步骤: a、征询用户同意后,本输入法程序预先扫描记忆硬盘的内容; b、将上述内容复制到高速缓冲存储器中; C、提取用户文档中的词汇; d、存储到特定的数据库中; e、从而形成用户专用的个性化输入法词库。【专利附图】【附图说明】图1是本专利技术基于用户自有文档的智能输入法词库构建模式实施的示意图 图2是本专利技术基于用户自有文档的智能输入法词库构建模式的流程图【具体实施方式】本专利技术结合用户自有文档进行输入法词库构建。本专利技术可以极大提高输入法个性化应用,提升效率。如图1所示,是本专利技术于用户自有文档的智能输入法词库构建模式实施的示意图,该系统用于为用户构建个性化的输入法词库信息。在本实施例中,包括高速缓冲存储器单元、词汇导出模块以及词库下载模块、个性化词库存储单元。上述高速缓冲存储器单元、词汇导出模块以及词库下载模块、个性化词库存储单元位于同一服务器上。高速缓冲存储器单元,用于复制硬盘上的Word、Excel、PowerPoint文档.、E-mail、缓存中的网页等文件; 词汇导出模块的功能是读取用户文档中所有词汇,并保存为XML格式的文件,然后自动把它上传到数据库; 词库下载模块的功能是把保存在数据库中的XML文件下载到客户端,并自动把该文件中的词汇导入到用户词库文件中; 个性化词库存储单元,用于存储用户的独有个性化词库信息。如图2所示,是本专利技术基于用户自有文档的智能输入法词库构建模式实施例的流程图,该方法用于为用户构建个性化的输入法词库信息,包括以下步骤: 预先扫描硬盘上OFFICE文档、E-mail、缓存中的网页等文件,将上述内容复制到高速缓冲存储器中;读取词汇保存为XML格式,存储到特定的数据库中;然后再进行词库下载。上述基于用户自有文档的智能输入法词库构建模式及方法,通过用户的自有文档来进行输入法词库构建,可极大提高输入法效率。以上所述,仅为本专利技术较佳的【具体实施方式】,但本专利技术的保护范围并不局限于此。【权利要求】1.基于用户自有文档的智能输入法词库构建模式,用于为用户构建个性化的输入法词库信息,其特征在于,包括: 高速缓冲存储器单元,用于复制硬盘上的Word、Excel、PowerPoint文档、E-mail、缓存中的网页等文件; 词汇导出模块,用于读取用户文档中所有词汇,并保存为XML格式的文件,然后自动把它上传到数据库; 词库下载模块,功能是把保存在数据库中的XML文件下载到客户端,并自动把该文件中的词汇导入到用户词库文件中; 个性化词库存储单元,用于存储用户的独有个性化词库信息。2.根据权利要求1所述的基于用户自有文档的智能输入法词库构建模式,其特征在于,还包括用于统计词条出现频率的词频阈值统计过滤系统,在不断的过滤、验证、修改参数的循环中,使系统逐渐趋于稳定,为整个词库的质量做出重要的保证。3.根据权利要求1-2中任一项所述的基于用户自有文档的智能输入法词库构建模式,其特征在于,所述用户可供扫描的源文档存储范围以及格式均可设置,用户可以禁止对电子邮件、聊天记录等比较敏感的项目进行收集。4.根据权利要求3所述的基于用户自有文档的智能输入法词库构建模式,其特征在于,本词库基于WINDOWS操作系统二次化开发。5.基于用户自有文档的智能输入法词库构建模式,用于为用户构建个性化的输入法词库信息,其特征在于,包括以下步骤: a、征询用户同意后,本输入法程序预先扫描记忆硬盘的内容(Word、Excel、PowerPoint文档、E-mail、缓存中的网页等文件); b、将上述内容复制到高速缓冲存储器中; C、提取用户文档中的词汇; d、存储到特定的数据库中; e、从而形成用户专用的个性化输入法词库。6.根据权利要求4所述的基于用户自有文档的智能输入法词库构建模式,其特征在于,系统是动态、开放性的,可以持续更新。【文档编号】G06F17/30GK103823802SQ201210462397【公开日】2014年5月28日 申请日期:2012年11月16日 优先权日:2012年11月16日 【专利技术者】石双年 申请人:上海爱相随信息科技有限公司本文档来自技高网...

【技术保护点】
基于用户自有文档的智能输入法词库构建模式,用于为用户构建个性化的输入法词库信息,其特征在于,包括:高速缓冲存储器单元,用于复制硬盘上的Word、Excel、PowerPoint文档、E?mail、缓存中的网页等文件;词汇导出模块,用于读取用户文档中所有词汇,并保存为XML格式的文件,然后自动把它上传到数据库;词库下载模块,功能是把保存在数据库中的XML文件下载到客户端,并自动把该文件中的词汇导入到用户词库文件中;个性化词库存储单元,用于存储用户的独有个性化词库信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:石双年
申请(专利权)人:上海爱相随信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1