一种生僻字符信息的提示方法和装置制造方法及图纸

技术编号:9405844 阅读:120 留言:0更新日期:2013-12-05 06:00
本申请提供了一种生僻字符信息的提示方法和装置,其中的方法具体包括:构建生僻字符集合;监测用户在应用程序环境中捕获的文本;当所述捕获的文本中有字符落入所述生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息;向用户提示所述落入生僻字符集合的字符的相关信息。本申请能够增加输入生僻字符的便捷性。

【技术实现步骤摘要】
一种生僻字符信息的提示方法和装置
本申请涉及信息处理
,特别是涉及一种生僻字符信息的提示方法和装置。
技术介绍
目前,绝大多数用户使用拼音输入法进行汉字输入,其前提是知道该字的“大概”的读音。因此,对于这部分用户来说,一个汉字的读音是非常重要的,如果用户完全不知道某个字的读音,就很难用拼音输入法完成输入。汉字的数量非常大,仅GB18030字符集中就有两万多个汉字。但是人们日常使用的汉字却只有几千个,其余不常使用的汉字对大多数人来说都属于生僻字,往往不知道该字的发音。随着信息处理技术的发展,如果仅知道生僻字的字形而需要输入该生僻字,一般来说有如下方法:方法一、在人工查询该生僻字的读音后,采用拼音输入该生僻字;所述人工查询方式具体可以包括:通过查询字典得到该生僻字的读音;将该生僻字复制至搜索引擎来进行读音的查询等等。无论是哪种人工查询方式都需要复杂的流程,费时费力,影响输入效率。方法二、现有流行的拼音输入法支持拆分输入模式,也即,可以将生僻字拆成几个简单的部首,通过输入这几个部首的读音来完成该生僻字的输入,并能同时得到该生僻字的读音等信息。参照图1,示出了现有一种拼音输入法的拆分输入方法示例,用户输入“tututu”就能找到“垚”字。但是,有些独体字难以进行拆分,另外用户可能不知道拆分后的部首的读音,还有可能会因为拆分顺序不一致等原因导致无法顺利得到该生僻字等等。故方法二也需要复杂的流程,费时费力,且容易影响输入效率和输入准确率。方法三、直接采用基于字形的输入法(如五笔字型输入法)输入该生僻字,但基于字形的输入法并不为多数人使用,对于多数人来讲并不可行;方法四、用户可以打开手写识别软件,用鼠标或其他手绘输入设备在软件界面中绘制出该生僻字的字形,通过手写识别技术完成该生僻字的输入。但是,对于普通用户来说,用鼠标绘制汉字比较麻烦,比较慢,效率较低;并且,在用户绘制的汉字不够“标准”情况下,容易导致手写识别软件没法识别出正确的字。总之,需要本领域技术人员迫切解决的一个技术问题就是:如何能够增加输入生僻字符的便捷性。
技术实现思路
本申请所要解决的技术问题是提供一种生僻字符信息的提示方法和装置,能够增加输入生僻字符的便捷性。为了解决上述问题,本申请公开了一种生僻字符信息的提示方法,包括:构建生僻字符集合;监测用户在应用程序环境中捕获的文本;当所述捕获的文本中有字符落入所述生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息;向用户提示所述落入生僻字符集合的字符的相关信息。优选的,所述当所述捕获的文本中有字符落入所述生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息进一步包括:当所述捕获的文本字数不超过字数阈值,且所述捕获的文本中有字符落入生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息。优选的,所述捕获的文本包括选中的文本、复制的文本或者剪切的文本。优选的,通过如下步骤构建生僻字符集合:对字符的使用频率进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合;和/或收集手写输入和/或拆分输入的字符,作为生僻字符保存至生僻字符集合;和/或收集手写输入和/或拆分输入中符合对应的生僻属性条件的字符,作为生僻字符保存至生僻字符集合;和/或对字符的笔画数目或者单词的字母长度进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合;和/或对搜索引擎的搜索记录中记录的单个字或单个词进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合。优选的,所述监测用户在应用程序环境中捕获的文本的步骤,包括:监测用户在应用程序环境中执行的文本捕获操作;通过调用该应用程序环境提供的功能接口,获取所述文本捕获操作所捕获的文本。优选的,所述文本捕获操作包括文本选中操作、文本复制操作或者文本剪切操作。优选的,所述监测用户在应用程序环境中捕获的文本的步骤,包括:通过监控用户的剪贴板,获取用户的剪贴板中最新的文本内容,所述最新的文本内容为用户在应用程序环境中捕获的文本。优选的,所述落入生僻字符集合的字符的相关信息包括读音、部首、笔画、释义、常用组词、便捷输入方法信息中的一种或多种。优选的,所述提示所述落入生僻字符集合的字符的相关信息的步骤为,采用弹窗或浮动框方式提示所述落入生僻字符集合的字符的相关信息;或所述提示所述落入生僻字符集合的字符的相关信息的步骤为,在所述捕获的文本相关联的位置提示所述落入生僻字符集合的字符的相关信息。优选的,所述方法还包括:当所述捕获的文本中未有字符落入生僻字符集合时,客户端将所述捕获的文本中的全部或部分字符上传至服务器端;服务器端分析客户端上传的字符的生僻属性,并在分析得到的生僻属性符合生僻属性条件时,将所述字符保存至所述生僻字符集合;服务器端将所述生僻字符集合同步至客户端。优选的,所述当捕获的文本中未有字符落入生僻字符集合时,客户端将所述捕获的文本中的全部或部分字符上传至服务器端进一步包括:当所述捕获的文本中未有字符落入生僻字符集合,且所述捕获的文本为单个字或单个词时,客户端将所述单个字或单个词上传至服务器端。优选的,所述生僻属性条件包括:依据字符的使用频率预置的条件;和/或依据字符的笔画数目或者单词的字母长度预置的条件;和/或对搜索引擎的搜索记录中记录的单个字或单个词进行分析统计,并依据分析统计结果预置的条件。另一方面,本申请还公开了一种生僻字符信息的提示装置,包括:构建模块,用于构建生僻字符集合;监测模块,用于监测用户在应用程序环境中捕获的文本;获取模块,用于当所述捕获的文本中有字符落入所述生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息;及提示模块,用于向用户提示所述落入生僻字符集合的字符的相关信息。优选的,所述获取模块进一步包括:信息获取子模块,用于当所述捕获的文本字数不超过字数阈值,且所述捕获的文本中有字符落入生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息。优选的,所述捕获的文本包括选中的文本、复制的文本或者剪切的文本。优选的,所述构建模块包括:第一收集子模块,用于对字符的使用频率进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合;和/或第二收集子模块,用于收集手写输入和/或拆分输入的字符,作为生僻字符保存至生僻字符集合;和/或第三收集子模块,用于收集手写输入和/或拆分输入中符合对应的生僻属性条件的字符,作为生僻字符保存至生僻字符集合;和/或第四收集子模块,用于对字符的笔画数目或者单词的字母长度进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合;和/或第五收集子模块,用于对搜索引擎的搜索记录中记录的单个字或单个词进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合。优选的,所述监测模块包括:操作监测子模块,用于监测用户在应用程序环境中执行的文本捕获操作;调用获取子模块,用于通过调用该应用程序环境提供的功能接口,获取所述文本捕获操作所捕获的文本。优选的,所述文本捕获操作包括文本选中操作、文本复制操作或者文本剪切操作。优选的,所述监测模块包括:监控获取子模块,用于通过监控用户的剪贴板本文档来自技高网
...
一种生僻字符信息的提示方法和装置

【技术保护点】
一种生僻字符信息的提示方法,其特征在于,包括:构建生僻字符集合;监测用户在应用程序环境中捕获的文本;当所述捕获的文本中有字符落入所述生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息;向用户提示所述落入生僻字符集合的字符的相关信息。

【技术特征摘要】
1.一种生僻字符信息的提示方法,其特征在于,包括:构建生僻字符集合;监测用户在应用程序环境中捕获的文本;当所述捕获的文本中有字符落入所述生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息;向用户提示所述落入生僻字符集合的字符的相关信息;当所述捕获的文本中未有字符落入生僻字符集合时,客户端将所述捕获的文本中的全部或部分字符上传至服务器端;服务器端分析客户端上传的字符的生僻属性,并在分析得到的生僻属性符合生僻属性条件时,将所述字符保存至所述生僻字符集合;服务器端将所述生僻字符集合同步至客户端。2.如权利要求1所述的方法,其特征在于,所述当所述捕获的文本中有字符落入所述生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息进一步包括:当所述捕获的文本字数不超过字数阈值,且所述捕获的文本中有字符落入生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息。3.如权利要求1或2所述的方法,其特征在于,所述捕获的文本包括选中的文本、复制的文本或者剪切的文本。4.如权利要求1所述的方法,其特征在于,通过如下步骤构建生僻字符集合:对字符的使用频率进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合;和/或收集手写输入和/或拆分输入的字符,作为生僻字符保存至生僻字符集合;和/或收集手写输入和/或拆分输入中符合对应的生僻属性条件的字符,作为生僻字符保存至生僻字符集合;和/或对字符的笔画数目或者单词的字母长度进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合;和/或对搜索引擎的搜索记录中记录的单个字或单个词进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合。5.如权利要求1或2所述的方法,其特征在于,所述监测用户在应用程序环境中捕获的文本的步骤,包括:监测用户在应用程序环境中执行的文本捕获操作;通过调用该应用程序环境提供的功能接口,获取所述文本捕获操作所捕获的文本。6.如权利要求5所述的方法,其特征在于,所述文本捕获操作包括文本选中操作、文本复制操作或者文本剪切操作。7.如权利要求1或2所述的方法,其特征在于,所述监测用户在应用程序环境中捕获的文本的步骤,包括:通过监控用户的剪贴板,获取用户的剪贴板中最新的文本内容,所述最新的文本内容为用户在应用程序环境中捕获的文本。8.如权利要求1所述的方法,其特征在于,所述落入生僻字符集合的字符的相关信息包括读音、部首、笔画、释义、常用组词、便捷输入方法信息中的一种或多种。9.如权利要求1所述的方法,其特征在于,所述提示所述落入生僻字符集合的字符的相关信息的步骤为,采用弹窗或浮动框方式提示所述落入生僻字符集合的字符的相关信息;或所述提示所述落入生僻字符集合的字符的相关信息的步骤为,在所述捕获的文本相关联的位置提示所述落入生僻字符集合的字符的相关信息。10.如权利要求9所述的方法,其特征在于,所述当所述捕获的文本中未有字符落入生僻字符集合时,客户端将所述捕获的文本中的全部或部分字符上传至服务器端进一步包括:当所述捕获的文本中未有字符落入生僻字符集合,且所述捕获的文本为单个字或单个词时,客户端将所述单个字或单个词上传至服务器端。11.如权利要求1、4或10所述的方法,其特征在于,所述生僻属性条件包括:依据字符的使用频率预置的条件;和/或依据字符的笔画数目或者单词的字母长度预置的条件;和/或对搜索引擎的搜索记录中记录的单个字或单个词进行分析统计,并依据分析统计结果预置的条件。12.一种生僻字符信息的...

【专利技术属性】
技术研发人员:刘旋李贝
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1