The invention discloses a method and device for thesaurus management input method, input method for specific applications in scene management, such as in the exam, the exam questions answer first resolve information shield entry database, then according to the operation of the database entry screen terminal device includes an input method to install the desktop computer, notebook computer PAD, intelligent mobile phone and so on the thesaurus, each traversal input method in the thesaurus entry information, delete hidden entries, which can perform normal examination or testing in ordinary terminal equipment, there is no need to prepare special terminal equipment or the use of special input method, can be avoided due to the intelligent input function thesaurus examination or test results, and will not affect the examination period for other text input and non examination time for terminal equipment The normal use of the input method improves the user's experience and reduces the cost of organizing tests or tests.
【技术实现步骤摘要】
一种输入法的词库管理方法及装置
本专利技术属于智能输入法
,用于特殊应用场景下尤其是互联网教学场景下的智能输入法的词库管理,特别是涉及一种应用于考试场景的能够根据考试试题的答案信息对输入法的词库进行管理的方法及装置。
技术介绍
自从上个世纪九十年代出现汉字输入法至今,随着计算机技术的迅猛发展,特别是由于各种智能终端的应运而生,作为人机核心交互手段的输入法变得越来越智能。输入法的智能主要是因为越来强大的算法和基于此的过程学习能力,词库是输入法智能化的内在载体。尽管不同的输入法,词库的结构不尽相同,但是基本上包括索引、目录和词条。从类别上看,词库一般可以包括基础词库、专业词库和用户词库。目前,为各种终端设备所提供的输入法系统,主要是基于其词库以及词库中的词频(字词的使用频率)来为用户在信息输入过程中提供候选词的排序,优先显示词频最高的常用字词,即首选词。候选词的排序是用户在信息输入过程中首选词命中率高低的一个重要指标。所述首选词命中率是指,当用户输入一定的键盘信息后,排序在前的字、词或句是用户最需要的。但是,无论如何,词库特别是词库中的词条信息是输入法智能化的基 ...
【技术保护点】
一种输入法的词库管理方法,包括以下步骤:词条解析步骤,用于获取待解析的文档,首先以间隔符号为边界条件,将所述文档划分为短语,对于所述短语,再进行渐进式词条解析,生成由一系列大于等于两个字的词条组成的屏蔽词条库;词条过滤步骤,用于获取输入法的词库,根据所述屏蔽词条库,查询所述词库中是否存在所述屏蔽词条库中的词条,如果是,删除所述词库中与所述屏蔽词条库中内容相同的词条记录。
【技术特征摘要】
1.一种输入法的词库管理方法,包括以下步骤:词条解析步骤,用于获取待解析的文档,首先以间隔符号为边界条件,将所述文档划分为短语,对于所述短语,再进行渐进式词条解析,生成由一系列大于等于两个字的词条组成的屏蔽词条库;词条过滤步骤,用于获取输入法的词库,根据所述屏蔽词条库,查询所述词库中是否存在所述屏蔽词条库中的词条,如果是,删除所述词库中与所述屏蔽词条库中内容相同的词条记录。2.根据权利要求1的方法,其特征在于,在执行所述词条过滤步骤之前,优选的,先执行词库备份步骤,用于将所述输入法的词库进行备份,使得可以在事后恢复使用执行所述词条过滤步骤之前的词库。3.根据权利要求2的方法,其特征在于,在执行所述词条过滤步骤时,优选的,查找所述输入法的所有词库,遍历所述输入法的所有词库的词条信息,从而完成所述词条过滤步骤。4.根据权利要求3的方法,其特征在于,在执行所述词条解析步骤之前,执行文档过滤步骤,将所述文档中的数字或字母,以位置上连续的组为单位替换为一个间隔符号;在执行所述词条解析步骤之后,执行文档删除步骤,对于待解析的文...
【专利技术属性】
技术研发人员:陈滢朱,张铠鹏,张晓风,
申请(专利权)人:深圳市鹰硕技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。