当前位置: 首页 > 专利查询>兰久富专利>正文

一种通用的集中处理重码汉字的方法技术

技术编号:2890727 阅读:228 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种通用的集中处理重码汉字的方法,适用于通过汉字编码进行汉字输入的计算机程序设计中。集中处理重码汉字的方法,根据重码标识和重码索引表区别重码汉字和非重码汉字。分两步输入一个重码汉字,第一步输入代表重码字,此时不必看屏选字,汉字全部盲打输入;第二步把重码汉字集中到一起统一处理,提供了智能处理、顺序处理等5种方法。使用集中处理重码汉字的方法可以方便、快速地输入重码汉字。(*该技术在2015年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种重码汉字输入方法以及与此相关的重码汉字处理方法,这种方法适用于通过汉字编码进行汉字输入的计算机程序设计中。汉字输入是计算机汉字信息处理中的一个重要环节,通常采用小键盘汉字编码输入方法。由于汉字数量多,编码中往往遇到重码,即一个代码对应一个以上的汉字,当遇到重码时就不能根据编码唯一地确定汉字,还需要进一步处理重码。绝大多数汉字编码都有重码,有重码就会影响输入速度,重码率越高影响越明显。怎样处理重码就成为汉字输入中的关键技术,重码处理得好坏直接影响汉字输入的效率。通常采用以下三种方法处理重码。第一种方法就是通过人机对话选择汉字,当遇到重码时,提示全部或部分重码汉字,根据每个汉字的提示序号按键选择。这种方法简单,但重码多时要反复地选择汉字,影响了汉字输入速度。第二种方法是在词组中确定汉字,输入词组第一个汉字的代码时,如果遇到重码,不必选择,接着输入第二个汉字的代码,即使再遇到重码也不必选择,能够在词组中唯一地确定这两个汉字。前一个重码汉字由后一个汉字确定,后一个重码汉字由前一个汉字确定,很少需要人机对话选择。这种方法比较方便,也可以提高输入速度,但是它对不能组词的汉字无能为力,而且有时侯也有重码的情况,还需要通过人机对话再选择。第三种方法通过增加编码规则减少重码。编码规则越多,重码出现的越少,重码少可以提高输入速度,但是这种处理方法由于增加了编码规则,使编码难以掌握,使用起来比较困难。具体操作中一般把三种方法结合使用,在编码中增加一些规则,降低重码率;在输入汉字时采用词组输入,用词组确定部分重码汉字;余下的重码汉字用人机对话方法处理。即使这样,现有的重码汉字处理方法还是不能方便、快速地输入重码汉字。本专利技术提供的集中处理重码汉字的方法可以很好地解决汉字输入中的重码问题,利用这种方法可以方便、快速地输入重码汉字。处理重码汉字是指区分重码汉字和非重码汉字,通过各种方法正确地选择和输入重码汉字。集中处理重码汉字的基本思路是分离汉字输入操作和重码处理操作,在输入汉字时遇到重码不必马上选择,而是先输入一个代表汉字,并且给这个代表汉字加上重码标识,这个重码标识用来区别重码汉字和非重码汉字。输入若干汉字之后,再把全部带重码标识的汉字集中到一起统一处理。这种方法的优点在于实现了重码汉字的盲打输入,即使有较多的重码也能象没有重码一样输入,简化了汉字输入操作,加快了输入速度。为了把重码汉字集中到一起处理,首先要区分重码汉字和非重码汉字,重码汉字要进一步处理,非重码汉字就不需要再处理。提供了下面两种区分重码汉字的方法。(1)根据重码标识区别重码汉字和非重码汉字在汉字内部码中设置一个重码标识位,或者设置一个重码标识字节,利用这个标识区别重码汉字和非重码汉字。下面以通常采用的二字节最高位均为1的汉字内部码为例说明。把内部码第一字节的最高位作为汉字标识位,把第二字节的最高位作为重码标识位。当第一字节的最高位置1时,表明当前字符和下一个字符构成一个汉字的内部码。当第二字节的最高位置1时,表示这个汉字不是重码汉字,或者是不需要再选择的重码汉字;当该位为0时,表示这个汉字是重码汉字,而且这个汉字还没有选定。在具体实施时,预先从每一组重码汉字中选出一个代表字,这个代表字是这一组重码汉字中使用频度最高的汉字,并制作一张重码索引表,根据这张索引表可以从代表汉字查到对应的全部重码汉字,也可以从某一个重码汉字查到代表重码字和其余的重码汉字。输入重码汉字时,先输入这组重码字中的代表重码字,并给这个代表重码字加上重码标识,即内部码第二字节的最高位为0,以区别于第二字节的最高位为1的非重码汉字。待输入完一个句字,或一段文字,或整个文章后,再根据重码标识查找重码汉字,利用重码索引表进行重码处理。为了这个任务要设计一段程序,从某一位置开始测试汉字内部码第二字节的最高位,判别是否有重码标识,如果该位已经置1,表明这个汉字不是重码汉字,不需要重码处理,继续测试下一个汉字内部码第二字节的最高位;如果该位是0,表明这个汉字是代表重码字,需要进行重码处理,根据重码索引表找到其它重码汉字,利用后面介绍的重码汉字处理方法进行处理。(2)利用重码索引表区别重码汉字和非重码汉字本专利技术还提供了一种不必加重码标识便可以区别重码汉字和非重码汉字的方法。输入重码汉字时不必马上选择,临时输入一个使用频度最高的代表重码字,不必给这个代表字加上重码标识,它的内部码结构与非重码汉字的内部码结构完全一致。集中处理重码汉字时,不是根据重码标识判别是否为重码字,而是根据重码索引表判别当前测试的汉字是否为代表重码字。如果在代表重码字表中有这个汉字,说明这个汉字就是代表重码字,需要进行重码处理,否则不是重码字,不必进行重码处理。区分出重码汉字和非重码汉字之后,利用后面介绍的处理重码汉字的方法进行处理。用拼音码为例说明重码索引表的结构。有三个相互关联的数据表(也可以把三个数据表合并成一个数据表),三个数据表分别提供代码、代表重码字、对应重码字的信息,构成一个完整的重码索引表。基本结构如下代码代表重码字对应重码字a阿啊呵吖锕腌嗄ai 爱埃碍哀矮挨哎…an 安按案暗岸氨胺…… ………代码是指根据一定编码规则产生的汉字输入码,代表重码字就是一组重码字中使用频度最高的汉字,对应重码字是一组重码字中除了代表重码字之外的其余重码字。三个表之间有内在的联系,代码与代表重码字一一对应,从代码或代表重码字可以查到对应重码字,从对应重码字也可以查到代表重码字。现有的汉字编码输入方法通常一次性输入重码汉字,遇到重码汉字时用人机对话方法选定之后输入。集中处理重码汉字的方法分两个步骤输入一个重码汉字。第一步输入代表重码字,此时不必看屏选字,即使有很多重码也可以盲打输入,提高了输入速度。第二步把重码汉字集中到一起统一处理,处理重码时用下面介绍的方法方便、快速地确定所要输入的重码汉字。分两步输入一个重码汉字减少了选择重码汉字的重复操作,比一次性输入一个汉字更方便、更快速,在输入大量文字时这个优点表现得更加明显。在识别重码、确定汉字时可以使用以下5种处理重码汉字的方法。(1)智能处理重码汉字一个重码汉字可以根据其所在的语言环境确定,最简单的实现方法是根据这组重码汉字与前后汉字的组词情况来确定应该选择的汉字。本专利技术提供的智能处理重码汉字的方法就是根据词组和语言环境自动选择重码汉字。具体方法如下重码汉字处理程序根据重码标识或重码索引表自动识别重码汉字。当遇到一个汉字时,检测这个汉字的内部码是否带有重码标识,即检测汉字内部码的第二字节的最高位是否为0,如果为0,表明这个汉字是代表重码汉字。也可以通过重码索引表判断是否为代表重码字,如果是代表重码字,就把它当做重码汉字处理。当判定这个汉字为重码汉字之后,再取前一个汉字和后一个汉字,判别前后汉字是否为重码汉字,如果前一个汉字或后一个汉字是重码汉字,则根据重码索引表查到其对应重码字。然后,根据一个词组数量在20000个以上的词库检测组词情况。首先检测前一个汉字与正在处理的重码汉字能否构成词组,要对一组重码字中的每一个汉字都检测一次,并记录是否能够组成词组。然后用同样的方法检测后一个汉字与正在处理的重码汉字能否构成词组,要对一组重码字中的每一个都检测一次,本文档来自技高网...

【技术保护点】
一种重码汉字输入方法以及与此相关的重码汉字处理方法,其特征是:在汉字内部码中设置重码标识,根据重码标识区别重码汉字和非重码汉字;分两步输入一个重码汉字,第一步输入代表重码字,第二步把重码汉字集中到一起统一处理。

【技术特征摘要】

【专利技术属性】
技术研发人员:兰久富
申请(专利权)人:兰久富
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1