当前位置: 首页 > 专利查询>周耀瑜专利>正文

汉字多功能编码键盘和二叉树编码法制造技术

技术编号:2892957 阅读:294 留言:0更新日期:2012-04-11 18:40
多功能编码键盘用标准键盘中二十六个英文字符键表示三十七个中文字元、二十六个拼音字符和三个数字,着重采用实虚笔画相结合的方法,键盘清晰,记忆量小,符合键位频率,条件概率和键盘指法要求,二叉树编码法以汉字可以生成汉字二叉树这一特点为依据,简单直观,不受具体字形的影响,以上两者相结合,效果更佳,重码字很小,适合计算机专职和非专职人员学习使用。(*该技术在2011年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术属于中文信息处理
,涉及一种汉字三十七字元通用多功能编码键盘和一种科学的汉字二叉树编码方法。汉字二叉树编码法以汉字可以生成汉字二叉树这一特点为设计依据。现有的汉字编码很多种,一般可归为形码、音码和形音码三大类型。但似乎还没有一种编码被人们公认是较理想的编码,原因在于它们或编码较长,或重码字多,或编码规则复杂,或使用编码字元较多等。本专利技术的目的是要提供一种适合用笔形方式和形音综合方式,对所有现代汉字、词语和句子进行编码的汉字三十七字元通用多功能编码键盘;其次提供一种建立在汉字二叉树理论基础上的,反映汉字二叉树特点的汉字二叉树编码方法。汉字二叉树编码法简单直观,并具有统一的规律性,与汉字三十七字元多功能编码键盘相编合,效果更佳,特别能实现快速输入处理计算机汉字信息,适合专职和非专职人员学习使用。汉字多功能编码键盘的实现及特点汉字多功能编码键盘选用三十七个使用频度和实用频度较高的字元,包括可读字元和不可读字元、实笔画字元和虚笔画字元,以及由实虚笔画共同组成的字元,把其中二十六个含实笔画的字元按照首笔画特点划分为“丶,一,丨,丿, ”五组,然后按组基本由简到繁(指实笔画部分)顺序地将字元排列于标准键盘上的二十六个英文符键上,另外十一个字元复盖在前者当中的十一字元上,起着键位频度和条件概率的互补作用,如附图(1)所示。多功能编码键盘上的三十七个字元,它们各有自身的特点和作用,一般象征表示若干同类字元,除本身以外,对于由实虚笔画共同组成的字元,更主要是表示去掉全部虚笔画所剩下的实笔画字元;对于部分不可读音的实笔画字元。还表示它的贯用读音字元;所有字元,一般还表示它的若干相似变体字元。约定1 全体实笔画字元及其相似变体字元,统称为键盘实系列字元或键盘基系列字元。约定2 全体虚笔画字元和实笔画字元的读音字元,以及这些字元的相似变体字元,统称为键盘虚系列字元。约定3 全体由实虚笔画共同组成的字元及其相似变体字元,统称为键盘中性系列字元。约定4 键盘实系列字元、虚系列字元和中性系列字元的全体,总称为键盘系列字元。键盘系列字元表现为三十七字元键盘,键盘实系列字元表现为三十四字元键盘,如附图(2)所示,三十七字元键盘隐含三十四字元键盘。实系列字元中绝大多数字元,不仅是基础型字元的字头和字尾子字元。而且是组成任何字元的基本笔画和笔画组。这里所指的字元的头尾顺序是指从左到右、从上到下、从外到内这样的书写顺序。在确定字头子字元时,要求字头子字元尽可能属于较多笔画的键盘实字元。但是,除内外插入关系外,一般复笔画字头子字元不能有“丨”笔画插入下面的子字元中,否则要修改字头子字元。键盘虚系列字元主要是针对标准编码是三单元以下的编码设计的,对四单元以上的编码,虚系列字元一般不作为编码字元使用。键盘中性系列字元主要为了快速输入实用频度较高的汉字而设计的,不论标准编码数多少,它们当中的字元,即可作为编码字元使用,也可不作为编码字元使用,根据具体编码而定。汉字多功能编码键盘除三十七个中文字元外,还有两个功能一、表示二十六个拼音码,所谓拼音码是指汉语拼音的声母或第一韵母的代码,除声母“ch、sh、zh”分别用字符“I、U、V”表示外,其它声母和韵母的代码就是它本身;二、字符键“A、E、O”上面共有三个数字,除表示相应序数外,还可用来代表一定的字形,主要在处理重码字时使用。详细键盘系列字元及其说明,参见表(1)。综上所述,汉字多功能编码键盘明显具有以下优特点第一,汉字多功能编码键盘上的三十七个字元安排巧妙,具有较强的规律性,简单易记,符合键位频度、条件概率、铸盘指法及人们各方面的心理要求;第二,汉字多功能编码键盘利用实虚笔画相结合的方法,贯用读音的方法和相似变体的方法,增强了汉字多功能编码键盘的表示能力,汉字三十七字元键盘同时隐含汉字三十四字元键盘,并很容易被人们记忆和理解,保持了键盘的清晰度;第三,汉字多功能编码键盘适合对所有现代汉字,词语和句子进行编码,不论是纯形型或形音型、等长或不等长的编码都具有一定的灵活性和方便性,但一般主要根据基础字元的字头或字尾特点进行编码,效果良好,并具有处理重码字的能力。从使用角度出发,定义汉字,词语和句子的标准编码为四单元码比较适宜,一般可控制重码率小于5%;从实用角度出发,定义汉字、词语和句子的标准编码为三单元码,一般可控制重码率小于20%。在实际实施过程中,根据具体的应用环境和需要,汉字多功能编码键盘可以适当修改。如(1)键盘字元的实虚笔画可以用不同的颜色来表示;(2)当仅设计四元码汉字输入系统时,则字元“、竹、贝”可以不写在键盘上;(3)当仅设计三元码汉字输入系统时,则字元“、竹、贝”可以用实笔画形式写在键盘上;(4)由于具体编码的需要,中性系列字元可以删减。若特别需要,键盘字元可以重新布局,但不改变键盘字元的组合关系。总之,附图(1)所示的键盘图作为一个总体设计,目标是全方位的和多功能的。汉字二叉树编码方法及特点汉字二叉树编码法是通过严格分析汉字构形和读音特点进行设计的,认为汉字是可读音的字元。任何字元都可以看成是一个平面二叉树图块。约定5 如果一个字元是由若干子字元主要以连接和插入方式相结合组成的字元,叫做基础型字元,否则叫做非基础型字元。约定6 如果一个字元正好由两个可读音的子字元组成,则这个字元叫做复型字元,如果组成字元都是不可读音字元,则这个字元叫做原型字元,否则称为一般型字元,同属于基础字元和原型字元的字元以及简单的原型字元,叫做整体形字元。任何非整体形字元都可以看成是由两个子字元组成的,由于两个子字元的重心位置关系不同存在三种基本构形,即左右形、上下和内外形,其中左右形汉字最多,约占汉字总量的54%,内外形又包括全包围形、三边包围形、两邻边包围形和两对边包围形等,如“国、周、这、哀”字等。事实上,任何非整体形字元都很容易按照其基本构形和读音特点以及异构形性分解为两个子字元。一般,位于左边、上面和外围的子字元叫做首子字元,位于右边,下面和内部的子字元叫做未子字元,从子字元的可读性和构形的复杂性来讲,其中一个相对可读的或构形复杂的子字元叫做字体子字元或中心子字元。一般,子字元同样具有上述特性,所以,任何字元都可以生成一棵由字元作结点的二叉树,叫做汉字二叉树,汉字二叉树属于满二叉树,汉字二叉树的根结点就是字元本身,每个结点字元分解后,其首子字元生成这个结点的左子树,而未子字元生成这个结点的右子树,直到二叉树中每个叶子字元都是整体形字元或满足其它具体要求为止。如果二叉树中每个叶子字元都是整体形字元,则叫做完整汉字二叉树,否则叫做不完整汉字二叉树。如附图(3)-a就是汉字“照”的完整汉字二叉树图。汉字二叉树编码就是建立在汉字二叉树理论基础上的,利用汉字二叉树特点进行编码的一种编码方案,由于选择编码字元的规则不一样等,可以产生多种具体的汉字二叉树编码,但不论是哪种具体的编码,其一般编码规则反映在汉字二叉树上都具有统一的规律性,不直接受具体字形的影响,而已有的各种汉字编码一般不具备这一特点。如“照”和“调”的一种二叉树二元笔形码分别是“JYH”和“VUD”,这种三元笔形码的一般编码规则反映在汉字二叉树上就是按照从矮叶子字元到高叶子字元,从所有左叶子字元到右本文档来自技高网...

【技术保护点】
汉字多功能编码键盘用标准键盘中二十六个英文字符键表示三十七个中文字元、二十六个拼音字符和三个数字,对于中文字元,由于主要采用实虚笔画相结合的方法,以及相似变体和贯用读音的方法,使键盘清晰、记忆量小,表示能力强,适用范围广。

【技术特征摘要】

【专利技术属性】
技术研发人员:周耀瑜
申请(专利权)人:周耀瑜
类型:发明
国别省市:45[中国|广西]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1