当前位置: 首页 > 专利查询>喻新堡专利>正文

八码笔顺笔画汉字编码方法技术

技术编号:2884170 阅读:518 留言:0更新日期:2012-04-11 18:40
一种汉字笔顺笔画编码方法,它把汉字笔画分成8种,即横、竖、钩、撇、点,左折、右折、复折,按书写汉字的笔画顺序,对每一笔画赋于笔画符号,组成该汉字的不定长编码,上述8种笔画符号可以对应计算机键盘中的8个键。本发明专利技术具有重码率较低,编码规则简明的特点,可用于计算机汉字输入及对汉字进行排序。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种汉字编码方法,是一种选用汉字八种基本笔画为码元,按照汉字的笔顺、笔画构成汉字的不定长编码的方法。现有的汉字编码方法中,音码重码率较高,形码、音形码的编码规则都比较复杂,学习、使用较困难。已有的五种笔画汉字编码方法,码元太少,重码率较高。本专利技术的目的在于提供一种重码率较低,编码规则简明,可用于计算机键盘输入的汉字编码方法。本专利技术的技术方案是以国家语言文字工作委员会制定颁布的《现代汉字通用字笔顺规范》、现代汉语通用字表》为根据,把汉字的笔画分为8类,作为码元1、横符号为一包括 (提)一(横)2、竖符号为丨包括丨(竖)3、钩符号为包括(竖钩)4、撇符号为丿包括丿(撇)5、点符号为、包括丶(点)(捺)6、左折符号为 包括  及其他起笔后向左偏折的单折笔画7、右折符号为 包括 及其他起笔后向右偏折的单折笔画8、复折符号为Z包括 ㄋ二折及其以上折的折笔画按书写汉字的笔画顺序,对每一笔画赋于笔画符号定义中对应的一符号,组成该汉字的编码。上述8种笔画符号可以对应计算机键盘中的某一键。进一步还可以规定上述8种笔画符号对应计算机键盘的右边的数字键区上的1-8个数字键。例如汉字“工”编码为一丨一,对应数字键则编码为121。汉字“丰”编码为一一一丨,对应数字键则编码为1112。本专利技术汉字编码方法具有码元少,编码规则简明,重码率低等优点。根据对“信息交换用汉字编码字符集·基本集”(GB2312-80)的6763个汉字进行编码结果,出现四字的同码字2组,三字的同码字13组,二字的同码字91组,静态重码率为1.8%。本专利技术编码方法,以国家统一规范的汉字笔顺笔画为标准,通过学习与应用本专利技术的汉字编码方法,可推动和促进我国文字规范化、标准化建设。本专利技术编码方法还可以方便地实现对汉字进行排序。我们首先设定笔画符号顺序,如顺序依次设定为一、丨、、丿、丶、 、L、Z。然后对不同汉字的编码从左到右逐符位进行比较,本位符号相同,则比较下一位,下一位是空的则排在非空位字的前面。字的顺序与编码的长度(也即笔画数)无关。例如“刀”、“才”、“木”三个字它们的编码分别为 丿、一亅丿、一、丨丿、,因此它们的排序为木、才、刀。本专利技术汉字编码方法用于汉字排序时,比现有的按笔画数多少排序方便,比部首排序法省事,比音序法因同序字少而容易确定。它用于中文图书、资料检索,字典编纂和使用,姓氏排序等,必定极为方便和快捷,不逊于拼音文字检索。如果为了免去对笔画符号顺序的记忆,利用已经熟悉的数字顺序,也可将笔画符号转换成对应的数字,这样看见数字就能知道汉字的前后了。在这里是从左至右逐位地比较数字的大小,而不是比较整个数字数值的大小。只是这种转换成数字的办法还得要记住数字与笔画符号的对应,从记忆负担上看,与不转换相当。为进一步减少同序字,增加定序的确定性,本设计对少数同码字制定如下排序次规则A设定部分笔画符号中所含不同笔画(称子笔画)的顺序(左前右后)一中 一、中丶 中 L中 LZ中 ㄋ如果子笔画也相同的不同汉字,则设定“先短后长”的原则(上述子笔画的顺序同样贯彻了这一原则),比较笔画的比例长度。B、两同码字比较时,总的步骤是先从首笔画开始比较能否区别,若能区别,则作出排序,余下的笔画不再考虑;不能区别,则再比较第二笔画,以此类推,直至遇可区分笔画为止。具体比较时,注意到a、若两字中有子笔画的不同,则先比较子笔画。如下面几组同码字的排序分别是孑子 冷这 匀丹 外处 贝冈 戊龙 凡及b、若两字中子笔画也相同,则再从首笔画起,依次比较对应笔画的比例长度。如下面几组同码又同子笔画字的排序分别是未末 己已巳 亓开井 旦目且 刀力 景晾 岂屺以此次规则再对基本字集中少数同序字进行排序,除两组二字组外,其余均可区分排序,重序率降至不到万之三,较好地确立了汉字排序的规定性。下面提供一字典正文页面样式设计仿照拼音文字字典格式,在左、右页面边空(或天头左、右)标注出本页面首(或末)字的符码(或数码),以利根据符码(或数码)顺序确定所找字的位置。示意如附图下面结合实施例对本专利技术作进一步描述本专利技术汉字编码方法作为计算机汉字键盘输入码用时,可以用右手在标准键盘上右边的键区操作,模仿写字过程,一画一键输入。8种笔画符号与数字键的对应可为一-1、丨-2、-3、丿-4、丶-5、 -6、L-7、Z-8。输入完字的最后一画后,可用大拇指击数字“0”键,作为结束出字。为提高输入速度,还可以对部分高频字,先击数字“9”键,再击1至2个其他健,即可输入某高频字。对部分常用四画以上汉字的偏傍部首,(位于字左和上部的),在输入1至2画后,再击“9”键,即完成该偏傍部首的输入。本专利技术汉字输入方法,也可以设计专用输入键盘,使汉字输入更显直观与方便。权利要求1.一种汉字笔顺笔画编码方法,其特征在于把汉字笔画分成8类(八码元)(1)横符号为一 包括 (提)一(横)(2)竖符号为丨 包括丨(竖)(3)钩符号为 包括(竖钩)(4)撇符号为丿 包括丿(撇)(5)点符号为、 包括丶(点)(捺)(6)左折符号为 包括  及其他起笔后向左偏折的单折笔画(7)右折符号为 包括 及其他起笔后向右偏折的单折笔画(8)复折符号为Z包括 ㄋ二折及其以上折的折笔画根据上述8类笔画,按书写汉字的笔画顺序,对每一笔画赋于笔画符号,组成该汉字的不定长编码,上述8种笔画符号可以对应计算机键盘中的8个键。2.一种如权利要求1所述的汉字笔顺笔画编码方法,其特征在于按《现代汉字通用字笔顺规范》中的书写汉字的笔画顺序,对每一笔画赋于笔画符号,上述8种笔画符号可以对应计算机键盘上的右边的数字键盘上的1-8个数字键,依次为一-1、丨-2、-3、丿-4、丶-5、 -6、L-7、Z-8。全文摘要一种汉字笔顺笔画编码方法,它把汉字笔画分成8种,即横、竖、钩、撇、点,左折、右折、复折,按书写汉字的笔画顺序,对每一笔画赋于笔画符号,组成该汉字的不定长编码,上述8种笔画符号可以对应计算机键盘中的8个键。本专利技术具有重码率较低,编码规则简明的特点,可用于计算机汉字输入及对汉字进行排序。文档编号G06F3/023GK1307263SQ0010148公开日2001年8月8日 申请日期2000年2月1日 优先权日2000年2月1日专利技术者喻新堡 申请人:喻新堡本文档来自技高网...

【技术保护点】
一种汉字笔顺笔画编码方法,其特征在于把汉字笔画分成8类(八码元):(1)横:符号为一 包括:*(提)一(横)(2)竖:符号为丨 包括:丨(竖)(3)钩:符号为* 包括:*(竖钩)(4)撇:符号为丿 包括:丿(撇)(5)点 :符号为丶 包括:丶(点)*(捺)(6)左折:符号为フ 包括:フ┐**及其他起笔后向左偏折的单折笔画(7)右折:符号为└ 包括:*ㄥ**及其他起笔后向右偏折的单折笔画(8)复折:符号为Z 包括:*ㄟㄣㄋ二折及其以上折的折笔画 根据上述8类笔画,按书写汉字的笔画顺序,对每一笔画赋于笔画符号,组成该汉字的不定长编码,上述8种笔画符号可以对应计算机键盘中的8个键。

【技术特征摘要】

【专利技术属性】
技术研发人员:喻新堡
申请(专利权)人:喻新堡
类型:发明
国别省市:36[中国|江西]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1