当前位置: 首页 > 专利查询>潘英专利>正文

汉字编码方案制造技术

技术编号:2890946 阅读:286 留言:0更新日期:2012-04-11 18:40
该汉字编码方案提供了一个完整的汉字排序检索方法,对汉字以读音代码为主关键字段、字形代码为次关键字段进行音形序排列,和以字形代码为主关键字段、读音代码为次关键字段进行形音序排列,分别解决已知读音、已知字形都可排序。同出一则,一个用于计算机汉字输入的编码方法,使用了具有特定韵母代码的双拼代码和与前面相同的字形代码,键盘设计有序、对称和统一。(*该技术在2015年保护过期,可自由使用*)

【技术实现步骤摘要】
本方案可作为汉字排序及计算机汉字输入或有关汉字编码的一种方法。现有的一些编码方案a.对于汉字排序,有单纯以读音为序的,这样排序不能将相同读音下的汉字进行排序;有以偏旁部首为序的,有以笔画数为序的,这两种排序都涉及笔画数,检索效率非常低下。b.而使用于计算机输入等的一些编码方案,要么码元数量大、要么编码规则多、要么键盘利用不够合理、记忆量大或不便于记忆,使学习者感到头痛,要么重码率高,影响输入速度。本方案目的在于a.提供一个完整的汉字排序编码方案,以解决同音字的排序,和改变以偏旁部首及笔画数为序的排序方法,实现全排序和更快速检索;b.提供一个用于计算机输入等的汉字编码方案,其码元数量小、键位规范统一,编码规则少。而且两个方案有着共同的部分。方案的构成如下A.汉字排序编码方案1.以汉字读音代码为主关键字段、字形代码为次关键字段的音形序排列方法,即,首先将汉字以读音代码为序进行排列,对于同音字再以字形代码为序进行排列;如以汉语拼音+字形代码为关键字段,…汗han 44112---在前汉han 4454----在后……世纪shiji 1221-----在前事迹shiji 1251-----在后…以此解决已知读音汉字的排序和检索,同音字词也有序可查,并且不涉及笔画数。2.以字形代码为主关键字段、读音代码为次关键字段的形音序排列方法,即,首先以字形代码为序进行排列,对于同形字再以读音代码为序进行排列;如以字形代码+汉语拼音为关键字段, 以此解决已知字形汉字的排序和检索,它不涉及笔画数,同形字也有序可依。两种排序即音形序和形音序的排序关键字段,因素相同、次序相反;是互补的、一整套的汉字排序、检索方案。以上所涉及的字形代码在本说明书中是共同的,在以后有专门描述,见C.。B.用于计算机输入等的汉字编码方案它是一个包含双拼代码的汉字编码方案,双拼代码由拼音声母代码或首字母加韵母代码构成,其中的韵母代码定义如下(键盘左段) (键盘右段)韵母------代码 韵母------代码(键盘上行)a---------T ia ua------Yai---------R ian uai----Uan---------E van uan----Iang--------W iang uang--Oao---------Q iao--------P(键盘中行)e---------G ie---------Hei---------F i----------Jen---------D in---------Keng--------S ing--------Ler ou------A;(键盘下行)u---------B iu---------Nui v------V ve---------Mun vn-----C ,ong iong---X 、uo o------Z /对照双拼键盘(见附表),韵母在键盘中的分布有很多规律可寻有序性自上而下的习惯序性、自然序性和从中央到两边的自然序性;对称性与左侧韵母对应的复韵母对称分布在右侧(ian、i、ve除外);统一性如,以i结尾的韵母均在第二列(包括i),以n结尾的韵母均在第三列,以g结尾的韵母均在第四列,以o结尾的韵母均在第五列(包括o),含a的韵母分布在键盘上行,含e的韵母分布在键盘中行(ve除外),含o的韵母在键盘的左下角,…所有的韵母都可以找到助记规律,如ve为v的复韵母并与其对称分布;ia之后是ian;ao之下是ou;o与uo读音相近…利用英文键盘的26个字母键如此安排,使双拼代码的记忆量达到最低点。编码规则如下全码 简码多字词SSSS三字词SSSYSSS双字词SYSYSSY SS单字词SYXXSYX SYS单字词\XXX\XX \X其中多字词编码为一二三末字的拼音首字母或声母;三字词编码为各字的拼音首字母或声母加末字韵母;双字词编码为首字双拼代码加末字双拼代码;单字词编码为双拼代码加字形代码;单字词形码输入方式为引导键\加字形代码。简码为全码的不完全输入方式。字形代码在以后有专门描述(见C.)。编码举例全码 简码中国人民 ZGRM(Zong Guo Ren Min)中国人 ZGRD(Zong Guo Ren en )ZGR中国 ZXGZ(Zong ong Guo uo )ZGZ ZXG ZG中 ZXPR(Zong ong 25 12 )ZXP ZX Z人 RDS (Ren en 34 )RD R一 YJT (Yii 1 )YJ Y国 \PTY(\25 11 21 )C.字形代码将汉字按上下、左右、外内分为两个部分,第一部分的首两笔画代码为该汉字的首码,第二部分的首两笔画代码为该汉字的次码,将第二部分继续分为两个部分,这时,后一部分的首两笔画代码为该汉字的尾码;当取码对象的第一部件为单笔画、第二部件为多笔画时,取单笔画码;对于独体字,依笔画顺序取码;汉字单笔画码,按横(提)、竖、撇、捺(点)、折分为五种,代码分别为1、2、3、4、5;汉字双笔画码,按前五种笔画任意两笔画的组合,分为25种,代码分别为11、12、13、14、15、21、22、…、54、55。字形代码=首码+次码(+尾码)字形代码键位如下QWERTYUIOP15 14 13 12 11 21 22 23 24 25ASDFGHJKL;35 34 33 32 31 41 42 43 44ZXCVBNM,、/55 54 53 52 51 45单笔画代码1、2、3、4、5分别在11、21、31、41、51键位上。如此布局,规律性强,与双拼键盘相协调统一(见附表),并且不对任何字形代码做特殊键位调整,记忆量小,且双笔画码信息量大,减少重码。字形代码同时被应用于汉字排序编码和计算机输入等的编码之中,它可以单独实现对汉字的一种排序和一种输入,可不涉及笔画数。附表双拼键盘表权利要求1.一个汉字(排序)编码方案,其特征在于具有以汉字读音代码为主关键字段、字形代码为次关键字段的音形序排列,和以字形代码为主关键字段、读音代码为次关键字段的形音序排列两种方法。2.根据权利要求1所述的编码,其特征在于读音代码为汉语读音代码。3.根据权利要求1所述的编码,其特征在于读音代码为日语读音代码。4.根据权利要求1、2、3所述的编码,其特征在于字形代码=首码+次码(+尾码)。5.一个包含双拼代码的汉字编码(方案),其特征在于双拼代码中韵母代码的定义如下(键盘左段)(键盘右段)韵母------代码 韵母--------代码(键盘上行)a---------T ia ua---Yai---------Rian uai---Uan---------Evan uan---Iang--------Wiang uang---Oao---------Qiao---------P(键盘中行)e----------Gie----------Hei---------Fi-----------Jen---------Din----------Keng--------Sing---------Ler ou---本文档来自技高网...

【技术保护点】
一个汉字(排序)编码方案,其特征在于:具有以汉字读音代码为主关键字段、字形代码为次关键字段的音形序排列,和以字形代码为主关键字段、读音代码为次关键字段的形音序排列两种方法。2.根据权利要求1所述的编码,其特征在于:读音代码为汉语读音代码。

【技术特征摘要】

【专利技术属性】
技术研发人员:潘英
申请(专利权)人:潘英
类型:发明
国别省市:21[中国|辽宁]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1