当前位置: 首页 > 专利查询>张天光专利>正文

通用字元汉字排检、输入法及键盘制造技术

技术编号:2890687 阅读:235 留言:0更新日期:2012-04-11 18:40
一套用于汉字排检(排序与检字)和中文信息处理的通用字元(98个)及键盘。本发明专利技术把字元组成了规整、压韵的诗句,使字元具有了易记性、有序性和确定性,把字元用于汉字排检,可使中文辞书、图书目录像英文那样实现直接查检,而不需数笔画或查检字表,也不必知道字的读音;把字元按读音放在计算机键盘上,可构成易学、规范、快速的全形码、音形码和音形兼容码,供不同用户(懂拼音或不懂拼音)使用,从而使中文输入真正面向了大众。(*该技术在2015年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术用于汉字排检(排序与检字)和计算机(或其它机器)中文信息处理。汉字由于不能按形读音,所以在检索方面必须有按形和按音两种排序;在计算机信息处理方面,必须有按形和按音两种输入法。汉字音节数(不带调约400多个)比字数少得多,而产生很多同音字(重码),为区分同音字,需在拼音的基础上增加字形信息,这样就形成了汉字的音形序和音形码,但从本质上讲,它们仍属于音序和音码。在汉字检索方面(指手工操作),目前主要有拼音法、部首法、笔画法和号码法。张天光先生在专利技术专利申请《中文检索与编码通用字元(部首)及键盘》(94102084.3,公开号CN1104351A)中提出了通用字元检字法。拼音法是一种类似英文的排序法,具有直接查检的优点,但汉字同音字多,因而影响了检字速度。再者,如不知字的读音,此法就无法使用。部首法需要先确定部首,需要数部首的笔画和所查字除去部首部分的笔画,还要到检字表里查字的页码,要三四步才能完成。另外,此法还存在部首位置不易确定的问题。已故王竹溪教授搞出的顺序部首法也属于部首法(《新部首大字典》,王竹溪,上海翻译出版公司,1988)。王先生用56个部首按先高后低、先左后右等规则(但不是按笔顺)给汉字排序。此法虽有直接查检和重码少的特点,但检字规则与汉字的笔顺相冲突,且规则应用不统一,特例多,故难以推广。另外,56个部首之间虽然有序,可按歌谣记忆,但并不押韵。笔画法需要先数汉字的笔画,再按前两笔的笔形一丨丿丶乛查找。此法重码很多,且数笔画既花时间也容易出错。号码法主要有四角号码法。张国防先生已获专利的“五十字元法”也属于号码法。四角号码法把汉字的笔形分为十类,用0~9十个数码表示。五十字元法从汉字中分解出50个字元,归为26类,用英文的26个字母表示(整套字元没有次序,故只能依附在英文字母上)。此类方法都是用汉字四个角或三个角的笔形进行编码、排序。号码法虽有速度较快、重码较少的特点,但由于汉字结构比较复杂,很难用10种或26种笔形准确表达,再加上这类方法规则多,难以掌握,所以用起来并不方便。另外,各种号码法都存在“号码转换”的问题,即笔形→号码→检字。这不能不说是一种负担。张天光先生专利技术的通用字元法采用英文的检字原理,从汉字中优选出84个字元(构字单元),作为汉字的“字母”,用于分析、拼写、查检所有汉字。如,“明”查日月,“境”查土立日儿,等等。通用字元法使汉字实现了直接查检,即直接查字典的正文,不需数笔画、不需把汉字的笔形转换为数字或英文字母,也不必知道字的读音。它依照汉字的书写笔顺提取字元,符合人们日常的书写习惯和国家语言文字规范,在国内外首次实现了汉字的分析、排检、计算机输入和识字教学四者的统一,是目前国内外最优秀的汉字字形排检法。随着通用字元法在字典排检和计算机上的应用,它也显露出了一点美中不足,即字元选84个稍微少了一点,使得有些字的分析不够直观。如,“新”为立木厂丨,“非”为丨二一一。在计算机中文输入方面,目前主要有拼音码、五笔字型、自然码和张天光先生的通用字元码(含全形码和音形码)。拼音码方便好用,但重码多,且不知读音时就无法使用(智能技术的作用也是有限的)。五笔字型依形编码,重码少、速度快,但难以为大众所掌握,因为一方面它的编码规则繁杂,另一方面,字根由于数量太多(约两百多个)而产生了不确定性。不确定性指字元本身的不确定,即不知道某笔形是不是编码字元(因为记不住),或指字元在键盘上的位置(键位)不确定。五笔字型既有字元不确定的问题,也有字元键位不确定的问题(即不知道字根在某区的哪个键上,需逐键查找)。自然码码长短、速度较快,但表形的部首数量太多(约两百多个),很多部首没有读音,无法按音放在键盘上,因而部首和键位都难以记忆,也具有不确定性(绝大多数用自然码的人用的其实都是它的音码部分)。通用字元码字元少、码长短、速度快,规则只有“取大少连,兼顾直观”一句话,按笔顺提取字元符合人们日常的书写习惯和国家语言文字规范,在国内外首次实现了汉字的分析、排检、计算机输入和识字教学四者的统一,是目前国内外最优秀的汉字形码输入法和音形码输入法。随着通用字元码在计算机上的应用,它也显露出了美中不足字元选84个稍微少了一点,使得有些字的分析不够直观,如,“新”为立木厂丨,“非”为丨二一一;全形声码有两个字元(骨、舟)未按规定(读音的声母)放在键盘上,造成特例;全形声码右手上排字母键负担稍重一些。本专利技术的目的是,在通用字元法84个字元的基础上增加一些字元,使通用字元法在字元记忆难度增加不大的条件下,显著地改善其性能;字元全部按音放入键盘,消除例外;精选增加的字元,使各键的负担平衡、合理;重新布置韵母,使通用字元法的音形码在输入无声母字词(啊、安、昂等)时在国内外首次实现规则的统一。本专利技术是这样实现的通过对汉字的构成进行分析,从使用频度高低、构字重码多少、键位布置是否平衡合理等几方面考虑,优选出增加的14个字元(共计98个)。本专利技术的特点是,整套字元组成了规整、押韵的诗句,字元在诗句中的位置就是字元之间的前后次序,用这套字元分析、查检、输入汉字时,比84个更直观、键位负担更合理,且记忆难度几乎没有增加;音形码的声母键zh、ch和韵母键ai、ang、ao、en、er作了调整,实现了无声母字词双拼规则的完全统一。优选出的字元,其数目可依诗句的格式(五言、七言等)和长短而不同,笔者认为98个最为理想。理由如下汉字由一丨丿丶等30多个基本笔画(类似于英文的字母)按先上后下、先左后右等书写规则构成。这些基本笔画又构成汉字的两百多个基本笔形,称为字元或部首。因此,汉字也可以说是由两百多个字元(类似于英文的字母)按书写规则(笔顺)拼写而成的。字元选的越少,就越容易记忆,在计算机键盘上也容易安排,但汉字编码的码长就越长(如用简码则重码就会很多),字的分析就越不直观(汉字都变成了没有意义的笔画符号),用起来就不会便捷;字元选的越多,汉字的码长就会越短,字的分析就越直观,但记忆就越困难,字元之间也就难以成序。笔者经过对汉字的构成进行分析,从使用频度高、构字重码少、中文排检与中文输入(编码)完全一致、键位负担平衡合理等几方面考虑,经过反复挑选、反复编码,从两百多个字元中优选出98个(图1)。为便于记忆,将它们组成了14句押韵的七言诗。所有汉字(包括繁体)按这98个字元的次序依规则(笔顺、角形等)进行排序或编码。下面的诗句可用来帮助记忆(助记字的读音即为字元的读音)横竖撇点弯折乙,八人寸土草木稀。子口之言益工厂,日月似火止山雨。王力冰心示宝弓,十车丝巾包儿女。方头大耳目又小,金佛老舅气长须。匕戈斤刀禾几片,手足非围尸虎皮?病虫革门食竹骨,水鸟二爪立田西。牛羊同舟叉鱼贝,犬马私盖风雪衣。优选出的字元因为有序,故可按规则——笔顺、角形等,直接进行汉字的排检,而不需再把字元转换为英文字母码(如五十字元法、表形码等)或数字码(如四角号码法、唯物码等)。依照字形可构成汉字的全形序;依照拼音和字形可构成音形序。全形序——现结合98字元表(图1),把全形序按笔顺提取字元的排检方法说明如下排检方法所有汉字都由这98个字元按笔顺拼写而成,并按字元表排列成序。如“明”由“日月”构成,“曼”由“日四又”构成,“晶”由“日日日”构成本文档来自技高网...

【技术保护点】
一套用于汉字排检(排序与检字)和编码的优选字元(部首),组成了规整、压韵的诗句,具有类似英文字母的有序性,用于汉字排检和编码具有易记性和确定性,其特征在于优选字元的数目是98个,构成14句七言诗。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:张天光
申请(专利权)人:张天光
类型:发明
国别省市:41[中国|河南]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1