一种汉字编码,其特点是:用英文大写或小写字母来表示汉字构件(包括部分偏旁),并构成基本汉字形音码码源表,以此对汉字取前二位码,第三位码为该汉字的拼音首字母。本发明专利技术的汉字编码具有易记易学、拆码快速、简易、汉字输入或检索速度高等优点。(*该技术在2009年保护过期,可自由使用*)
【技术实现步骤摘要】
本专利技术涉及汉字的一种编码。国内目前已有汉字编码700余种,已在计算机上使用的汉字编码也有100余种,包括常见的拼音码、首尾码、双拼码、五笔字型码、五笔画等。这些编码均未能较好地同时解决汉字拆码的简易性、检索或键入汉字的快速性以及编码的易记易学三方面的矛盾。如拼音码,虽简单易学,但使用起来检索或汉字输入速度都较慢;首尾码、五笔字型码等虽能实现计算机汉字快速输入,但使用这些编码汉字拆码难,记忆规律差。其它各种编码也存在上述这样或那样的缺陷。本专利技术的目的在于提供一种既易学易记又能快速拆码快速输入或检索,同时在键盘上无需标设中文构件(或偏旁)的汉字编码。本专利技术是这样实现的,利用汉字构件(或偏旁)与英文大写或小写字母之间的象形关系,用A-Z26个英文大写或小写字母首先来表示那些构字量较多的汉字构件(或偏旁),如用字母A作为钅、金、全、 等的象形码;用字母O作为口、 、母等的象形码。对少数汉字偏旁很难找到有象形关系的对应英文字母。如氵、冫、灬、木等偏旁,则将该偏旁名的拼音首字母作为其拼音码。如氵、冫、灬的偏旁名为水,则将水的拼音首字母S作为拼音码,木偏旁的拼音首字母为M则将M(m)作为木的拼音码。按这样的规则便形成了汉字形音码码源表,由于汉字的构件、偏旁很多,超过了280个,为简单起见,对出现几率较少的汉字构件、偏旁采取了对照分配,即分配给其与其形似的占字量较多的构件、偏旁的形音码,如“ ”按“儿”的形音码分配,“禾”按“木”的形音码分配。这类汉字构件、偏旁已置于汉字形音码码源表中与其有对照分配关系的汉字构件、偏旁之后并用括号括了起来。按照本专利技术的汉字编码,每个汉字均由三位码元组成,每个汉字不论笔划多少,都要首先拆为两个构件(或偏旁),包括最简单的汉字“一”也不例外,然后依本专利技术的汉字形音码码源表,取该汉字的前二位码,前二位码可以是象形码或是拼音码或是两者的混合,该汉字的第三位码只取汉字的拼音首字母。取码时是依照汉字字形按先左(上)后右(下)、先外后内,并优先汉字构件(或偏旁)笔划多者的原则取码。例先左(上)后右(下)都 拆为土、阝,取码tpd天拆为 ,取码fnt语 拆为讠、口,取码ioy面 拆为丆、囗,取码tom先外后内国 拆为囗、王,取码oeg圆 拆为囗、人,取码ory幽 拆为凵、幺,取码uwy继拆为幺、 ,取码wlj笔画多者优先鉴 拆为刂、金而不是刂、王,取码haj牛拆为丿、 而不是丿、十,取码jfn吉 拆为士、口而不是十、口,取码toj简单字拆码例一 拆为一、一,取码iiy火拆为丶、 ,取码dkh女 拆为乂、乂,取码xxn丰拆为 、十,取码fxf人拆为丿、 ,取码jnr本专利技术的汉字编码与已有汉字编码相比,具有可以见字识码,易记易学,检索或键入汉字速度高,拆码简易等优点,可以直接利用ASCⅡ键盘进行汉字输入,无需在键盘上标设汉字构件或偏旁。由于采取三位等长码,出错几率低,绝对重码率仅为31.15%,最高绝对重码字数小于9个,无须翻页检找,可以实现计算机盲导快速输入。该编码也可扩展应用于词组。本专利技术的汉字编码主要为计算机汉字输入而设计,已经完成了其在操作系统水平上的软件实现,该编码也可以用于字典检索,并可提高检索速度。由于编码全部采用英文字母,也能提高英语国家汉字输入人员的工作效率。权利要求1.一种通用的汉字形音三位等长编码,其特征在于用英文大写或小写字母来表示汉字构件(包括部分偏旁);码源由象形码(依汉字构件与英文字母的象形关系构成)及拼音码(由少量汉字偏旁的拼音首字母构成)组成;每一汉字拆为两个构件(或偏旁),由其象形码或拼音码或两者混合构成该汉字的前二位码元,另加上该汉字的拼音首字母作为第三位码元。2.根据权利要求1所述的汉字编码,其特征在于码源与英文字母间具有下表所列的对应关系(附文后)。3.根据权利要求1所述的汉字编码,其特征在于每个汉字无论笔划多少,都要拆为二个构件(或偏旁),然后对其取码,包括最简单的汉字“一”也不例外。4.根据权利要求1所述的汉字编码,其特征在于每个汉字前二位码的取码原则为先左(上)后右(下),先外后内,汉字构件(或偏旁)笔划多者优先取码,第三位码只取该汉字的拼音首字母。5.根据权利要求1所述的汉字编码,其特征在于汉字偏旁若无对应的象形码,则用该偏旁名称的拼音首字母作为其拼音码,然后按规定的原则对汉字编码。如冫、氵、灬等用水的拼音首字母S作为其拼音码,犭则用犬的拼音首字母Q(q)作为其拼音码。全文摘要一种汉字编码,其特点是用英文大写或小写字母来表示汉字构件(包括部分偏旁),并构成基本汉字形音码码源表,以此对汉字取前二位码,第三位码为该汉字的拼音首字母。本专利技术的汉字编码具有易记易学、拆码快速、简易、汉字输入或检索速度高等优点。文档编号G06F3/023GK1049565SQ8910646公开日1991年2月27日 申请日期1989年8月15日 优先权日1989年8月15日专利技术者张云云, 蒋鸿芬 申请人:西北轻工业学院 本文档来自技高网...
【技术保护点】
一种通用的汉字形音三位等长编码,其特征在于用英文大写或小写字母来表示汉字构件(包括部分偏旁);码源由象形码(依汉字构件与英文字母的象形关系构成)及拼音码(由少量汉字偏旁的拼音首字母构成)组成;每一汉字拆为两个构件(或偏旁),由其象形码或拼音码或两者混合构成该汉字的前二位码元,另加上该汉字的拼音首字母作为第三位码元。
【技术特征摘要】
【专利技术属性】
技术研发人员:张云云,蒋鸿芬,
申请(专利权)人:西北轻工业学院,
类型:发明
国别省市:61[中国|陕西]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。