当前位置: 首页 > 专利查询>单茵专利>正文

结构字中字汉字编码法制造技术

技术编号:2891916 阅读:276 留言:0更新日期:2012-04-11 18:40
本发明专利技术利用汉字偏旁、部首的习惯名称,形态特点,和汉字的结构特点,汉字中有汉字的特点,区分出不同结构,将结构音和结构中字中字拆出组成编码,是一种简单易学,将字典检索和计算机汉字输入联系起来,既能推广、普及,又能快速编码的一种汉字编码方法。(*该技术在2014年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术属于一种汉字编码技术,可应用于计算机汉字输入和字典的检索,及一切需采用汉字编码的领域。随着计算机的广泛应用,世界已进入了一个新的信息处理与传递的阶段,但在我国汉字输入却成了制约计算机广泛应用的主要矛盾。为了解决这一矛盾,全国许多专家、学者经过刻苦钻研,提出了许多不同的编码方案,使得这一主要矛盾正朝着逐步解决的方向转化。但总的说来仍有“打得快的不好学,好学的打不快”这一问题的存在。打得快不好学,主要指取码规则太多,不易记,好学的打不快是指规则虽少,但重码太多,输入慢。要使计算机在全国广泛应用,必须做到编码和中小学语言教学有机的结合起来,使得小学生在学汉字的同时也学会了编码。本专利技术的目的是提供一种新型的编码方案,在符合国家文字规范的前提下,利用汉字本身所包含的信息,即利用汉字的结构特点、字中字的规律,和传统的偏旁、部首名称、特点而制定出的容易记忆、容易编码,重码少、输入快的汉字编码方案。本方案的技术解决方案是利用汉字的结构分布特点,汉字内又有汉字,常用偏旁、部首,有一定的名称,或可以根据形态特点加以归类的特点,充分利用计算机现有键盘而进行编码,输入汉字。本方案有字码、词码两种,超过一个字的即为词码,词码除具有上述特点外,还增加了声调、简易笔划和词性等信息进行编码。一、单字编码(一)区分不同结构、独体字、合体字、组字结构本编码将汉字按结构的不同分为独体结构、两结构、三结构。由独体结构组成的字称为独体字。由两结构、三结构组成的字称为合体字。合体字中的每一结构称为组字结构,组字结构的笔划不得少于两笔。 三结构只有左、中、右结构 游锻独体结构,分不出上、下,左、右,左、中、左,包围结构的字为独体结构,也称独体字。如丁、乃、乘。(二)取码规则(1)编码符号采用为汉语拼音的声母,与计算机键盘上的英文字母一一对应。(2)取每个字读音的声母作编码,如“彳”为一偏旁,读作“双人”,因而编码符号是sr。(3)卷舌音均归于非卷舌音,如ch→c sh→s zh→z(4)取码的基本步骤是先区分不同结构,决定取码数目,再读组字结构音,拆出结构字中字。取码规则可分为一般取码取码规则可分为一般取码规则和特殊取码规则,一般取码规则简单易学,而掌握了特殊取码规则,则能加快输入速度。1、一般取码规则(1)偏旁、部首、笔划读双音或单音。①按习惯名称读如亻→单人→dr(r) 彳→双人→sr(r)②整字中拆字即整字音加上拆出的字的音如目→目日→mr(m) 良→良艮→lg(l)③整字音加第一笔划音整字中拆不出字,以第一笔划代替如文→文点→wd(w) 四→四竖→ss④由二个笔划组成,但无习惯名称,也不是字时可按序读笔划音,此时常无单音,只有双音如→撇横→ph 亠→点横→dh⑤形状结构相近的归于一类如两边包围,一边为撇时,都把第二个音读成披→p,厂→厂披→cp 户→户披→hp 疒→病披→bp⑥上述四条规则都不能应用时拆成两部分如酉→西横→xh →八夫→bf 采→撇米→pm⑦有五个偏旁、部首,作为成字能力很强的结构,可以看成是单独的字,在拆字时可以将其作为字拆出,其余拆出的字都必须是汉字。聿→jx→(读津的音,拆出彐字)厶→mz(读么的音,拆出第一笔) →zs(读走的音,拆出第一笔)彐→xz(读雪的音,拆出第一笔) →qp(读欠的音,拆出第一笔)(2)区分不同的结构,决定取码数目①两结构字,每一结构读两音,共四音,如取→ehyz②三结构字、三个独体字,每一结构读一音,共三音,如晰→rmj③独体结构读两音 如本→bm(3)读组字结构音,拆结构字中字A、四音字四音字均为两结构字,每一结构读两个音。①偏旁、部首、笔划按名称读两音如扌→提手→ts②组字结构若为完整汉字,先读该字音,再读拆出的字中字音,拆字以结构优先,取大优先,顺序优先为原则。如寂中的组字结构“叔”为一完整汉字,可以拆出上、小、又三个汉字,但上和小一起构成“叔”的左结构,而“又”字单独构成了“叔”字的右结构,因此拆出“又”字,故寂的编码为bgsy③组字结构若不为字,也非偏旁、部首,则先以“a”代替,再拆结构字中字。如唢中的组字结构“ ”不是汉字,也不是偏旁、部首,故先读作“a”再拆出“贝”字,因此唢的编码为ksab。④若拆不出字中字,可用第一笔划代替。如唢中的“口”先读“口”再拆出第一笔划“竖”,故唢的编码为ksab。⑤组字结构不为字,但由两个独体字组成,可依次读出两个独体字的音。若由不相连的一个笔划和一个独体字组成,也可依次读出两个音。如设中的组字结构“殳”读作几、又→jy宅中的组字结构“乇”读作撇、七→pq⑥相同或相反的两个组字结构组成的字可连续该组字结构的字音,若不为字可连续整字音,或以a代替。如比→bb 兆→zz 棘→jj或aa⑦聿、彐、 、厶为组字能力很强的偏旁、部首,可作为汉字拆出,其余拆出的字一律要为汉字。B三音字①偏旁、部首、笔划读单音,如阝→耳→e 卩→耳→e②组字结构为完整汉字,则读该字音,如例中的“歹”读作d。③组字结构不为字也非偏旁、部首和笔划,以a代替。如 候→rsa④三个独体字不管以何种方式排列,均按序读字音如 塾→享、丸、土→xwtC二音字先读整字音,再拆字中字,若无字中字,以第一笔划来代替。如叉→叉又→cy 央→央、大→yd。2、特殊取码规则(1)两个相同的组字结构加其他结构组成的字,可按序读三个音。如翠→习、习、卒→xxz 若按两结构读音则为羽、习、卒、从→yxzc。(2)组字结构由3个以上相同成分构成时可用数表示。如缀中的叕→读作“四又”→编码为“sy”。(3)有些结构可用常用汉字来表示如“畐”可读成“福”→f、“副”按一般编码规则为atld,用常用字音代替则为ftld。(4)衣字拆开,中间加入一组字结构,可读作衣中“”如裹→衣中果→yzg。(三)主码与副码按一般读音规则得到的编码称为主码,通常只有一个,按特殊规则,或随意拆字所获得的编码称为副码,有重码时,按一定规则进行编码,所获得的编码也属副码,故副码可以有多个。如畐可拆出口、田,按取大优先原则,应拆出“田”字,若忘了这一原则,拆出“口”字,则可在副码中找到该字。“刀”的第一笔是“”但许多人可能不加思考就把“/”当成是第一笔划,因此拆出“/”得到的编码也列为副码,这样即使拆字不是很正确,也能将所需的汉字输进计算机中去。一般在编码时要求编码的唯一性,同一汉字只产生一个确定的编码,本编码打破这一常规,一个汉字除按一般规则拆字得到一个主码外,还将根据不同的水平拆字而得到的编码,或为了避免重码而专门编制的编码定义为副码,这样对偶而上机的人来说,只需记忆简单的规则,对专职人员来说只要记住特殊的读音规则和用于重码的专用副码,就可实现高速盲打。(四)重码字的取码一组重码字通常将其中一个常用的仍按原编码输入,另一些则可改为副码。(1)四音重码先读整字音,再读第一结构音的单音,第二结构的读音规则不变,若整字不认识可用“a”代替。如bggk→客、容 为一组重码,“容”仍按bggk编码,“客”则可以取副码,先读客(k),再读第一结构单音(g),第二结构的读音仍为各口(gk)。故客的副码为kggk。(2)三音重码1.若有“a”字,在最后加上“a”中拆出的字,如淑→da本文档来自技高网...

【技术保护点】
一种在符合国家文字规范的前提下,利用汉字本身所包含的信息,进行编码的技术。其特征在于将汉字分为不同的结构,根据不同结构读出不同的音,并从结构中拆出汉字、或第一笔划。利用汉字拼音的声母与英文字母的一一对应关系,直接从键盘上输入编码,或按英文字母的排列顺序进行字典检索及其他需应用汉字编码的领域。

【技术特征摘要】

【专利技术属性】
技术研发人员:单茵
申请(专利权)人:单茵
类型:发明
国别省市:33[中国|浙江]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1