当前位置: 首页 > 专利查询>武守义专利>正文

汉字龙码制造技术

技术编号:2883367 阅读:161 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及汉字编码,更具体地涉及汉字龙码。它是以小学一年级学生人人都熟记的26个汉字字形字母及其类字母为汉字编码。它符合语言文字的简易性和单一性,不需要任何口诀和助记符。可无同码地输入数万个汉字,不但能适应包含繁简体字的大字库,而且不受字库的限制,自由输入汉字,可成为新汉字处理标准中2.7万繁简体字的输入法,能满足各行各业不同用户的需要。还可方便地用于汉语电子字典查字。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及汉字编码,更具体地说,涉及汉字龙码。在当今计算机日益普及的信息时代,汉字能否被各行各业的人们方便地用于计算机,关键问题之一是汉字的编码输入方法,这也是汉字电子化和数字化的关键。汉字能否像西文一样,不受汉字库的限制,自由输入任意的汉字,也是汉字能否更广泛应用的问题之一。目前虽然已有众多的汉字输入法,但至今没有一个,能满足各行各业需要的,为人们公认和接受的无同码的输入法,尤其是适用于大汉字库的,更是没有。另一个问题是,汉字的使用往往受汉字库大小的限制,字库中没有的字就不能输入,由于没有好的输入法,GBK大字库中的字也不能方便地输入使用。近日来国家公布了新的汉字处理标准,字库扩大至2.7万个汉字,更没有输入法能方便地输入。再一个问题是,现有的输入法没有全面统一地考虑繁简体字的编码问题,往往把二者对立起来,使用同一组编码,即使在大字库中包括有繁简体字,也难以输入使用,更不能适应一国两制的需要。需要指出的是,字形码中字根法佔多数,往往用字根(部件,部首)分析汉字和编码,出现许多难以解决的问题。字根是一个不确定的概念,边界不清,数量又多达600至700个,规范化的字根仍有560个,即使各编码专家归併以后,一般仍有200多个,而且名目繁多,一个字母同时要表示键名、笔形、字根、高频字、助记符和识别码,不可能作为基本的组字单位,也难记忆。比如较流行的几种形码,‘五笔字型’输入法的键名、笔形、基本字根、高频字和识别码加在一起有230多个,还有25句口诀。‘郑码’的主根、副根、高频字和助记符共有320多个。‘表形码的部件将近400个。‘全息码’号称100个部首,实际上是250个。这些都不符合语言文字的简易性和构字原则,字根在各种文字中都有(英文、俄文中都有),但不是也不可能作为构字单位,而仅仅作为帮助理解和记忆单词的一种方法。字根中有不少重复现象,如已有、乂、亠、八、丷、木、几、又、卜等字根,又有攵、文、父、米、殳、攴等组合的字根,造成重复和重叠,简单的字根尚且如此,复杂的字根就更是这样了。有的甚至把笔画相当多的复杂字根作为组字单位,更是不合理。总之,由于字根法的复杂性和不合理性,它不可能较好解决汉字输入问题,只能是一种权宜之计。有鉴于此,本专利技术的目的在于提供一种人人能记得住的、方便使用且无同码的汉字龙码。本专利技术的目的还在于寻求一种简便无同码地输入新汉字标准的输入法和查字法。本专利技术的汉字龙码是以精选的26个字形字母或其类字母为汉字编码。依照笔顺的习惯规则,从上到下,从左到右,从外到里,将分解成字形字母或其类字母,用其对应的汉语拼音字母进行编码。本专利技术的26个字形字母或其类字母是汉字的组字和编码的基本单位,是小学一年级学生人人都熟知的汉字和笔形,能和汉语拼音一样容易掌握和普及,为了便于取码,对20个由3个以上字母构成的且组字较多的字,分别取其第一和末字母二字母码构成复合字母(见表)。本专利技术的优点之二是编码简单自然,按汉字自身结构分解编码,不需添加附属码。本专利技术的优点之三是覆盖的汉字面广,既能无同码地覆盖大的汉字库,又能覆盖繁简体字,以满足各个领域的需要。本专利技术的优点之四是利用字库中2000个左右的汉字即可半无编码和半无字库地输入字库中包含和没有包含的字,几乎所有有用的汉字(共4万以上),接近于自由输入汉字,它可成为新汉字处理标准2.7万繁简体字的输入法,也可较彻底的解决汉字的缺字和输入问题。可谓是汉字输入法的一个较大的突破。本专利技术的优点之五是对汉字按字形有良好的排序功能,由于采用了类字母化的编码,其1至3位可作为定序码,4至5位将作为定位码,有严密而良好的字序,可用于按编码顺序直接查字典和资料检索,方便地实现‘汉语电子字典’,没有同音字的干扰,提高查字效率。关于字形符的说明,由于汉字字形的复杂性,常有两个汉字的组字字母完全相同,只是由于字母的平面位置排列不同,而构成完全不同的两个汉字,例如吧和邑;岂和屺;员和呗;旱和旰;只和叭;旭和旮;标和柰等,对两个编码相同而字形不同的汉字,输入时用字形符加以区别,有如汉语拼音的声调符号,为此,在后一个次常用字的编码后面加一字形符,加以区别。由于这种字不多,且往往只有两个字相同,操作者无需考虑,照常编码,如有此种同码情况,由计算机给出提示,以便选择。并利用这一规则区分由各种因素造成的少量同码,达到无同码地输入。本专利技术同字根法相比,根本的区别在于,采用了类似于字母文字的类字母化的编码方法,具有语言文字的简易性,能和基础教育结合,人人能记住,方便使用,有助于汉字的普及和推广应用,目前已安排在一些中小学进行试验,取得结果后可逐步推广。本专利技术的优点和效果是显而易见的,只要掌握容易记住的26个字形字母及其类字母,就可在标准键盘上输入任意的汉字,该编码系统还适用于汉字的国际标准(ISO)和中日韩字符集(CJK),可促进全世界汉字输入的统一和信息交流。为了提高输入速度,对近600个最常用汉字提供了简码,即用二个码便可输入一个字,常用的4000字用3码输入,当然也没有同码,因此,用简码输入往往比用词组还快。本专利技术的龙码,由于最常用字的平均击键次数小于2次,常用字的平均击键次数小于3次,加上大量词组输入,实际的平均击键次数小于理论平均击键次数的1.33次,输入速度快。本专利技术是一种多功能码,用途广泛,已由试验的实践证明1,电脑输入和打字,已生成大字库无同码的输入法;2,按此编码为汉字排序、查字和检索,已编成‘速查汉语字典’和‘汉语电子字典’;3,由于无同码,可将汉字用英文字母储存、处理和传输,使用时由计算机转译成汉语输出。以下,结合实例对本专利技术的编码方法加以叙述本专利技术的编码方法非常简便,无需口诀和专门训练,没有繁琐的规则,见字按字母分解和编码。1.由1至5个字母组成的字,按顺序取1至5个字母编码,类字母中能独立成字的(共14个),字母码后加字形符以示区别例如1)八b;二e;木m;人r;2)儿b/; 丁g-; 日q-; 入r-;3)分bd; 个rp; 明qu; 囚or;4)字kgy; 同uyo; 音ecq; 体rmy;5)堤tqya; 彻prtd; 楚mmza; 喆toto;6)镕jkbro;稠pmuto;潮svqvu;綻lxkya;2.由6个或6个以上字形字母组成的字,可按汉字的习惯分为二部分的汉字,按二部分分别取码,第一部分取1,2,3,4字母,第二部分取1,2,3,末字母,共取5个字母编码,有以下几种情况例如1)第一部分为一个字母的,取(1+4)字母填tvusb;擅feooy;2)第一部分为二个字母的,取(2+3)字母鎔jbkbo;缴lypqv;3)第一部分为三个字母或三个以上字母的,取(3+2)字母龄arlm;数bmzrv;4)第一部分为四个以上字母第二部分为一个字母的,取(4+1)字母熟eogyh;欒lxnom;3.词组的编码1)二字词组每个字取第一、二字母,共取4个字母编码,例如提高fqeo;数量bmqy;2)三字词组第一个字取第1和2字母,第二、三字取第1字母,共取4个字母编码,例如科技城pmft;上海市ryse;2)四字词组第一个字取第1和2字母,第二、三和四字取第1字母,共5个字母编码,例如岂有此理agvaw;总而言之boinn本文档来自技高网...

【技术保护点】
一种汉字龙码,其特征在于所说的龙码是以汉字字形字母及其类字母为汉字编码。

【技术特征摘要】

【专利技术属性】
技术研发人员:武守义
申请(专利权)人:武守义
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1