音型结合汉字编码法,涉及电子计算机领域中的汉字编码技术,由拼型码和识别码所组成。先将汉字进行拆分,对拆分后的每个部分用规定的代码来表示。所谓每个部分用的规定代码是取自拆分部分读音的第一位拼音字母,即称为拼型码;所谓的识别码是取自汉字没有拆分的读音的第一位拼音字母。本发明专利技术编码法与已有技术相比,具有简单易记,“重码率”低,受语音程度影响少,拆字直观。(*该技术在2012年保护过期,可自由使用*)
【技术实现步骤摘要】
本专利技术涉及电子计算机领域中的汉字编码技术。迄今,涉及汉字编码的方案有几百种,这些方案可简略地划分为下述三类第一类为《数字命名法》,即指定某汉字为某码,如常见的《区位码》、《电报码》等等。在区位码中指定“欢迎”两字的编码分别为“2722”和“5113”;在电报码中指定“浙江”两字编码分别为“3181”和“3068”。这一类编码的特点是汉字与编码之间是一一对应的关系,即每一个汉字对应唯一的编码,同时每一个编码也对应唯一的汉字。其主要缺陷是规律性不强,又加上有上万字的汉字编号,在使用时很难记住。第二类是《拼音编码法》,即用汉字的拼音来代替一个汉字。其特点是简单易学,目前应用较广。但其主要缺陷是“重码”多,是一种“高重码”类的汉字编码。如在计算机上用《拼音编码法》找“瀑”字,先输入“PU”,由于读“PU”音的字有近二十个,而“瀑”字在第十五个,于是计算机就是全部显示出来让人选择,这样会使挑字速度受到较大的限制。同时由于受地域的影响,对普通话发音不准确的人在应用上仍有不便之处。第三类是《拼型编码法》,即根据汉字方块字的特点,将它拆分成几个部分,每个部分用一个字符来表示。如APPLEⅡ上使用的《仓颉编码法》和PC机上使用的《五笔字型》以及某些字典上使用的《四角号码查字法》都属于这一类编码。其特点是借助“口诀”记忆来获得某汉字(或字根)与字符的对应关系,在熟练的基础上使用,此类的编码正确性高,处理得当,可减少“重码率”。但其缺点是在刚开始学习时要记的东西较多,常常使很多人望而却步。本专利技术的目的是提供一种由拼型编码和拼音编码相结合的、适于计算机上应用的音型结合汉字编码法;另一目的是由单字全码、单字简码和词汇编码音型结合汉字编码法。本专利技术音型结合汉字编码法,由拼型码和识别码所组成,先将汉字进行拆分,对拆分后的每个部分用规定的代码来表示。所谓每个部分用的规定代码是取自拆分读音的第一位字母,即称为拼型码;所谓的识别码是取自汉字没有拆分的读音的第一位拼音字母。本专利技术音型结合汉字编码法与已有技术相比,具有如下优点一是编码简单易记。本法在编码上采用了语音记忆和形象记忆,使编码简单,记忆量减少,记忆难度降低。克服已有《拼型法》由口决来记忆部首代码的缺点。“识别码”是减少重码的关键,《五笔字型》中采用的15个末笔字型交叉识别码,必须死记后才能灵活运用,而本法采用该字拼音的第一位字母作为“识别码”,记忆容易;二是“重码”机会少。已有重码数最少的《五笔字型》汉字编码,它为了区别如“旭、旮”和“叭、只”等汉字用了15个末笔字型交叉识别码,而本法根据汉字读音的不同用了23个拼音码来区分;三是受语音限制性少。《拼音编码法》对普通话发音准确性要求高。而本法在编码时只取汉字(部首)读音的第一位拼音字母,所以对一些分不清声母Z和ZH、C和CH、S和SH以及韵母ian和ie、en和eng、in和ing等的人来说,不会引起编码上的困难;四是拆字更为直观。在“五笔字型”中,由于只有130个字根,于是出现很多日常的部首需要拆分的现象,如“牛”字旁就得拆成“丿”和“才”,“犭”旁拆成“ ”和“丿”,“饣”旁拆成“ ”和“ ”等,“犊”字要拆成“丿才十大”,这样造成了一定程度上的不直观,而本法基本上不存在这种问题,如“犊”拆分为“牛十买”,“型”拆分为“开刂土”等,拆后直观。下面结合实例对本专利技术作详细说明。《拼型编码法》是根据汉字方块字的特点,把汉字拆分为几个部分,每个部分用规定的代码来表示。但本专利技术的代码基本上是取自拆分部分读音的第一位拼音字母,如“音”字拆分为“立”和“日”两个部分,在取代码时则取它们读音的第一位拼音字母,由“立”的拼音为LI,“日”的拼音为RI,得拼型码LR。为了有效地区分诸如“旭”(Xù)和“旮”(gā)这一类拆分部分的编码相同而实际上不相同的汉字,本专利技术应用了识别码-拼音码,该码取自汉字读音的第一位拼音字母,如“音”字读yín,则它的拼音码为Y,得《音型结合码》为LRY。又如“旭”字的编码为JRX,“旮”字的编码为JRG,其中X和G是由“旭”的拼音XU和“旮”的拼音GA,取它们各自拼音的第一个字母而获得。本专利技术取码的注意事项和常用部首代码日常使用的字典中,一般有180-300个部首(包括部首变形)。这些部首绝大部分有一个习惯读音,所以我们取它第一位拼音字母作为该部首的代码。为了克服因地域而造成的发音问题以及为了汉字能均匀地分散到各代码为首的编码中,在取码时注意以下几点1、因很多人不能很好地区分“L,N”这两个声母,这里规定所有声母为“N”的部首或汉字,其代码及拼音码均以“L”来代替。如部首“牛”“女”的代码都用“L”,“孬”字的编码为“BLZL”。2、规定读YO及以后至YUN(包括YO、YOU、YU、YUAN、YUE、YUN)音的部首和汉字,代码规定为“U”,如部首“鱼”“雨”“月”的代码均为“U”,“韵”字的编码为“LRUU”。3、规定部首“虫”的代码为“Q”,部首“木”的代码为“F”,如“蠢”字编码为“CQQC”,“蝶”字的编码为“QSFD”。4、规定“氵”“ ”的代码为“A”,“纟”的代码为“E”,“扌”的代码为“I”,“亻”的代码为“P”。例汉字拆分拼型码拼音码总编码浙氵扌斤AIJZAIJZ红纟工EGHEGH您亻尔心PEXLPEXL肥月巴UBFUBF鲨氵少鱼ASUSASUS湘氵木目AFMXAFMX捐扌口月IKUJIKUJ5、规定汉字的基本笔画及代码笔画代码助记一 O 汉字中最简单的丨I丨→I丿P"撇"的拼音码 G1、戈(gē)、戊读音H 1、虍禾、 读音I 扌、丨、 丨→I扌→I →IJ己、巳、已钅九、尢巾、 柬(jiǎn) 读音K口开读音L1、耒(lěi)读音2、女、牛、"N"转为"L"M母、毌读音N 、丶、亠、冫、灬读音。"丶"是" "的变形O1、囗囗→O2、一P1、片、丬、爿读音2、亻Q 1、犭、豸、且、 读音2、虫R1、人、入、八、彳读音S饣四豕束、朿读音山、屮礻代码部首助记T天、夭、土、士、圭、 、不在第一部分)读音U读yo、you、yu、yuan、yue、yun音的汉字及部首W文、夂、攵读音X 西、 、酉小、心、忄、读音Y 讠衤、 弋(yì)幺(yāo)读音Z爪、爫辶、廴主、( 在第一部分) 读音汉字拆分与编码(一)单字的拆分与编码任何一个汉字都可以归入以下五大类,第一类“不大于三笔”,如“丁”“口”等。第二类“三合字”,如“树”、“淡”等。第三类“多合字”,如“椒”“骤”等。第四类“双合字”,如“泪”、“村”等。第五类“独体字”,如“自”、“雨”等。这是力求以流程图为主结合文字叙述和举例来说明1、“不大于三笔”的汉字应按书写顺序逐笔拆分编码汉字拆分拼型码编码丁一亅OAOAD丈一丿 OPN OPNZ也丨乚AIAAIAY之丶 NAN NANZ力丿PAPAL乃 丿 AP APL2、“三合字”,按各部分书写顺序拆分。若第一部分是“草字头”,要去掉“草字头”,再编码。“草字头”,再编码。“草字头”包括“艹 ”树木又寸FUCFUCS淡氵火火AHHAHHD汉字拆分拼型码编码备注草艹日十RSRSZ"草字头"在第一部分要去掉常口巾KJKJC"草字头"在第一部分要去掉陪阝立口ELKELKP悄本文档来自技高网...
【技术保护点】
音型结合汉字编码法,由拼型码和识别码所组成,先将汉字进行拆分,对拆分后的每个部分用规定的代码来表示,其特征在于所谓每个部分用的规定代码是取自拆分部分读音的第一位拼音字母,即称为拼型码;所谓的识别码是取自汉字没有拆分的读音的第一位拼音字母。
【技术特征摘要】
【专利技术属性】
技术研发人员:黄文勇,
申请(专利权)人:黄文勇,
类型:发明
国别省市:33[中国|浙江]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。