当前位置: 首页 > 专利查询>李学行专利>正文

双元码编码方案制造技术

技术编号:2890629 阅读:253 留言:0更新日期:2012-04-11 18:40
本发明专利技术为一种计算机汉字编码方案。它是根据汉字形成架构特点并结合人们对汉字的认知习惯而设计的,输入时将汉字拆分为两部分,顺取各部分读音的声母和韵母,该编码方案集中了音码和形码的优点,同时又克服了两者的缺点,既贴近人们生活的思维方式又体现了汉字的文化渊源,与现行的方案相比较而言,更加简单易学、规范性更强、编码可读性更强,文化基础深厚,更适宜我国计算机的推广普及。(*该技术在2015年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术为一种计算机汉字输入编码方案。现行计算机汉字编码方案很多,但不外乎拼音方案、形码方案及其合成方案。拼音方案简单易学,但重码率高,且对于不熟悉读音的字就没办法了。形码方案与之相反,任何汉字只要知道怎么书写就可以输入,然而它将字拆得支离破碎,不光记忆字根比较困难,在输入时脑力负荷也相当大。音形合成方案兼具了两者的优点使编码效率大大提高,可同时也继承了两者的缺点。比如重形的全声码方案仍需将字拆分得支离破碎;重音的方案仍需认识每一个汉字。另外,目前绝大部分方案或多或少地存在编码可读性差、规范性差及为编码而编码的问题。汉字不完全是象形的图形字符,也不完全是语音的记录符号,所以纯粹按某一种模式(或形或音)来描述汉字都是一种歪曲,但并不是每一个汉字都兼具两种特性,所以很多合成方案也并非真正体现了汉字的文化特征。本专利技术的目的在于提供一种简单易学、规范性强、编码可视性强、效率较高的编码方案。本专利技术的目的是采用以下技术方案实现的将汉字拆分为两部分,顺取各部分读音的声母和韵母,如“胡”的编码为“GUYW”(古月);若第二部分无读音,该部分取整体字读音的声母和韵母,如“隙”的编码为“EDXI”(阝隙);若第一部分无读音,该字取整体字读音的声母和韵母,如“其”的编码为“QI”;若第一部分为偏旁“山疒(髟)艹亻冫(彳)扌宀(冖)火衤(礻)纟口石木女口(勹凵冂)虫足日氵土鱼钅王讠月竹”,该部分取“A-Z”一位编码,如“胶”的编码为“YJS”;对于不可拆分的汉字取整体字读音的声母和韵母,如“日”的编码为“RI”。词语采用音流式编码,码长四位,两字词顺取两字的声母和韵母;三字词顺取三字声母及第三字韵母;四字及四字以上词语取第一、二、三、末字声母。汉字就其形成来说,一般莫过于象形(如“日”)、会意(如“旦”)、形声(如“担”,一般由形部和声部组成)三种形式,而在数以万计的汉字中形声字占了绝对大的份额,本方案就是根据汉字的形成特点,并结合人们对汉字的认知习惯(如“草头黄”、“日月明”等)设计完成的。在具体实施过程中,尚有如下问题需要说明1、单笔划与字组合应视作整体,编码取整体字读音的声母和韵母。如“旦”的编码为“DC”。2、偏旁部首在汉字中出现频繁且大部分多音节,为了与字区别开来,对偏旁“山疒(髟)艹亻冫(彳)扌宀(冖)火衤(礻)纟口石木女口(勹凵冂)虫足日氵土鱼钅王讠月竹”作了单码设计,其它偏旁部首取读音的前两个字的声码,如“饣忄阝”的编码为“SZ、SX、ED”(食字、竖心、耳朵),另外“学党虎鹿席高”的头码为“XZ、DZ、HT、LT、XT、GT”。偏旁部首本身的编码一律取读音的前两个字的声码加一位指示码“V”,如“饣”的编码为“SZV”。3、对于嵌套组合的字要注意还原,如“哀”应还原为“衣口”(YIKO),避免盲目拆字。这类字还有如“裹、衢”等。4、为了进一步降低重码率,实现盲打,将汉字末笔归为八类横、竖、撇、捺、折、点及与前笔位构成“十”字交叉或封口,分别对应“1-7”和“O”,以此判别重码,词语选用末字的末笔判别码。5、为了适合不同行业的需要,将该方案分别在大键盘区和小键盘区实现,详见附图。下面就一些细节问题进行说明(1)声码为汉语拼音的第一个字母,故而“ZH、CH、SH”分别与“Z、C、S”合并,解决了因发音不准造成的困难,但在拼音掌握较好的情况下,可以使用“V、I、U”对应“ZH、CH、SH”输入。(2)大键盘区韵母码定位基本上按照英文字母顺序排列,较容易掌握。关于“ENG、ING”与“EN、IN”合并的问题,在拼音掌握较好后,可以用“H、J、L、M”分别对应“EN、ENG、IN、ING”输入。(3)小键盘区声韵定位主要依据谐音和类形定位,形象生动。如“Y”和“I”定位于“1”为谐音,而“Z”定位于“2”则属于类形。综上所述,本方案采用最贴近人们生活的思维方式和拼音为基础,将数以万计的汉字变得生动有趣。它集合了形码方案与音码方案的优点,同时又克服了两者的缺点,既不需要认识每一个汉字,又不需要将汉字拆分得支离破碎。与现行的编码方案相比较而言,更加简单易学、规范性更强、编码可读性更强。使用末笔判别码单码率达95%以上,效率较高,严格遵循汉字的形成架构特点,文化基础深厚,各码长字分布合理。 附图说明图1为声、韵、高频字、高频偏旁共容的键盘中“”中有字母表示指定可选,如“[]AN”可以为“AN、IAN、UAN”三种情况。图2为大键盘区韵母及高频字对应表图3为小键盘区声、韵、高频字及记忆口诀对应表图4为单码偏旁对应表下面结合附图及字、词的输入方法对本专利技术作进一步说明(括号内为小键盘区编码)两码字(整字声韵)日 RI(.1)月 YW(1+)三码字(高频偏旁字)海 SMG(33.) 理 WLI(5/61)四码字暨 JIDC(91.3)意 YMXM(14+4)两字词中国 ZPGZ(2-02)三字词计算机 JSJI(9491)四字及四字以上词花好月圆 HHYY(--11)中华人民共和国 ZHRG(2-.0)偏旁部首钅 JZV(92/)权利要求1.双元码编码方案,码长1-4位,采用国际标准微机键盘,其特征在于(1)将汉字拆分为两部分,顺取各部分读音的声母和韵母,若第二部分无读音,该部分编码取整体字读音的声母和韵母,若第一部分无读音,该字取整体字读音的声母和韵母,若第一部分为偏旁“山疒(髟)艹亻冫(彳)扌宀(冖)火衤(礻)纟口石木女口(勹凵)虫足日氵土鱼钅王讠月竹”,该部分取“A-Z”一位编码;对于不可拆分的汉字取整体字声母和韵母。(2)词语采用音流式编码,码长四位,两字词顺取两字的声母和韵母;三字词顺取三字声母及第三字韵母;四字及四字以上词语取第一、二、三、末字声母。2.根据权利要求1所述的双元码编码方案,其特征在于由单笔划与字组合构成的字取整体字读音的声母和韵母。3.根据权利要求1或2所述的双元码编码方案,其特征在于将汉字的末笔可分为“横、竖、撇、捺、折、点及与前笔位构成‘十’字交叉或封口”八类。全文摘要本专利技术为一种计算机汉字编码方案。它是根据汉字形成架构特点并结合人们对汉字的认知习惯而设计的,输入时将汉字拆分为两部分,顺取各部分读音的声母和韵母,该编码方案集中了音码和形码的优点,同时又克服了两者的缺点,既贴近人们生活的思维方式又体现了汉字的文化渊源,与现行的方案相比较而言,更加简单易学、规范性更强、编码可读性更强,文化基础深厚,更适宜我国计算机的推广普及。文档编号G06F3/023GK1151539SQ9511117公开日1997年6月11日 申请日期1995年8月24日 优先权日1995年8月24日专利技术者李学行 申请人:李学行本文档来自技高网...

【技术保护点】
双元码编码方案,码长1-4位,采用国际标准微机键盘,其特征在于:(1)将汉字拆分为两部分,顺取各部分读音的声母和韵母,若第二部分无读音,该部分编码取整体字读音的声母和韵母,若第一部分无读音,该字取整体字读音的声母和韵母,若第一部分为偏旁 “山疒(髟)艹亻冫(彳)扌宀(冖)火衤(礻)纟口石木女囗(勹凵匚)虫足日氵土鱼钅王讠月竹”,该部分取“A-Z”一位偏码;对于不可拆分的汉字取整体字声母和韵母。(2)词语采用音流式编码,码长四位,两字词顺取两字的声母和韵母;三字词顺取三字 声母及第三字韵母;四字及四字以上词语取第一、二、三、末字声母。

【技术特征摘要】

【专利技术属性】
技术研发人员:李学行
申请(专利权)人:李学行
类型:发明
国别省市:34[中国|安徽]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1