当前位置: 首页 > 专利查询>欧阳鹏专利>正文

形音汉字编码制造技术

技术编号:2893108 阅读:204 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种计算机汉字编码方法。本发明专利技术主要是取汉字整个字汉语拼音的首字母,然后按汉字书写规则取部分或全部汉字字根汉语拼音的首字母依次组合构成形音汉字编码,克服了现有汉字编码通过汉字拼音或拼形的编码方式带来的缺点。本发明专利技术具有使初学者易学易记、重码率低、输入效率高、规则简明、键盘无需任何注释、符合汉语的语言习惯等优点。(*该技术在2010年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种计算机汉字编码方法。汉字信息处理技术现代化的关键是汉字的计算机输入技术,而输入技术中的主要问题是汉字的编码。至今为止汉字的编码方法已达数百种,能够实用的仅十几种,它们不同程度地存在着缺陷,下面将较为常用的十种编码及其特点介绍如下编号 编码名称 编码方式 重码情况 检索方式 易学易记程度01 国际区位码 数字编码 无重码 计算检索 最难02 首尾码 拼形编码 有重码 查表检索 难03 拼音码 拼音编码 有重码 查表检索 易04 快速首尾码 混合编码 有重码 查表检索 难05 五笔字形码 拼形编码 微量重码 查表检索 较难06 双拼码 拼音编码 无重码 查表检索 较易07 四角码 框架编码 无重码 查表检索 较易08 快编码 拼音编码 有重码 查表检索 较易09 前三末一码 拼形编码 无重码 查表检索 较难10 仓吉码 拼形编码 有重码 查表检索 较难上表两大类编码中拼音码类的主要缺点是要求操作人员发音准确,而且重码太多。拼形码类的主要缺点是编码规则较多,初学者难于较快掌握,因此这两类汉字编码的缺点各自不同程度地阻碍了汉字输入速度的提高和它们的推广普及。本专利技术的目的是为克服拼形、拼音编码的缺点,提供一种编码规则少、重码率低,输入效率高的简单易学的形音汉字编码方法。本专利技术的主要内容是取汉字整个字汉语拼音的首字母,然后按汉字书写从左到右,从上到下,先里后封口的规则取部分或全部汉字字根拼音的首字母依次组合构成计算机汉字输入的形音汉字编码。汉字的汉语拼音首字母有二十三个,它们是a、b、c、d、e、f、g、h、j、k、l、m、n、o、p、q、r、s、t、w、x、y、z(c与ch合并成一个,s与sh合并成一个,z与zh合并成一个),若设码数为三位,则三位首字母组成的编码可表示的汉字个数为NUMNUM=233=12167(个)因此用形音汉字编码来表示国标GB2312(80)一、二级共6763个汉字已绰绰有余了。形音汉字编码的字根定义为三类基本字根、变形字根、笔划字根。形音汉字编码的基本字根是能用于组字的简单汉字。例如米、王、石、金、火、土等。基本字根的构成原则是一个汉字的基本字根个数不超过三个,如“最”可由“日”和“取”组成,也可由“日”、“耳”、“又”组成,但不能再分解成多于三个的基本字根。“最”字可为三码,也可为四码。本形音汉字编码可以有一字多码。形音汉字编码的变形字根有两类,一类是汉字的偏旁,它的构成原则是取人们对偏旁的习惯叫法,如“亻”取人字汉语拼音的首字母r,“灬”取火字汉语拼音的首字母h,“艹”取草字汉语拼音的首字母c。另一类变形字根是一些形似简单汉字的字根,如丽字中的“ ”取日(re)字汉语拼音的首字母r。形音汉字编码除了基本字根和变形字根以外的汉字构成部分,都是笔划字根,笔划字根有八个,它们是点丶(dian),横一(hang),竖丨(shu),撇丿(pie),捺 (na),提丿(ti),折 ㄑ、フ(zhe),勾 、乙、、ㄋ、乙(gou)。形音汉字编码为三位码或四位码。当编码超过四位时,只取前四位。汉字中只有“一”和“乙”为一笔划汉字,故将其编码扩充成YHH和YGG。本专利技术的主要优点是由汉字整个字的汉语拼音的首字母和其字根拼音的首字母构成,它没有c与ch,s与sh,z与zh卷舌音与非卷舌音之分,从而不要求拼音准确,它只要求操作人员知道汉字拼音的23个首字母即可以,因为字根的发音与汉语发音一致,不需要另外的记忆,而且编码的基本组成部分-首字母易学易记。由于本专利技术是取汉字字形的发音,故其编码规则极为简单,减少了记忆量,且各个记忆编码与键盘的对应关系极为容易。形音编码是由整个汉字汉语拼音的首字母和字根汉语拼音的首字母构成,这样的编码方式重码率很低,编码规则简明,它比拼形码更适合计算机汉字处理的发展方向-语音识别系统和自然语音理解系统。形音汉字编码是一种适应计算机汉字输入的汉字编码,采用形音编码的汉字信息处理输入部分,也可以附加联想式输入、词组输入、容错码、频度重码处理等辅助处理技术,一经推广,它能在汉字信息现代化处理过程中得到广泛的使用。形音汉字编码举例如下汉字 可分解成的字根 形音编码汉(Han) 氵(San Dian) 又(You) HSDY字(Zi) 宀(Bao) 子(Zi) ZBZ国(Guo) 口(Kou) 玉(Yu) GKY李(Li) 木(Mu) 子(Zi) LMZ厘(Li) 厂(Cang) 里(Li) LCL鲤(Li) 鱼(Yu) 里(Li) LYL礼(Li) 示(Shi) 乚(Go) LSG莉(Li) 艹(Cao) 禾(He) 刂(Dao) LCHD艹(Cao) 利(Li) LCL荔(Li) 艹(Cao) 力(Li) 力(Li) LCLL吏(Li) 一(Hen) 史(Shi) LHS栗(Li) 西(Xi) 木(Mu) LXM丽(Li) 一(Hen) (Re) (Re) LHRR厉(Li) 厂(Cang) 万(Wan) LCW励(Li) 厉(Li) 力(Li) LLL砾(Li) 石(Shi) 乐(Le) LSL历(Li) 厂(Cang) 力(Li) LCL利(Li) 禾(He) 刂(Dao) LHD傈(Li) 亻(Ren) 栗(Li) LRL例(Li) 亻(Ren) 列(Lie) LRL俐(Li) 亻(Ren) 利(Li) LRL痢(Li) 疒(Bin) 利(Li) LBL立(Li) 丶(Dian) 一(Heng) 丶(Dian) LDHD粒(Li) 米(Mi) 立(Li) LML沥(Li) 三(San Dian) 历(Li) LSDL权利要求1.一种计算机汉字编码方法,以汉字的形、音为编码,其特征在于取汉字整个字的汉语拼音首字母,然后按汉字书写从左到右,从上到下,先里后封口的规则取部分或全部汉字字根拼音的首字母依次组合构成形音汉字编码。2.根据权利要求1所述的形音汉字编码方法,其特征在于形音汉字编码的字根有基本字根,基本字根是能用于组字的简单汉字,组成一个汉字的基本字根个数不超过三个。3.根据权利要求1所述的形音汉字编码方法,其特征在于形音汉字编码的字根有变形字根,它们是一些形似简单汉字的字根和汉字的偏旁。4.根据权利要求1所述的形音汉字编码方法,其特征在于形音汉字编码的字根有八个笔划字根,它们是点(dian),横(heng),竖(shu),撇(pie),捺(na),折(zhe),提(ti),勾(gou)。全文摘要本专利技术公开了一种计算机汉字编码方法。本专利技术主要是取汉字整个字汉语拼音的首字母,然后按汉字书写规则取部分或全部汉字字根汉语拼音的首字母依次组合构成形音汉字编码,克服了现有汉字编码通过汉字拼音或拼形的编码方式带来的缺点。本专利技术具有使初学者易学易记、重码率低、输入效率高、规则简明、键盘无需任何注释、符合汉语的语言习惯等优点。文档编号G06F3/023GK1049727SQ9010287公开日1本文档来自技高网...

【技术保护点】
一种计算机汉字编码方法,以汉字的形、音为编码,其特征在于取汉字整个字的汉语拼音首字母,然后按汉字书写从左到右,从上到下,先里后封口的规则取部分或全部汉字字根拼音的首字母依次组合构成形音汉字编码。

【技术特征摘要】

【专利技术属性】
技术研发人员:欧阳鹏
申请(专利权)人:欧阳鹏
类型:发明
国别省市:36[中国|江西]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1