当前位置: 首页 > 专利查询>杨东宁专利>正文

字母化的汉字输入法及其键盘制造技术

技术编号:2886010 阅读:337 留言:0更新日期:2012-04-11 18:40
一种字母化的3C汉字输入法及其键盘,含29组基本部件,分成大小写字母、形似根、派生根三类,通过形义音与26个英文字母键及3个标点符号键相对应;编码中采取了省单笔、相似相配等模糊处理手段,编码直观简单,一级汉字的静态平均码长为3.3码每字,重码率低于2%。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一项汉字信息处理技术。现有的汉字编码技术可以分为两大类,第一类是面向广大非专业录入人员的普及型方案,如拼音、自然码、智能ABC等,这类方法易学、易记,但是输入效率不高。另一类是面向广大专业人员的快速型方案,有五笔字型、郑码等,这类方法重码率低,适合快速输入但其编码规则比较复杂,不容易学。目前我国汉字输入依然存在着这样一个“易学的输入不快,输入快的不易学”的局面。本专利技术的目的是为了解决上述问题,提供一种字母化的汉字输入方法。这种输入方法的每组基本部件的形状相似或有意义上的联系,并通过形义音与电脑输入键盘的英文字母和标点符号键相对应;同时编码过程中采取了省单笔、相似相配、笔画共享等方法,编码更为直观,因而有利于学习和记忆。本输入法的静态平均码长可低于3.4键每字,部件在键盘上的分布符合其动态频率的分布,一级汉字的重码率低于2%,从而满足了高速输入的要求。本专利技术的基本部件共29组;基本部件分三类代表每组笔形特点的大小写字母,大部分是大小写字母相似部件的形似根,大部分由大小写字母、形似根组合而成的派生根。29组部件通过形义音与26个英文字母键以及三个标点符号键相对应。以下结合实施例对其进行说明。一、实例11)基本部件中的大小写字母在计算机键盘上分布如附图说明图1所示,其中“/”键作为多功能特殊键;基本部件及相对应的键通过表1加以说明表1 上表中的基本部件含有由一定的形和义结合形成的形义码, 表示交叉性的竖或撇,如必中的丿、申的“丨”。上表中的字型标识码有U、I、O,U表示上下型 ,如分、天;“边、历、习”等结构的字也归为上下型;I表示交叉型 ,如束;“犬、戈”等结构的字也归为交叉型;O表示包围型 ,如回、匡。2)拆分原则拆分要求直观、相似笔画尽量在一起、少交叉、允许笔画共享、允许截断式拆分。a)相似笔画尽量在一起未拆成土与 ,元拆成二与儿,亏拆成二与 ,耒拆成与 乍拆成、丨、二,而不是、、一;b)少交叉生拆成 与,而不是与土;朱拆成 与 而不是与木;c)对于交叉性的汉字,从直观出发,允许笔画共享申拆成田与 ,甲拆成田与丨,电拆成田与乚,火拆成与人,米拆成与木;d)从直观对称出发,允许截断式拆分果拆成田与木,夫拆成土与人,出拆成两个山,圭拆成两个土;以上所述的未、朱、耒都采取了中间截断式拆分。3)编码原则取部件对应的键名作为其编码,按顺序编码,最大码长为4。编码过程中本专利技术采取了三个重要原则相似相配原则、省单笔原则、三码原则。相似相配原则是指当部件不属于基本部件时,可以用形状最相似的基本部件作为其编码部件。如耳拆成 与丨后,部件 不是基本部件,用形状最相似的基本部件“目”作为其编码部件;练拆成纟、 用形状最相似的基本部件“小”作为 的编码部件;也拆成 用形状最相似的基本部件“力”作为 的编码部件。取码不强求部件的细节,只要求部件整体的笔画和形态。省单笔原则按笔画多少将基本部件分成多笔部件和单笔部件,单笔部件指一、 丿、丨,带短钩的亅、 也可作为单笔部件;其它都为多笔部件,乚、乙、 等折画都作为多笔部件处理。编码时多笔部件优先于单笔部件;编码过程中根据字型、多笔部件和单笔部件的数目决定单笔部件的取舍,根据字型、多笔部件和单笔部件的数目、多笔部件所属类别决定多笔部件的拆分。三码原则在编码规则范围内汉字尽量取三码。具体步骤如下a)当汉字含四个或四个以上的多笔部件时,省去单笔部件,取第一、第二、第三及最后一个多笔部件编码;演由氵、宀、一、田、八,省去单笔部件一,编码为“SUOA”液由氵、亠、亻、丿、又、丶,省去单笔部件丿、丶,编码为“S;AX”蓝由艹、 、、丶、皿,省去单笔部件丶,编码为“HHCO”b)当汉字含三个多笔部件时,省去单笔部件,取三个多笔部件编码姥由女、土、 、丿、乚,省去单笔部件 、丿,编码为“XTJ”捡由扌、人、一、 一,省去单笔部件一、一,编码为“FAW”柳由木、 、丿、卩,省去单笔部件丿,编码为“LCP”突由宀、八、大、丶,省去单笔部件丶,编码为“UAY”c)当汉字含两个多笔部件和多个单笔部件时,取两个多笔部件和其中一个单笔部件编码;从多个单笔部件中按第一、最后、第二、第三、第四、第五的顺序取其中一个和另两个多笔部件编码。臭由丿、目、大、丶,取丿、目、大,丶,编码为“,RY”存由 、丨、了、一,取 、了、一,省去单笔部件丨,编码为“FBH”d)当汉字含两个多笔部件和一个单笔部件时,取这三个部件编码;乔编码为“,YH”e)当汉字只含两个基本部件且其中至少有一个为多笔部件时,根据字型和基本部件所属类别编码;大小写字母和形似根不拆分。对于左右型,左边部件不拆分,右边部件是派生根的需拆分,右边部件是小写字母和形似根的补加两个F键编成四码,右边部件是大写字母的补加两个J键编成四码。举例如下伙编码为“AWA”训编码为“IMFF”打编码为“FJJJ”对于其它字型,若两个基本部件都是大小写字母或形似根,根据字型补加一个字型标识码;若其中一个是派生根,对派生根拆分,若两个都是派生根,按书写顺序对先书写的派生根拆分,另一个派生根不拆分。分编码为“ADU”犬编码为“Y.I”回编码为“OKO”舌编码为“,SK”委编码为“,LX”f)当汉字只含两个单笔部件时,根据字型补加一个字型标识码;自编码为“,RU”g)当汉字只由一个基本部件构成,若是大写字母,用四个该大写字母对应的英文键编码表示;目编码为“RRRR”若是其它基本部件,将其拆成二码或三码,然后再补加两个或一个U键编成四码。禾编码为“,LUU”马编码为“QQHU”省单笔是本专利技术的最重要的特征之一,它减少了需要记忆的基本部件数,也减少了汉字细节对拆分的影响,从而降低了拆分难度,同时还减少了平均码长,在加上字型标识码后还能反映汉字大体的笔画和形状。省单笔和相似相配是本专利技术对汉字模糊处理的两个重要手段。4)特例处理为了直观以及减少重码,对少数汉字作特殊处理。a)左右型汉字的左边不是基本部件时,而是由一个多笔部件与一个或多个单笔部件组成时,左边用两码表示。如殆编码为“HDCK”b)只有两个多笔部件的左右型汉字的右边部分含两个对称相同的单笔部件时,两个单笔部件都不能省。如垣编码为“THGH”c)少数汉字由于省单笔后变成另外的字,因而不能省单笔,如匆、兔、删、栅;d)以门开头的汉字,门必须用两个码表示,如阁编码为“.NXK”5)一些常用字可以通过省去单笔部件编成二级简码,如在简码为“FT”按实施例1对GB2312汉字字集6763字编码,重码率为5.4%,其中3755个一级汉字的重码率低于2.0%。由于3755个一级汉字累计使用频率达到99.9%,实施例1的动态重码率将低于2%。二、实施例2相对实例1增加了一些基本部件,如表2所示,其它规则和实例1相同。按实施例2对GB2312汉字字集6763字编码,重码率低于5.0%,其中3755个一级汉字的重码率低于2.2%,静态平均码长比实施例1短。三、实施例3基本部件和实施例2相同,但编码时不省单笔,其它规则和实施例1相同。按实施例2对GB23 12汉字字集6763字编码,重码率低于5.0%,其中3755个一级汉字的重码率为3%,静态平均码长比实施例1长。四、实施例41)基本部件中的本文档来自技高网...

【技术保护点】
一种汉字输入法及其键盘,其特征在于本专利技术的基本部件共29组;基本部件分三类:代表每组笔形特点的大小写字母,大部分是大小写字母相似部件的形似根,大部分由大小写字母、形似根组合而成的派生根;每组部件的大小写字母、形似根、派生根之间可以互换, 允许组数变化在10%左右;29组部件通过形义音与26个英文字母键以及三个标点符号键相对应。

【技术特征摘要】

【专利技术属性】
技术研发人员:杨东宁
申请(专利权)人:杨东宁
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1