当前位置: 首页 > 专利查询>周南塔专利>正文

汉字特征映射编码法制造技术

技术编号:2891838 阅读:219 留言:0更新日期:2012-04-11 18:40
目前的汉字编码方案不是记忆量大难学、难以掌握,就是重码率高、输入效率低。本申请提出的汉字编码方案,将汉字拆分成若干部件后,将部件根据其特征映射到键盘的某个键位上,无需任何记忆。具有记忆量少、好学、易掌握、重码率低和高效好用的特点。本编码方案码长最长为4,超过4个部件时,取头两个部件码和尾两个部件码。(*该技术在2014年保护过期,可自由使用*)

【技术实现步骤摘要】
目前的汉字编码方案不是记忆量大难学、难以掌握,就是重码率高、输入效率低。本申请提出的汉字编码方案,将汉字拆分成若干部件后,将部件根据其特征映射到键盘的某个键位上,无需任何记忆。同时通过巧妙地定义若干部件键位,调整若干部件在汉字编码中的码位和(或)码序,极大地减少了汉字编码的重码率,具有记忆量少、好学、易掌握、重码率低和高效好用的特点。本编码方案码长最长为4,超过4个部件时,取头两个部件码和尾两个部件码。部件包括偏旁部首,广义上还包括汉字。汉字部件(或汉字)是一种平面图形结构,包括有大量的特征信息,其特征信息至少包括如下十大类一、汉字或部件笔划数。二、笔划类型最基本的汉字笔划类型有横、竖、撇、捺、点和弯钩,也可以浓缩成以下三类类1(横)、类2(竖和撇)、类3(捺、点和弯钩)。三、每一种笔划类型在部件中的个数。例如横划数,弯曲笔划数等。四、每一种笔划类型在部件中的位置。例如弯曲笔划在部件第几划。五、两笔划之间的位置关系。位置关系包括相交、端接、交接、垂接、相邻和相隔。相交两笔划有公共交点,例“十”字。端接一笔划的端点与另一笔划的端点相连接,例如“几”。交接一个笔划的端点与一个交点相连接,例“大”。垂接一个笔划端点与另一笔划垂直相接,例“上”字首笔和末笔。相隔两笔划之间有另一个笔划相间隔,例“马”中首笔和末笔。相邻非上述5种关系。六、部件中交点数、端接点数、交接点数、垂接点数。七、交点、端接点、交接点、垂接点在部件中的位置。例如首笔划有无交点,末笔划有无交点。八、汉字字型信息,基本的汉字字型有上下型、左右型、内外型(或侧包型)和杂型。如下所示 以这四种基本字型为基础,通过嵌套可以演变出多种字型结构。例如 九、每个汉字中所含子汉字的个数。十、每个汉字中其子汉字的位置。例首部件是汉字。把键盘看成一个二维平面,在键盘上建立二维坐标系,键盘的键位做为坐标轴的刻度。汉字部件(或汉字)可以根据其特征方便地映射到键盘键位上,而无需任何记忆。下面给出一个根据部件特征将其映射到键盘键位上的例子。如附图说明图1所示(见说明书附图1)。我们称为映射1。为了说明方便,我们将键盘划分成3个区。分别称为T1区、T2区、T3区。所有不含交点的部件将被映射到T1区,具体键位由其首笔划和末笔划类型来确定。类似地所有含交点的部件将被映射到T2区,具体键位由其首笔划和末笔划类型来确定。T3区为若干部件的定义区。在T1区和T2区建立两个坐标系,坐标原点分别为Q和R。T1区中X轴方向由Q、A、Z3键所指方向确定,Y轴方向由Q、W、E3键所指方向确定。T2区中X轴方向由R、F、V3键所指方向确定,Y轴方向由R、T、Y3键所指方向确定。笔划类型定义如下类1(横)、类2(竖和撇)、类3(捺、点和弯曲笔划)。X=0,1,2分别表示其首笔划类型为类1、类2、类3。Y=0,1,2分别表示其末笔划类型为类1、类2、类3。X坐标和Y坐标的交点,即为部件映射到的键位。例如“天”,其含有交点,将被映射到T2区,其首笔划类型为类1、末笔划类型为类3,X=0、Y=2,则其被映射到键位“Y”。再如“已”,其不含交点,将被映射到T1区,其首笔划类型为类3、末笔划类型也为类3,即X=2,Y=2,则“已”将被映射到“C”。下面再给出一个映射例子。如图2所示(见说明书附图2)。我们称为映射2。为说明方便,将键盘键位分成三个区,分别称为K1、K2、和K3区。所有含有一个弯曲笔划(不包括变向弯曲笔划)的部件都被映射到K1区,其具体键位由部件的交点数和弯曲笔划所在位置来确定,所有含有1个交叉点(X=1),弯曲笔划位置在2(Y=1)的部件将被映射到键位S。如汉字“代”中的“弋”。交点数大于2时都算2。弯曲笔划位置在3划以后时全算3。所有其它的部件(不包括含变向弯曲笔划的部件)都将被映射到K2区。其具体键位将由部件的划数和其首末笔划关系来确定。例如划数为3,首末笔划关系为相隔的部件“已”将被定位到键位J。部件划数大于4时,都算做4,小于2划时,都算2划。所有含有变向弯曲笔划的部件都将被映射到K3区。其具体键位将由部件的笔划数和弯曲笔划个数来确定。例如划数为3、含有两个弯曲笔划的部件“马”将被映射到键位“L”。所有被映射到键位“,”和“.”的部件都映射到“P”。变向弯曲笔划的定义所谓变向弯曲笔划是指,笔划的一部分顺时针方向弯曲,而另一部分逆时针方向弯曲。例如“乙”等。映射和映射可以进行组合,组合的方式有两种,一种是横向组合,一种是纵向组合。映射的横向组合使部件映射到一个键位组。如果将前述的两种映射横向结合起来,一个部件将不是映射到一个键位,而是一个键位组。例如“夫”分别用两种方法映射,映射1将其映射到键位“Y”。映射2将其映射到键位“M”,结合两个映射,“夫”被映射到键位组“YM”。映射的纵向组合是指在用某一映射将部件映射到某一个键位上后,再以该键位作为坐标原点建立坐标系,选用另一映射对部件再度进行映射,映射到一个新的键位上。映射的纵向组合可以用单个键位反映部件更多的特征信息,可以更加均匀的将部件映射到键盘上。有利于减少汉字重码。例如在映射1的基础上再建立一个新的映射,取部件第2笔划类型做为映射特征,就是一个映射纵向结合的例子。定义部件第2笔划的类型也为类1、类2和类3。假设映射1已将部件映射到X1键,新的对第2笔划类型的映射定义如下第2笔划类型为类1,部件被映射到X1键上。第2笔划类型为类2,部件被映射到X1键上的垂直方向(X轴正向)的下面第一个键位上。第2笔划为类3,部件被映射到X1键的垂直方向(X轴正向)的下面第2个键位上。当X1键位在键盘第1排上时,其下面第1键位和第2键位分别在第2排和第3排。当X1键位在键盘第2排上时,其下面第1键位和第2键位分别在第3排和第1排。当X1键位在键盘第3排上时,其下面第1键位和第2键位分别在第1排和第2排。这是一种循环定位方式。结合多个映射可以更充分地体现被映射部件的特征,有效地将不同的部件映射到不同的键位组或键位。重码可能性小,因此,汉字编码的重码率也小。另外,结合多个映射,合理地安排和使用部件(或汉字)的特点,可以在不对汉字进行拆分或分成两个部件的情况下,直接将汉字映射到一个键位组,而确定其编码。汉字码长增加,重码率变小,但输入速度变慢,因此,汉字编码的码长一般不超过4码。在码长固定的情况下,减低编码的重码率是一项关键而艰巨的工作。通过调整汉字编码中某些汉字部件的码位和(或)码序,可以极大地降低汉字编码的重码率,而基本上不增加记忆量。当选择上述映射1对部件“土”和“王”进行映射时,他们被映射到相同的键位,而以“土”和“王”为部首的汉字都很多,以“土”和“王”为部首的汉字极易出现重码。部件“土”和“王”在汉字部首出现的频率很高,而在其它位置出现的频率都较低。在对以“土”为部首的汉字进行编码时,将出现在编码首位,代表部件“土”的字母移到编码序列的末尾或插入到编码序列的第2个或第3个字母之后,这样将极大地减少以“土”和“王”为部首的汉字的重码率,通常可以将重码率减少到原来的1/4到1/5。例如字“坡”和“玻”为重码字,假设其编码均为ABCD,对于字“坡”将其编码调整为BCDA,则“坡”字与“玻”不再是重码字。对汉字编码的码位和(或)码序进本文档来自技高网...

【技术保护点】
一种汉字编码方案,该方案将汉字分解成若干汉字部件或不分解,其特征是:汉字部件或汉字本身根据其特征信息映射到键盘键位上,而无需任何记忆,部件或汉字可以映射到单个键位,也可以映射到一个键位组,同时,通过调整汉字部件在汉字编码序列中其编码字母的位置和(或)顺序来减少汉字编码的重码率。

【技术特征摘要】

【专利技术属性】
技术研发人员:周南塔
申请(专利权)人:周南塔
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1