当前位置: 首页 > 专利查询>韦永骁专利>正文

一种电脑汉字输入法制造技术

技术编号:2883304 阅读:276 留言:0更新日期:2012-04-11 18:40
本发明专利技术是一种计算机汉字输入法。其主要特征是把汉字看作图形处理,用几何学的概念定义几种基本结构,并以此为基础构造码元。兼顾人们对汉字的习惯认识,使用汉字的字型、偏旁等概念制定编码规则。还使用字频码技术把常用字和非常用字的编码分开。使得单字码长只有三码,词库容量大,动态重码率低,能进行盲打。本发明专利技术同时解决了高效性和易学性问题。本输入法不仅适合中国人使用,也适合不认识汉字的外国人使用。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术属于电脑汉字输入法及其键盘。电脑汉字输入法有两大性能指标易学性和高效性。目前已有近两千种编码方案,但尚未有任何一种能同时达到理想的易学、高效。易学性主要取决于码元的选取和编码规则是否简明。高效性即指输入速度,应分两种情况,一种情况指非专业打字员的输入速度,这类使用者往往是一边打字一边编码,其输入速度不仅取决于输入法的动态码长、动态重码率,还取决于码元的选取是否直观。码元的选取不直观势必降低编码速度,从而降低输入速度。另一种情况指熟练专业打字员的输入速度,这类使用者已形成条件反射,打字时基本不用编码,其输入速度主要取决于输入法的动态码长和动态重码率。目前使用的输入法大致可分为形码、音码和形音码。形码中有一种以组合笔画为码元的类型,与一般形码区别较大,本专利技术将其称为组合笔画码,分开论述。其余形码则称为传统形码。传统形码,其基本特征是把汉字看作由字根组成。汉字有常用字根几百个,传统形码选择其中的100~300个字根分配到键位上,称为基本字根。余下的那些字根则必须拆成基本字根。学习传统形码,首先需要记忆大量基本字根,其次要掌握拆字方法,还要记住一些特例。学习难度很大,不具有易学性。音码对那些拼音学得好的学员来说很容易学,但对拼音学不好的人来说,音码比形码还要难。事实上,发音不准的人所占人口比例很大。而且,拼音学得好的人也不是每个字都知道读音,偶尔遇到不认识的字也会严重影响输入速度。从总体上说音码也不具有易学性。形音码,由于使用了拼音要素作为码元,对很多人来说同样不易学。有一类以汉字五种笔画为码元的输入法,确实很好学,但重码过多。因此又有人提出以组合笔画为基本码元的输入法,其主要特征是把书写顺序相邻的两个笔画看作一个码元,共有5×5=25种,再加上5种单笔画,共30个,恰好可以配置到电脑键盘上最好用的30个键位上。其易学性也强于传统形码,但由于使用了组合笔画,很不直观,因为编码时要一眼看清一个字或一个部件的第一、第二笔画也许还可以,但要一眼看清第三、第四个笔画相当困难。初学者编码时往往需要在心里把字写一遍才能确定编码,脑力负担重,编码速度慢。当然,学习时间长后可以形成条件反射。但形成条件反射的所需要的时间实在太长,很多人甚至始终无法形成,因此打字一直速度很慢。相比之下,传统形码在记住字根后取码较容易,也容易形成条件反射。因此很多学员宁可花很多时间学传统形码,也不愿意学组合笔画码。因此,组合笔画码问世多年仍然无法取代传统形码。目前公开的输入法中也有极少数采用了图形或几何的概念,但有的仅以字字根的几何特征作为字根分类的依据,本质上属于传统形码。没有摆脱传统形码的难学、难记特点。有的定义了一些几何结构为码元,把汉字看作由这些几何结构组成,进了一大步,但所定义的码元不够完善,编码规则不够简明,不仅没有能够把图形编码法的易学性特点充分地表现出来,也没有很好地解决高效性,还没有任何一种在市场上推广开。目前,具有易学性的只有极少数的图形码和以横、竖、撇、捺、折为码元的笔画码。但尚未有一种能同时实现高效性。本专利技术的目的是为了确实解决计算机汉字输入法的易学性和高效性的统一问题。为研究一般人学习汉字输入的困难,本专利技术人亲自担任了三年的电脑教师,教授多种市场上能买到的汉字输入法,不断研究学员的所遇的困难,并把成果运用到本专利技术中。经过无数次的编码实验和教学实验,不断检验的其易学性和高效性,历时六年,完成本专利技术。本专利技术基本内容包括由几何学概念定义的结构组成的码元体系。为同时满足易学性,高效性而设计的编码体系。码元体系几何学认为,线段由点组成,点无限小。线段有长度,没有宽度。两条线段之间可以有交点,也可以没有交点。点和线段不可能有交点,点要么在线上,要么在线外。本专利技术把汉字结构分为五种基本类型。具体定义如下1、散所有的点和离散的线段统称为“散”。其中的一点或一条线段称为一个“散件”。如“一”、“二”、“川”等。2、交两条线段有公共点,并且公共点都不是两线的端点。这两条线段的关系称为“交”。这个公共点称为“交点”。如“十”、“艹”等。3、顶两条线段有公共点,并且公共点是其中一根线的端点,但不是另一根线的端点。这两条线段的关系称为“顶”。这个公共点称为“顶点”。如“上”、“非”等。公共点不在端点上的线段称为“梁”,公共点在端点上的线段称为“柱”。4、连两条线段有公共点,并且公共点在两条线段各自的一个端点上。这两条线段的关系称为“连”。这个公共点称为“连点”。如“厂”、“了”等。5、口至少有三个角为连的矩形。如“口”、“回”、“尸”等。上述所说的公共点指一个字块里两条线段之间的公共点,不包括汉字部件与部件之间的公共点。也不包括矩形四个角上的公共点。如三条以上线段汇聚于一点。公共点的结构类型由最先书写的两条线段决定。其余线段看成“散件”。如“才”第一个公共点看作“十”不看作“ ”。在汉字中,根据线段的走向,线段可分为横、竖、撇、捺四种类型,其中横和竖统称为“正线”,撇和捺统称为“斜线”。笔画中的“折”可看作几条线段相连。有一种弧线没有明显的转折点(如“儿”的左边、“戈”的第二个笔画的转折点之前的部分),本专利技术将往左拐的孤线看作“撇”,往右拐的孤线看作“捺”。“散”、“交”、“顶”、“连”、“口”五种基本结构可以根据需要进一步细分成更多个具体结构作为编码的码元。表1显示本专利技术一个实施方案的码元名称、定义及代表符等。表1一种实施方案的码元名称、定义及代表符 以上定义其外延包含了所有的“口”、“交”、“散”。有极少数“顶点”、“连点”不属于上述定义范围,编码时可当其不存在。如“公”字右下角的顶点当作不存在,把横和捺的关系看作离散关系。如上所述的码元集中,一个键位只定义一个码元,一个码元只有一种几何定义,为便于初学者使用,有些码元用两个符号作为代表符,这两个符号都符合所给出的定义,只是其具体形状有点差异。附附图说明图1是本实施方案的码元在键盘上的分布图。可以将“码元代表符”、“码元名称”中的任一种或两种标到键盘上,形成韦码键盘,有利于使用者记忆。所述的码元,允许少量调整、变更,其变化可以在10%左右。编码体系汉字分为左右型、上下型、包围型、独体型四种。前三种统称合体型。本专利技术编码码长可取三码或四码。三码方案规则如下独体字按从上到下,从左到右顺序取三码。不足三码加空格键。合体字偏旁打一码,非偏旁打两码。非偏旁部分如仍为合体结构则将其分为两部分,各取一码,如为独体结构直接取两码。非偏旁部分不足两码则从偏旁取一码,如偏旁也只有一码,则不再取码,加空格键。取码顺序按从上到下,从左到右取。四码方案规则如下独体字按从上到下,从左到右顺序取四码。不足四码加空格键。合体字偏旁取一码,非偏旁取三码。非偏旁部分仍为合体结构则将其分为两部分,前者取一码后者取两码,如为独体结构直接取三码。非偏旁部分不足三码则从偏旁取足四码。如从偏旁取码后码长仍然不足四码,则不再取码,加空格键。取码顺序按从上到下,从左到右取。初学者可以按如下程序编码1.判断字型,区分独体字和合体字。如是合体字,区分偏旁和非偏旁部分。2.寻找并标记“口”。3.寻找并标记线段间的“公共点”。4.寻找并标记单独的“散件”。5.按顺序编码。编码流程图如下 按此流程编码,可以大大提高初学者本文档来自技高网...

【技术保护点】
一种电脑汉字输入法及其键盘。其特征在于把汉字看作由一些简单的几何结构组成的图形,为满足汉字输入法易学性和高效性统一的要求,定义汉字图形的几种基本结构,并由此构造码元。并利用汉字的字型、偏旁等概念制定简明的编码规则。

【技术特征摘要】

【专利技术属性】
技术研发人员:韦永骁
申请(专利权)人:韦永骁
类型:发明
国别省市:94[中国|深圳]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1