优化五笔字型编码法及其键盘制造技术

技术编号:2893936 阅读:327 留言:0更新日期:2012-04-11 18:40
优化五笔字型编码法及其键盘设计,是一项综合语言文字学'计算机科学、信息科学、工程心理学等多学科知识的发明专利技术.发明专利技术提出五种笔划、四种字型和字词兼容原理,用26个英文字母对汉字和词汇依形编码,并设计了几种便于自学的辅助输入法,适用于非专职输入人员.依组字和实用频度优选的键盘字根,依形分区划位,好学易记,码长短、重码少、键位使用概率分布合理,输入效率高,每分钟可输入150个字,可广泛用于各类中文信息处理系统中.(*该技术在2005年保护过期,可自由使用*)

【技术实现步骤摘要】
计算机在中国广泛使用的重要障碍,即汉字的计算机输入问题,被称为中文信息处理的瓶颈,而如何采用计算机原装键盘的26个字母键,完成数以万计的汉字和词汇的纯字形编码,并设计出直观易学的高效能汉字输入键盘,则被认为是我国信息革命中的重大难题。一九七八年前后,国内流行拼音编码或音形结合编码,皆基于汉语音素较少,汉字读音简单这一特点。虽可使用标准键盘,但我国幅员辽阔,方言多杂,人们不认识或读不准音的字很多,因而这类方案的处理字数及使用范围均受到限制。纯读音方式,因汉字同音字太多,需不断地在屏幕上选择才能输入,不可能做到只看原稿不看屏幕快速盲打,因而效率很低,每分钟一般可输入10-20个汉字。音形结合法,往往需要掌握读音与字形两种因素,其设计一般更难学习和使用。整字大键盘法,不但需要制做专用设备,增加系统成本,而且几千个汉字摆在面前,找字困难,效率更低。一九八一年香港中文大学乐秀章教授发表了使用256个键位(专用键盘)的纯字形输入方案。几乎同时,又有美国王安公司的三角编码问世。国内则有云南大学张其浚教授的60键专用键盘方案等。这些设计,都需要制做专门的中文键盘,因而使系统成本增加,难于在现有机器上普及推广。使用标准键盘的26-36个键完成汉字的纯字形输入,则是国内外研究者追求的更高目标。使用26个键又比使用36个键更便于盲打和提高输入效率。一九八二年台湾宏基公司推出了“天龙字母输入法”,可使用26个字母键处理汉字。但该专利技术由于对汉字的规律性缺乏深入研究,与写字截然不同的拆字规则难于被人接受。如把“目”拆成为“ ” ,把“力”拆成为“”等,同时它也缺乏多学科知识(比如工程心理学在编码和键盘设计中的应用)的综合应用,因而规则繁杂,编码长度较长。表面记忆因素很少,实际记忆因素很多。比如有5%的字作例外字编码。另外,该技术也没有解决词语处理问题。因此,“天龙方案”及其键盘设计难于走向大面积实用化,实际上并没有很好地解决汉字的纯形计算机输入问题。而“优化五笔字型”编码法及其键盘,则在对一万多个汉字进行逐个拆分,对几万张卡片进行统计分析之后,在世界上首先提出了“汉字字根组字频度表”和“汉字字根实用频度表”。为汉字的笔划、字根、字型规定了准确的定义。在把优选出的130种字根依形分类划组建立序列的同时,又根据键位概率及指法要求,对A-Y等25个字母键进行了划区分位。使每一组字根对应一个键位,从而将一个计算机原装标准键盘,设计成为一个直观易学的中文字根键盘。利用这一键盘的字根,可以像写字一样,方便地组合出近7000个汉字和数千条(不限)中文词汇。字根键之外的“Z”键留作机动,可代替操作者一时不知道的任何字根,进行人机对话式输入法学习。这一专利技术,提供了“五种笔划”及“字根拼形”两种输入方法。前者有十分钟即可学会的近期效果,后者则有每分钟可输入一百五十个汉字的高效率远期前景。因此本专利技术无论对于专职或非专职操作人员,都相当易学、易记、易用,从而,使计算机的汉字输入技术真正走向实用化。本专利技术涉及一种优化五笔字型编码法和依据这一方法设计出的一种中文输入键盘其特点在于完全依据汉字的字形信息,采取五种笔划或字根拼形的方式,实现汉字与中文词汇易学易用的高效率输入。本专利技术适用于一切大、中、小、微型计算机中文信息处理系统和通讯系统,并将在中文终端、中文电传、电脑打字和计算机汉字排版印刷等方面获得广泛应用。计算机中文信息处理系统中,单个汉字和中文词汇快速输入的问题,是所有使用汉字的国家和地区推广应用计算机中迫切需要解决的难题,先有技术中采用的各种编码方法,有笔划代码法,整字大键盘及音形结合编码法。有的仅只以笔划为基础进行编码,有的仅只以汉字字根为基础进行编码,而且所需字根极多,没有规纳找出其内在的联系,因而一般存在键位多、需要专用输入设备、记忆量大、操作繁琐、重码较多、键入速度低等缺点。本专利技术采用字根拼形组字的方法,直观易学、操作简便、字词兼容、输入速度高,经过优选的若干字根定义在标准通用英文键盘的字母键上,使之成为一个中文键盘。使用这种键盘,可以向计算机输入上万个汉字和数千条中文词汇,操作人员用手盲打键入,每分钟可以输入120-150个汉字。使汉字输入计算机的效率大为提高。优化五笔字型编码法及其键盘将汉字视为拼形文字,划分为笔划、字根、整字三个层次。笔划结合产生字根,字根组合形成汉字。字形编码既不考虑汉字的读音,也不把汉字全部肢解为单个笔划,而是按照书写顺序,以字根为单位组字、组词,并在印制有字根和字根代码的键盘上,按键完成编码输入。为实现这一编码方案,本专利技术首先对数以万计的汉字中的所有字根进行拆分统计,按照每个字根在汉字中出现的组字频度和其在各种报刊、杂志和书籍的抽样调查中,实际出现的频度进行筛选,通过对大量字根的优选计算,将选出的字根分类,找出这些字根的组字频度和实用频度,构成本编码法的重要依据。然后再将组成字根的基本笔划概括为横、竖、撇、捺、折五种,其中每种笔划都是按笔划书写走向,将相类似的笔划归纳在一起,例如折类,是将, ,乙, ,乛, ,这几种不同形式的曲折笔划概括为一种类型,并按照这五种笔划的使用概率,依次命以阿拉伯数字代号1,2,3,4,5,如图1。此外,根据汉字的字型特点,将汉字的字型归纳概括为四种拓朴图型,即左右型、上下型、外内型和单体型。这四种图型是以汉字的直观视觉效果和组成汉字的字根的位置划分的。例如,将直观看去是由左右两部分或三部分字根并列组成的汉字归为左右型,如江,语,部,湘这几个字的拓朴图型为 。每种字型按照其频度,依次命以阿拉伯数字1,2,3,4作为其字型代号,如图2所示。根据组字频度和实用频度的高低,将优选出的字根按其相互间的相容关系,归并结合为五个区,每个区分别用1,2,3,4,5,表示。每区再分成五个键位,用1,2,3,4,5分别表示每个键位的位号。这样得到25个键位,每位都用两个阿拉伯数字作为其所在区位的代码,如图3所示,区号与该区字根的首笔笔划代号一致;位号一般与本位字根的次笔笔划代号或字根的单笔数目一致。这样形成了一个字根总表,如图5所示,将其中主要的成字字根排列在25个键面上形成了一个25组字根的代码键位图,每一组中,选出一个使用频度较高,又有代表性的字根作为汉字键名。如图4所示,图中处于同一键位的字根,像化学元素周期表中的同位元素一样,称作同位根。将上述选出的25组字根,按照每组字根的使用概率大小和键盘指法习惯安排在标准通用键盘上的A-Y这25个键上,形成一个中文键盘,如图6所示。为了便于将现有计算机的原装英文键盘改造成为一个汉字字根键盘,本专利技术提出了一种经济简便的方法,即印制与键帽键面相适应的字根胶粘标签,粘在键帽上方。标签之上,既有汉字字根,又有原键位的英文字母。另外,作为中文键盘的区位号及高频汉字,则用较小的胶粘标签粘在按键的前侧面。本专利技术按汉字书写顺序以字根为单位对汉字编码或在键盘上键入代码,每一汉字最多四码。四个字根的汉字,输入时可按书写顺序键入全部字根;汉字经分解后的字根数超过四个时,只键入第一、第二、第三和末一个字根。例如<照>可取日,刀,口,灬<赣>可取立,早,夂,贝对少于四个字根的汉字,在编取或键入代码时,应在其本文档来自技高网...

【技术保护点】
一种优化五笔字型编码法,其特征是依据汉字字根的组字频度和实用频度对汉字字根、字型和笔划进行优选,将选出的字根按笔划特征以及它们之间的相容关系进行归并组合形成的编码体系。

【技术特征摘要】
1.一种优化五笔字型编码法,其特征是依据汉字字根的组字频度和实用频度对汉字字根、字型和笔划进行优选,将选出的字根按笔划特征以及它们之间的相容关系进行归并组合形成的编码体系。2.一种优化五笔字型编码法使用的汉字字根总表,即图5,说明汉字字根之间的内在联系和相容关系,是进行中文依形编码的基础。3.一种优化五笔字型键盘字根排列图,即图4,是依据汉字字根之间的相容关系,参考字根在中文信息处理时的使用概率和键盘的指法规则排列在标准键盘的字母键上。4.如同权利要求1和2,对GB-2312(80)中全部6763个汉字进行依形编码,形成了一套优化五笔字型编码码本;其中含有汉字全码、简码和通用词汇的编码。5.如同权利要求1的方法,将汉字基本笔划归纳为五种,即横、竖、撇、捺、折,并分别按其频度大小依次命以代号1,2,3,4,5。6.如同权利要求1和3,在汉字的五种基本笔划中,每种笔划包括若干笔划形态。7.如同权利要求1和4,将汉字的横(一)、竖(丨)、撇(丿)、捺(丶)、折(乙)五种笔划安排在标准键盘的一组数字键上,成为一个可用单笔划输入汉字的小键盘。即图8。8.如同权利要求1的方法,将汉字的拓朴图形归纳为四种字型,即左右型、上下型、外内型和单体型,并分别按其有关字数的多少依次命以代号1、2、3、4,即图2。9.如同权利要求1和2的方法,将汉字的末笔笔划代号和字型代号交叉结合,形成一种具有独特识别能力的附加代码,图7。10.如同权利要求1和2的方法,对中文词组和汉字都采用依形取码方式,其编码形式完全一致,实现词汇和汉字和编码共容,混合键入时不用换档或其它附加操作。11.如同权利要求1的方法,对两个或两个以上汉字组成的中文词汇,其依形编码的长度均不超过四码。12.如同权利要求1和2的方法,对于超过四个字根组成的汉字,只取其第一、第二、第三及最末一个字根参加字根编码。13.按照权利要求1或3,将优选出的字根,依据其首...

【专利技术属性】
技术研发人员:王永民
申请(专利权)人:北京市王码电脑总公司河南省计算中心河南省南阳地区科学技术委
类型:发明
国别省市:11[中国|北京]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1