当前位置: 首页 > 专利查询>大理学院专利>正文

一种汉字形声编码输入法制造技术

技术编号:2918931 阅读:197 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种汉字形声编码输入法,属计算机文字信息处理领域。它把汉字按自然结构划分为独体字和两体字二类,汉字体的首笔画划分为斜、横、竖3类,分别与英文字母键盘的三行对应,次笔画划分为横、竖、撇、捺(点)、单折、复折六类,分别与英文字母键盘的第三至第八列对应,首、次笔画的关系分为交叉、方框二类,分别与英文字母键盘的第一、二列对应,从而形成3×8的二维坐标编码键位,取每字体首、次笔画组合得到两体字的第一码和第二码,第3码为组成该字第1体最大成字的汉语拼音首字母,第4码为该汉字的汉语拼音首字母;独体字按汉字书写顺序依次取笔对组合,后续码为汉字拼音的首字母;汉字最大编码码长为四码。本发明专利技术具有拆分汉字简单、直观、规范,编码键位安排唯一,不涉及字根、记忆量小、学习周期短,只要熟悉汉字首、次笔画所在键盘的行、列和汉字体及汉字读音声母的首字母,就可输入汉字,适应期短,掌握后不会遗忘。

【技术实现步骤摘要】

本专利技术涉及一种汉字编码输入法,是一种基于汉字简单分类的形声编码输入法,属计算机中文信息处理领域。
技术介绍
近几年来,虽然计算机技术得到不断的发展,其应用范围也在不断地扩大,但计算机汉字输入中仍然大量地依赖汉字编码方式进行操作,计算机中文信息处理过程中汉字输入方案的规范、易学和输入速度、正确率等仍然是制约用户工作效率的主要瓶颈之一。汉字键盘输入的现状是虽然汉字编码出现了“万码奔腾”的情况,但符合规范、易学、高效、适合常规用户学习的编码方案却屈指可数,尤其在学校的汉字键盘输入教学中除了拼音输入法外,没有更好的汉字输入方案,直接影响了学生键盘输入汉字水平的提高。目前,大多汉字编码存在的问题是1、形码方案大多采用字根编码方法,字根的数量多,要熟记字根,还要记住字根的分布,要掌握字根的拆分原则和编码规则,使字根编码方案难学难记。因此,字根编码方案容易产生编码不规范、编码过程复杂、记忆量大、输入法难学、一段时间不使用就会忘记等一系列问题。2、单纯的音码方案对不认识的汉字或读不准确的汉字难以录入,且因为汉字只有400多个音节,重码率高(如全拼、双拼方案)。因此,输入效率低、无法输入不会读的汉字、不能适应各种层次人员使用是拼音编码方案的缺陷,这些问题在拼音编码方案中不可能从根本上得到解决。事实上,汉字是由“声、形、义”三要素构成的图形符号,汉字键盘输入编码方案都是利用汉字的“形”和“声”两种要素来进行编码的。在汉字编码方案设计中,提取汉字拼音的首字母、部份笔画和笔顺信息,既能体现汉字特征,又精简了汉字“形”和“声”的信息,既有利于编码元素的选取,又易于用户的掌握。充分利用汉字“形”和“声”的信息,可以自然降低了编码的重码率,又能使方案易学易用。随着计算机应用领域的逐步扩大和应用程度的不断深入,计算机汉字输入方法的复杂性和易学性已成为制约汉字处理技术发展的主要因素之一,因此,有必要探索简单、易学、规范、快速的汉字编码输入方法。
技术实现思路
本专利技术的目的在于提供一种汉字形声编码输入法,只要熟悉汉字首笔画所在键盘的行,次笔画所在键盘的列,以及汉字体和汉字拼音首字母,就可以输入汉字,适合任何层次的人员学习和使用,掌握后不会遗忘。本专利技术通过下列技术方案实现把汉字按自然结构划分为独体字和两体字二种,再把汉字各体的首笔画划分为斜、横、竖三类,分别与英文字母键盘的三行对应,次笔画划分为横、竖、撇、捺(点)、单折、复折六类,分别与英文字母键盘的第三至第八列对应,首、次笔画之间分为交叉和方框二类,分别与英文字母键盘的第一、第二列对应,形成3×8的二维坐标编码键位,其中斜包含撇、捺、点、提四种笔画,竖包含竖和折二种笔画,具体对应关系见图1。两体字和独体字按下列规则编码,且汉字最大码长为四码1、两体字两体字包含上下、左右、内外三种结构,按笔顺分为第1体字和第2体字,其编码规则是第一码第1体字的首、次笔画对应英文字母键盘行、列相交的字母键;第二码第2体字的首、次笔画对应英文字母键盘行、列相交的字母键;第三码第1体是成字的,取其成字体的汉语拼音首字母;第1体不是成字的,取该体中头几笔画组成的最大成字体的汉语拼音首字母;第1体中无最大成字体的,取该体偏旁部首的汉语拼音首字母(见表1);不符合以上所列情况的,取第一体首笔画的汉语拼音首字母(见表2);第四码所编汉字的汉语拼音首字母;2、独体字按汉字笔画书写顺序将独体字分为一、二笔画字,三、四笔画字,五笔及其以上字,各类型字按下列规则编码(1)一、二笔画字第一码首、次笔画对应英文字母键盘行、列相交的字母键; 第二码;汉字的汉语拼音首字母;第三码英文字母O键;(2)三、四笔画字第一码首、次笔画对应英文字母键盘行、列相交的字母键;第二码第三笔画、末笔画对应英文字母键盘行、列相交的字母键;第三码汉字的汉语拼音首字母;第四码英文字母O键;(3)五笔画、五笔画以上字第一码首、次笔画对应英文字母键盘行、列相交的字母键;第二码第三、第四笔画对应英文字母键盘行、列相交的字母键;第三码第五、末笔画对应英文字母键盘行、列相交的字母键;第四码汉字的汉语拼音首字母;3、在以上按笔画对进行取码的过程中,如果笔画对的第一笔画和第二笔画构成交叉或方框时优先取码。具体编码方法(一)两体字两体字的编码顺序为(第1体字的首、次笔画对应英文字母键盘行、列相交的字母键)(第2体字的首、次笔画对应英文字母键盘行、列相交的字母键)(第1体成字的汉语拼音首字母)(所编汉字的汉语拼音首字母),即1、第一码和第二码分别为第1体和第2体首、次笔画对应英文字母键盘行、列相交的字母键,其中构成交叉和方框时优先取码,如“码”拆分为“石、马”两体字,第1体为“石”,其首笔画是“一”、次笔画是“丿”,对应英文字母键盘行、列相交的字母键为“g”(见图1中的第2行第5列),第2体为“马”,其首笔画是“乛”(单折)、次笔画是“ㄅ”(复折),对应英文字母键盘行、列相交的字母键为“l”(见图1中的第3行第8列),第三码是第1体“石”的汉语拼音首字母“s”,第四码是该汉字的汉语拼音首字母“m”,因此编码分别为“glsm”。“盘”拆分为“舟、皿”,第1码和第2码分别为“t、x”(第二体为方框)。“体”拆分为“亻、本”,第1码和第2码分别为“r、a”(第二体为交叉)。2、第三码按以下顺序确定编码(1)当组成该字的第1体是成字的,取第1体成字的汉语拼音首字母,如“码”的第1体“石”的汉语拼音首字母是“s”;“地”的第1体为“土”,汉语拼音首字母为“t”;“突”的第1体为“穴”,汉语拼音首字母为“x”。(2)当第1体不是成字的,取该体中按书写顺序(头几笔画)的最大成字体的拼音首字母,如“能”中第1体最大成字体为“厶”,编码为“s”;“断”中第1体最大成字体为“米”,编码为“m”;“毅”中第1体最大成字体为“立”,编码为“l”;(3)无最大成字体的,取第1体偏旁部首的汉语拼音首字母(见表1),如“代”中第1体为“亻”,编码为“r”;“虎”中第1体为“虍”,编码为“h”。“沟”中第1体为“氵”,编码为“s”。(4)不符合以上所列情况时,取第1体首笔画的汉语拼音首字母(见表2),如“石”的第1体为“_”,首笔画的汉语拼音首字母为“h”;“制”中第一体的首笔画是“丿”,其汉语拼音首字母为“p”;“党”的第一体为“_”,首笔画是“丨”,其汉语拼音首字母为“s”。3、第4码为该汉字的汉语拼音首字母。(二)独体字独体字按汉字笔画书写顺序分为一、二笔画字,三、四笔画字,五笔及其以上字三种类型,按以下规则编码1、一、二笔画字的编码顺序是第一码首、次笔画对应英文字母键盘行、列相交的字母键; 第二码汉字的汉语拼音首字母;第三码英文字母O键。2、三、四笔画字的编码顺序是第一码首、次笔画对应英文字母键盘行、列相交的字母键;第二码第三笔画、末笔画对应英文字母键盘行、列相交的字母键;第三码汉字的汉语拼音首字母;第四码英文字母O键。3、五笔画、五笔画以上字的编码顺序是第一码首、次笔画对应英文字母键盘行、列相交的字母键;第二码第三、第四笔画对应英文字母键盘行、列相交的字母键;第三码第五、末笔画对应英文字母键盘行、列相交的字母键;第四码汉字的汉语拼音首字母。即独体字按汉字笔画书写顺序最多取3组笔本文档来自技高网
...

【技术保护点】
一种汉字编码输入法,其特征在于把汉字按自然结构划分为独体字和两体字二种,把各字体的首笔画划分为斜、横、竖三类,分别与英文字母键盘的三行对应,次笔画划分为横、竖、撇、捺(点)、单折、复折六类,分别与英文字母键盘的第三至第八列对应,首、次笔画之间分为交叉和方框二类,分别与英文字母键盘的第一、第二列对应,形成3×8的二维坐标编码键位,其中斜包含撇、捺、点、提四种笔画,竖包含竖和折二种笔画,具体对应关系如下(其中:第三行第八列实际对应字母L键):交叉方框横竖撇 捺(点)单折复折***。

【技术特征摘要】

【专利技术属性】
技术研发人员:施冰段利华李锟华陈本辉
申请(专利权)人:大理学院
类型:发明
国别省市:53[中国|云南]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1