当前位置: 首页 > 专利查询>张平发专利>正文

汉字输入法编码方案制造技术

技术编号:2884600 阅读:226 留言:0更新日期:2012-04-11 18:40
本发明专利技术选用汉字的字音,笔形和结构三大特征为编码要素。通过优化三要素的配置从而形成了月亮甲,月亮乙和月亮丙三种输入方法。每种输入法既可以输入国标6763个汉字,又可以输入常用的两字,三字和四字词组两万多条。并且各种输入方式不须要切换,击三键是单字输入,击四键是词组输入。本发明专利技术选用汉字的特征笔画组合表示汉字的结构码和笔形码。使人们不须要记忆字根,就能实现汉字输入。月亮输入法适合于非专业打字人员使用。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种计算机汉字键盘输入方法及其派生的两种汉字输入法。它是依据汉字的字音,笔形和结构三个显著的特征,按照三要素的优化配置编制而成的。三种输入法优势互补构成一套完整的汉字输入方法。目前,计算机的汉字输入法,呈现出“万码奔腾”的现状,众多方案各有所长。它们存在的主要问题是好学的不好用,好用的不好学。五笔字型输入法,以其重码少,可以快速盲打著称。但是,它的规则繁多,学习不便。非专业打字人员不容易掌握。全拼输入法,只要会汉语拼音的人,几乎不用学习就能使用它。但是,它重码多,多次翻页捡字非常繁琐。目前流行的汉字输入法,多数是单一输入法。五笔字型是形码方案,全拼输入法是音码方案。缺少在一个总体构思下,音码,形码和音形码有机结合,优势互补的完整成套的输入方法。由于汉字的复杂性,单一输入法很难解决易学和易用的问题。汉码的发展趋势是建立音形优势互补的成套输入法。本专利技术的任务是解决汉码的易学和易用问题(后文将详述)。下面介绍月亮汉字输入法编码方案首先,说明有关键盘键位的代号布局问题。月亮码的码元是A至Z一共26个小写英文字母。其中Z字母的代号为00,其它A至Y25个字母分为五区,五区又分五位。五区分别为1区即横区(G F D S A),2区即竖区(H J K L M),3区即撇区(T R E W Q),4区即捺区(Y U I O P),5区即折区(N B V C X)。每区中的第一个字母是1位(横位),第二个字母是2位(竖位),第三个字母是3位(撇位),第四个字母是4位(捺位),第五个字母是5位(折位)。五区五位的分法与五笔字型的分法基本上相同。这样25个字母就分别有了11至55一共25个代号(详见附表1)。其次,说明汉字的三大特征。汉字的特征(即,属性)有很多。有字音,字形,字义等多个方面的特征。就汉字编码而言,比较适用的是字音和字形两个方面的三大特征(即,字音,笔形和结构)。字形特征包括笔形特征和结构特征。一.字音每个汉字都有标准发音,这是它区别于其它汉字的重要特征。月亮码中选用了字音要素。并且确定,音码为汉字汉语拼音的第一个字母。如汉,其音码为H。音码一共有23个,即,A B C D E F G H J K L M N O P Q R S T WX Y Z。需要说明的是国标6763个汉字中,有41个没有发音的汉字偏旁部首。它们的音码用字母O表示,即把它们归入0部。这23个音码在键盘键位表上,分别用和它们相同的英文字母表示。键盘上有26个编码键位,除去23个音码键位以外,还有UIV三个空键位,它们没有配置音码。它们用于配置汉字的结构码(后文将详述)。二.笔形笔形是指汉字的笔画形状。汉字的笔画形状有30多种。人们通常把它们分为五类。即,五种基本笔画(横,竖,撇,捺,折),其它笔画分别并入其中。其中,挑笔归入横笔,竖左钩归入竖笔,点笔归入捺笔,各种折弯钩归入折笔。月亮码也采用了这种划分方法。笔画是汉字最显著的特征。通过笔画区别汉字是汉字区分的根本出发点。月亮码中选用了笔形要素。并且定名为笔形码。而且确定,用汉字的特征笔画组合表示笔形码(后文将详述)。月亮码选用了汉字的四利特征笔画(即,首笔,次笔,末笔和次末笔)。首笔是指汉字(或汉字块)的第一个笔画。次笔是指汉字首笔之后的哪一个笔画。末笔是指汉字(或汉字块)的最后一个笔画。次末笔是指汉字末笔之前的哪一个笔画。特征笔画组合是指,四种特征笔画中,两个组合在一起用于表示汉字(或汉字块)的编码。特征笔画组合有三种,即,首末组合,首次组合和末次末组合。首末组合是指特征笔画中,首笔和末笔组合在一起,构成一个编码。首次组合是指特征笔画中,首笔和次笔组合在一起,构成一个编码。末次末组合是指特征笔画中,末笔和次末笔组合在一起,构成一个编码。首次组合和末次末组合只用于独体字(即,单块字)的编码。首末组合的代号和编码,详见附表3,首次组合和末次末组合的代号和编码与首末组合的基本上相同。区别仅仅是首次笔画组合,把附表3中的末笔换为次笔;末次末组合,把附表3中的首笔换为末笔,末笔换为次末笔。在附表3中,首笔栏目中的笔画指向键盘键位区号,末笔栏目中的笔画指向位号。这样,只要首笔,末笔确定了,它的键位代号也就确定了,编码也就确定了。首末组合的情况是这样。同理,首次组合和末次末组合也是如此。三.结构汉字的另一个主要特征是它的结构。独体字(单块字)是由笔画直接组成的。合体字(多块字或双块字)是通过汉字块的各种结构(如左右,上下,包围等)构成的。在国标6763个汉字中,独体字很少,大多数汉字都是合体字。这充分说明了结构的重要性。人们通常用两种方式区分汉字的结构。一种是,把汉字分为独体字(单块字)和合体字(多块字)两种,又把合体字分为左右型,上下型等。另一种是把汉字分为左右,上下,包围和独体四种结构。为了使汉码易学易用,有必要对这两种传统的结构形式进行整理,并且重新分类。月亮码把前一种结构形式定名为汉字的两块结构。把后一种定名为汉字的三种结构。一,汉字的两块结构。它是把汉字分为单块字(独体字)和双块字(多块字视为双块字)两种。大多数多块字(合体字)都可以非常直观的分为两块。其它少量的不容易分为两块的多块字可以运用汉字拆分规则,把它们分为两块。月亮码确定用汉字的特征笔画组合表示汉字的两块结构(后文将详述)。二,汉字的三种结构。传统的四种结构,在国标6763个汉字中的比重是不均衡的。其中,左右结构的字约占63%,上下,包围,独体三者合一约占37%。因此,这就有必要对左右结构的字进行再分类。在左右结构的字中,又包含上下结构的超过一半,约占56%,其它左右结构的字约占44%。上述数据是通过对国标6763个汉字的结构进行分类统计得到的。因此,月亮码确定把汉字的结构分为三种。即,左右上下结构(约占36%),其它左右结构(约占27%)和其它结构(约占37%)。汉字的三种结构的区分并不困难。首先,把国标6763个汉字都归入两类,即,左右结构和其它结构。然后,再从左右结构的类中分离出左右上下结构的字。剩余的就是其它左右结构的字。需要注意的是,哪些字是左右上下结构。下面,我们分析一下左右结构的字。左右结构的字有双重左右和多重(三重,四重等)左右之分。左右上下结构的字只从双重左右的类中分离。即,多重左右的类中不包括左右上下结构的字。在双重左右的字中,只要它还含有上下结构的特征(不论它是左含,右含,还是双含)就视为左右上下结构。请注意“桅”字是左右上下结构,而“搌”字不是左右上下结构。因为,“危”是上下结构,而“展”是包围结构。汉字的三种结构的编码非常简单。前文字音部分曾经述及,26个编码键位中音码占用23个,还有U I V三个没有占用。在这里,把三者用于汉字的三种结构的编码(详见附表2)。这样的编码安排,使音码和结构码不会重码。这为以后运行各种方案不须切换打下了基础。月亮汉字输入法就是以汉字的这三大特征为基础,通过各要素的合理选配,从而编制成了月亮甲,月亮乙和月亮丙三种输入法。每种输入法都有单字输入和词组输入。其中单字输入三种方法各有特点,词组输入三种方法合用一种。三种输入法中,月亮甲是主输入法,另两种是辅助输入法。下面分别介绍三种汉字输入法一.月亮甲输入法该法是一种字音和字形结合的音形码。它的码长本文档来自技高网...

【技术保护点】
月亮输入法的易学易用性,体现在它的编码和编程两个方面。有很多汉字输入法,都是选用汉字的字根为编码要素。不同方案选用字根的多少也不相同,一般是一百多个。多数都是用一定的规则,硬性确定字根在键盘上的位置。这种方式的缺点是,人们需要熟记一百多 个字根及其在键盘上的位置,并且正确拆分汉字,才能实现汉字输入。月亮输入法的特征是选用汉字的特征笔画组合表示汉字的结构码和笔形码。也就是,用首次笔画组合和末次末笔画组合表示单块结构的汉字的编码。用首末笔画组合表示双块结构的汉字的编码。汉字的笔形码也是用首末笔画组合表示。汉字有五种基本笔画。其中双双组合后形成25个编码键位,分别和键盘上的A至Y25个字母相对应。这样就可以实现汉字的编码输入。这种方式,可以使人们不需要记忆字根代码就能实现汉字输入。月亮汉字输入法的字词库文件是编码特点的具体体现。

【技术特征摘要】

【专利技术属性】
技术研发人员:张平发
申请(专利权)人:张平发
类型:发明
国别省市:41[中国|河南]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1