当前位置: 首页 > 专利查询>宦秉炼专利>正文

一种简繁汉字统一键盘编码的输入方法技术

技术编号:2880372 阅读:271 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种简繁汉字统一键盘编码方法及输入方法,其主要技术特征是将汉字拆解成的字根经优化筛选出具有典型意义的、构字能力强的元根,其中部分元根是含多个元素的、具有集合概念的双等根、三等根、四等根、端连根、门簇对称根、顺折根、逆折根、复折根、风簇繁体根等簇根,元根通过添加笔画或变形形成一些元根的扩展根,扩展根与元根一起构成基本根,将基本根分为26组,每组按一定规律定义于键盘A-Z26个字母键上。其基本输入方法是:第1码取左上角的基本根码,第2码取紧挨着第1码右边的基本根码,再从右下角取第3码,第4码取紧挨着第3码左边的基本根码。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术属于汉字编码技术2
技术介绍
计算机汉字输入离不开编码,虽现已有手写输入等技术,但速度较慢。至今汉字编码已出现成百上千种方案,有万“码”奔腾之说。其中最常见地有全拼、双拼、狂拼码,自然码、五笔字形、郑码、太极(二笔)码、五十字元、大易码等。汉字编码输入总的规律是记忆量小、简单易学的编码输入速度慢;记忆量大的全形码输入速度快。五笔字形、郑码、大易码是应用最广泛的全形码。前者主要用于简体汉字输入,后者主要用于繁体汉字输入,中者兼而顾之。汉字编码有几个最重要的技术指标最大码长、重码率、字根数及在键盘上排列的规律性。现较流行的快速输入编码的最大码长都为4。若为5(如专门输繁体字的仓颉码)会严重减慢输入速度。若为3,则编码空间太小,重码率急剧升高,也会严重减慢输入速度。五笔字形采用4位最大码长,25码元(即使用的编码键数),简称为4-25制。编码空间为406900(即无重码可安排的汉字、字符数)。郑码采用4-26制,编码空间为475254。大易码采用4-40制,它把其它一些非字母键也纳入编码,编码空间高达2625640。大的编码空间有利于减少重码,但给其它键字符的输入带来不便,由于手的控制范围较大,输入速度也会减慢。据笔者统计,对大陆国标6763个简化汉字的编码,86五笔字形的静态全码重码率为3.7%,郑码的静态重码率为3.9%。据资料,大易码的重码率也为三点几。五笔字形与郑码需记忆的字根都为200个左右,还有一些变形根。大易码的基本字根数为242个。五笔字形与郑码比较,前者在键盘上布置的规律性较强,相对容易记忆。郑码是按字母顺序依次安排起笔为一、丨、丿、丶、乙,等字根。这样,在键盘上的排列规律性不强。此外,郑码的字根一般带副码,更加大了学习记忆量。然而,郑码包含的编码汉字较多,兼顾繁简汉字,故为当今编码界所推崇,预装于WIN95、WIN98等操作系统中。然而,郑码对一些有偏旁简繁区别的汉字仍共用同一编码,如针針(ped)、级級(zyms)、说説(sujr)、饭飯(oxpx)等。若将这些也计入,会使重码率很高。徐跃进专利技术的“计算机汉字输入规则码”采用4-26制,简繁兼顾,对GB13000.1大字符集的编码重码率约为15%。五笔字形专利技术人王永民最近推出的繁体字根及编码方案,其主要是大写字母输入繁体字,小写字母输入简体汉字,如紹(XKVG)、绍(xkvg)。这实际是将原编码空间扩大了一倍,可大幅度降低简繁汉字混合编码产生的大量重码。但这需要记忆简繁两套字根及其分布。在应用中需进行简繁的选择与切换。此外,从心理学上分析,一个人不可能做到对两套码都达到快速的条件反射地步。虽然有进行简繁汉字转换的软件,但只会输入简化汉字的人遇到需输繁体字时,就会感到一筹莫展,反之亦然。针对上述种种分析,笔者经过十多年的潜心研究,经过成千上万次的方案比较,专利技术了这一套简繁全汉字统一键盘输入编码。它具有技术指标优良,记忆较容易、输入心理感受顺畅等优点,以下简称为幻码。它采用4-26制编码空间。在初步用其对现代汉语词典及简化汉字总表的所有约13000个简、繁、异体汉字及一些偏旁部首进行统一编码的静态全码重码率仅约为3.9%。若只考虑其中的6763个国标简化汉字的编码,则重码率仅约为2.3%。幻码包容多字符、而又低重码的奥秘在于其对汉字结构取根独到的新认识以及在编码规则上的突破。幻码是更纯粹的形码,根据字根的位置取码,省去对书写笔画顺序的思维,这样更直接迅速。幻码包括57元根,在键盘上分布极有规律。记住这57个元根就完成约一半的键盘基本根记忆工作量。因为其它的键盘基本根是元根添加笔画或变形而构成的,易于记忆。如H键的元根‘一’可扩充构成同键的基本根‘、丆、石、不、雨’等。3
技术实现思路
3.1 专利技术目的对约14000多简繁汉字、异体字、偏旁部首的大字符集以及一些常用外文字母、假名、符号进行4-26制低重码编码。解决现所常见编码包含字数少、简繁分编和/或重码率高等问题。实现大中华文化圈汉字大字符集的统一编码和计算机上对它们的高速盲打。在各个汉字输入领域特别是出版界有着广泛的应用前景。3.2 本专利技术的基本思路是一种简繁汉字统一键盘编码方法,包括(1)将汉字拆解成的字根经优化筛选出具有典型意义的、构字能力强的元根;(2)其中,部分元根是含多个元素的、具有集合概念的簇根;(3)其中,部分元根含该元根的归类同根。(4)将元根至少分为26组,每组元根定义于计算机键盘的一个键位上;在本专利技术中,所述元根的确定还考虑了以下因素有利于大量减少重码率;使总的字根数尽量少;使其能在键盘上的布置规律性较强;3.3 所述元根是仅对简体汉字编码时,至少包括下列字根(共52个)レ、疒、 众、乙、 厂、人、フ、广、 、、儿、丿、 、七、木、十、力、宀、 、卜、艹、ナ、扌、 、阝、厶、小、大、ク、 、三、 、双、一、二、丁、 、耳、氵、ッ、丶、冫、丷、囗、口、 冂、虫、 对简繁汉字统一编码时,还应增加下列字根(共5个) 、風、門、金、言。3.4 本专利技术中(1)所述元根的归类同根是(共10个)阝——乃、木——朩、冂——凵、匚—— 、丿—丨、人—入、一— 、丶—、金—釒、 — (2)所述簇根包括双等根、三等根、四等根、端连根、門簇对称根、顺折根、逆折根、复折根、風簇繁体根等,其中a.双等根由完全相同的两部分笔画或字根组成的且未归入其它键的根,以元素‘双’代表;b.三等根由完全相同的三部分笔画或字根组成的且未归入其它键的根,以元素‘众’代表;c.四等根由完全相同的四部分笔画或字根组成的且未归入其它键的根,以元素 代表;d.端连根任意两笔画端头相连接且不属于其它定义所构成的根,以元素 代表;e.門簇对称根左右两部分对称或近似对称且不属于其它定义的根,以元素‘門’代表;f.顺折根书写总体行笔方向为顺时针旋转的折,以元素 代表;g.逆折根书写总体行笔方向为逆时针方向旋转的折,以元素 代表;h.复折根书写行笔方向既包含顺时针旋转,也包含逆时针旋转的折,以元素‘乙’代表;i.風簇繁体根是指5个只出现在繁体字中的字根,包括風、龍、 3.5 下列元根通过添加笔画或变形形成一些元根的扩展根,扩展根与元根一起构成基本根レㄑ、乚、 纟、匕、 丩、比;乙ㄋ、ㄅ、ㄋ、讠、廴、九;人 、俞;フ 乛、亅、マ、ユ、子、孑、ㄗ、刀、 彡、彳、 、川、  、钅、 、气;儿 丿 ノ、ハ、山;亻、 、刂、 、丿丨、 隹;七 屮、出;十土、士、由、吉;力又、 犭、叉、巾、女、车、戊、戋、 卜 、止、 卤;艹廿、 卄、廾、卅、 带;ナ乂、 、尢;扌 、丈、丰、 、末;、爫、丬、 厶幺、糹、糸;小忄、、氺、水、 、尚;大夫、 ク勹、、夂、 、鱼、詹;鸟;三王; 一 、丆、石、不、雨;二平;西、覀氵灬、 癶、心;丶门、之、辶、礻、亠、方、童;冫 丷、火、并、半;囗甲; 鳥;ㄇ冂、卩、冖、几、 殳; 尸、弓、巳、 民。3.6 所述键盘为国际上通行的标准计算机键盘,基本根与键盘的对应关系是Tレ、疒、众,ㄑ、乚、 、纟、匕、 丩、比;G乙、厂、人,ㄋ、ㄅ、讠、廴、九, 、俞;B フ、广、金, 乛、亅、マ、ユ、ㄗ、子、孑、刀、 R 、儿,彡、彳、 、川、 、钅、 、气, 本文档来自技高网
...

【技术保护点】
一种简繁汉字统一键盘编码方法,其特征是:(1)将汉字拆解成的字根经优化筛选出具有曲型意义的、构字能力强的元根;(2)其中,部分元根含该元根的归类同根。(3)其中,部分元根是含多个元素的、具有集合概念的簇根;(4)将元根至少分 为26组,每组元根定义于计算机键盘的一个键位上。

【技术特征摘要】

【专利技术属性】
技术研发人员:宦秉炼
申请(专利权)人:宦秉炼
类型:发明
国别省市:53[中国|云南]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1