分类多级系列汉字编码方法及键盘技术

技术编号:2892748 阅读:248 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种分类多级系列汉字编码方法及键盘。它将汉字看成是图形的集合,根据这些图形的特征,将其分为九大类36种图基,分布在26个字母键或和10个数字键上。本发明专利技术为无重码编码,输入速度快;用36种图基表示出所有的汉字,记忆量小;采用多级系列编码,入门容易,又能逐步进入高速盲打,是一种实用的汉字编码方法。(*该技术在2011年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及汉字编码方法及键盘。利用计算机处理汉字信息,关键在于汉字的输入方法。由于目前绝大多数是在通用计算机字母数字键盘上编码输入汉字,因此汉字编码方法的好坏关系到汉字输入的快慢难易。现有汉字编码主要可分为“音码”、“形码”和“音形结合码”,音码中影响最大的是“汉语拼音”,这种输入方法简单易学,拥有数量最多的用户。但是,1.音码对不认识的汉字无能为力,2.因发音不准确而难以输入,3.由于多音字的存在,即使发音正确,有时也找不到所需汉字,4.重码严重,输入速度低。由于上述缺点的存在,音码无法满足信息处理的需要。形码中使用最广的是“五笔字型”,它的重码少,使中文输入速度超过英文。但是,它的字根太多,键位归并无明显规律,难以记忆,离散重码的末笔字型交叉识别方法较难掌握。“音形结合码”,音码的缺点,它都有。本专利技术的目的在于提供一种无重码,输入速度快,记忆量少,易学的分类多级系列汉字编码方法及键盘。本专利技术将汉字看成是图形的集合,根据这些图形的特征,将其分为“散、角、夹、包、围、交、定、单、独(难)”九大类,36种图基,分布在通用计算机的26个字母键或26个字母键和10个数字键上。散类,包括离散的图基或非图基组成的“复形”字,用数字键2、3、4、5表示。其中,用数字键2表示与2有关的图基和复形字(如丷、冫、棘),以及以2点为主要特征的字(如母、舟),例“艘”的编码为“2、 、小、又”。用数字键3表示与3有关的图基复形字(如 、疒、矗),例“矗”的编码为“3、十、且”。用数字键4表示与4有关的图基和字(如少、 、雨),例“器”的编码为“4、口、大、丶”。用数字键5表示与5有关的图基(如立、五、禾),例“鄣”的编码为“5、日、十、阝”。角类,图基为角形,用数字键6、7表示。其中,用数字键6表示角形在左下方和右上方的图基(如辶、勹)以及与6有关的图基(如六、兴),例“迷”为“6、4、十”。用数字键7表示角形在左上方的图基(如厂、广)以及与7有关的图基(如七、匕),例“庇”的编码为“7、7、7”。夹类,包括夹形(如辩、衍)和反形(如北、非)等字或图基,用数字键8表示。夹形,先打“8”,再用一键表示任一侧图形(以容易表示为原则),然后表示中间图形,例“辩”的编码为“8、4、讠”。反形,先打“8”,然后用一键表示任一侧,例“非”的编码为“8、3”。数字键8还表示与8有关的图基。包类,图基为三面包形(如冂、匚、凵),用数字键9表示。例“匦”的编码为“9、1、9”,数字键9还表示与9有关的图基。围类,包括围形和以围为主要特征的偏旁部首,用数字键0表示,如园、囱等外部,粤、舅等上部,西、 等的全部。例“渴”的编码为“氵、日、0、人”,“酉”的编码为“0、一”。交类,包括单交和多交两种类形的图基,字母键M表示单交(如十、乂、力),例“协”的编码为“M、M、8”。字母键B表示多交(如艹、丰),例“蘑”的编码为“B、7、2、石”。定类,包括“金、木、水、火、土,日、月、山、石、虫,女、人、口、又,耳、手、足(言)、心(衣)、大”十九种结构固定的图基,分别用字母键“Q、W、E、R、T、Y、U、I、O、P、A、S、D、F、Z、X、C、V、N”表示(每一种“定”形都尽量把图形近似,有共同特征的固定结构归并在一起,如“土、士、干、于”归为一类图基)。例“锌”的编码为“Q、4、T”。单类,包括“一(横)、丨(竖)、丿(撇)、 (捺)、乙(折)”五种图基,分别用字母键“G、H、J、K、L”表示。独(难)类,象“也、弗、甫、冉”等难以刻画的独体字或图基,用数字键1表示。例“浦”编码为“氵、1、丶”,“镄”的编码为“钅、1、冂、人”。每个汉字可由最多4个图基构成,即每个汉字最多可分配4键。取码时1.图基表示的汉字a.无辅码连击4次图基所在键,如“日”取码为“YYYY”。b.有辅码的连击3次图基所在键后,加辅码键。如“曰”取码为“YYY0”2.合体字以散分字(图基算一整体)。例“猿”以散为原则,分为“犭、土、口、 ”4个部分各取一键,编码为“M、T、D、V”。a.多于4部分时,按有特色的优先,上下层次优先,外比内优先,同层次两部分时左比右优先,同层次三部分时中间比两边优先的原则取舍;无上述特色、特征的,则按字的首、次、次末、末四部分取码。例“器”因为4个口是特色,故分为“4、口、大、丶”,对应的键码为“4、D、N、K”。“爨”按上下层次优先的原则分为 、林、大、火”,第一部分按同层次中间优先的原则取“同”,每部分一键,“同”取“冂”,故键码为“9、2、N、R”。“徽”为左中右形,按同层次中间优先原则,中间“ ”分得两键,取“山、系”,两边各一键,“攵”取“”,故为“丿、山、系、”,对应键码“J、I、L、S”。“赢、羸、嬴、蠃”按上下层次优先,同层次中间优先的原则,分为“亡、口、贝”,“贝”又分为“冂、人”;“亡、口、羊”,“羊”又分为“丷、 ”;“亡、口、月、女”;“亡、口、月、虫”,对应键码为“G、D、9、S”;“G、D、2、X”;“G、D、U、A”;“G、D、U、P”。编码均不相重。“赣”为左右形,分为“立、日、十、攵、工、贝”,按首、次、次末、末原则取四部分“立、日、工、贝”,对应键为“5、Y、8、9”。“戆”为上下形,故“赣”只应分得三键,这时,首先应当考虑“首、末”,然后才是“次、次末”。故分为“立、日、贝、心”,对应键码为“5、Y、9、V”。b.图基少于4部分的,取码应细,不足4键加分号。例“乞”本来可以分为“、乙”两个图基,但这样取码太粗,易产生重码,故分为“丿、一、乙”,对应键码为“J、G、L、;”。3.独体字以扫描法取码,上下扫描,刻画不全时,可上中下扫描,合体字中的独体字则按分到的键数取码。例“里”为“田、土”,可分为“口、十、土”,不足4键加分号,对应键码为“0、M、T、;”。“束”为“十、 、小”,对应键码“M、Y、3、;”。“濑”为“氵、束、ク、贝”,各取一键,“束”取“十”,“贝”取“冂”,对应键码为“E、M、J、9”。4.词码规则2个字组成的词,各字取首、末图基,无末图基时补打“5”(无的谐音)。例“词组”,“词”为“讠、、一、口”;“组”为“纟、且”,各字取首末图基,为“讠、口、纟、且”,对应键码为“C、D、L、H”。“大家”,“大”只有一图基,应为“大、5”;“家”为“宀、豕”,故对应键码为“N、5、K、E”。3个字组成的词,各取首图基,不足4个补分号。例“显示器”,“显”的首图基为“曰”,故对应键码为“Y、5、4、;”。4个字组成的词,各取首图基。例“汉字编码”,各取首图基“氵、宀、纟、石”,对应键码为“E、K、L、O”。多字词,取前4个独立词的首图基,不足4个补分号。例“中国科学技术大学”,取中、科、技、大的首图基“中、丿、扌、大”,对应键码为“P、J、X、N”。“中国科学院”,取中、科、院的首图基再加分号,故为“中、丿、阝、;”,对应键码为“P、J、Z、;”。重码的处理方法是(1)天然重码,对上下结构的字加“丨”(H键)。汉字中有些字的图基完全相同,如“呗、员”;“叻、另”等。对这些字,本专利技术采用只对上下结构的字,编码时加打H键。例“员”的编码为“D、9、S、H”。(2)人为重码加辅本文档来自技高网...

【技术保护点】
一种分类多级系列汉字编码方法及键盘,其特征在于:将汉字看成是图形的集合,根据图形的特征,将其划分为“散、角、夹、包、围、交、定、单、独(难)”九大类,36种图基,分布在26个字母键上或26个字母键和10个数字键上,取码法则,(1)图基汉字,有辅码的连击3次图基所在键后,加辅码键,(2)合体字以散分字,a.多于4部分,则按有特色的优先,上下层次优先,外比内优先,同层次两部分时左比右优先,同层次三部分时中间比两边优先的原则取舍;无明显特色,上下、内外、中间特征时,则按字的首、次、次末、末四部分取码,b.少于4部分时,取码宜细,不足4键加分号,(3)独体字以扫描法取码,上下扫描;刻画不全时,上中下扫描,(4)2字词各取首、末图基,无末图基时补打“5”;3字词各取首图基加打分号;4字词各取首图基;多字词取前4个独立词的首座基,少于4个独立词的加打分号。

【技术特征摘要】

【专利技术属性】
技术研发人员:王奇臻
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:34[中国|安徽]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1