汉字字形输入法制造技术

技术编号:2893890 阅读:364 留言:0更新日期:2012-04-11 18:40
汉字字形输入法是钱伟长教授研制的计算机汉字新颖输入法.本法根据人们长期使用汉字的习惯及普遍接受的识字规律,结合汉字结构的特点,将一个汉字以其宏观的字形部件进行编码.输入速度快,并具有编码规则简洁,逻辑性强,易学好记等特点,便于使用和推广.汉字字形输入法对简体字和繁体字都适用,已在微型计算机上实现.(*该技术在2005年保护过期,可自由使用*)

【技术实现步骤摘要】
一.专利技术创造主要详细内容(包括关键内容) 本法是一种简单易学,面向大众的新颖汉字输入法。 钱伟长教授根据人们长期使用汉字的习惯及普遍接受的识字规律,并结合汉字结构的特点,提出将一个汉字以其宏观的形态进行编码,使编码方法尽可能与人们的识字规律相吻合,这在编码方法上是全新的,并具有编码规则简洁,逻辑性强,易学好记,便于使用和推广等特点。在本方案中,任何一个复杂汉字(简体、繁体)均只须输入三码,因而输入速度快,使用效率高。 1.在大量实践及统计的基础上,精取了若干基本部件。 汉字源于图形符号,是一种拼形文字,即是一种象形方块字,字数多,笔划多,字形多,是一个二维图形符号,为了将其转换成计算机能够接受的线性编码,在大量实践及统计的基础上,将那些组字频度较高的特征部分析出,定义了若干基本部件,成为编码的基本单元。当某些汉字或其中部分无法用基本部件复盖时,则辅以六种基本笔画(横、坚、撇、点、左折、右折)代替,进行编码,因此方法简单、自然,掌握方便迅速,同时本编码只取字形,不取字音,完全避免了拼音带来的困难。 2.切合识字心理规律,大胆变革基本部件归类方法-开创宏观归类新法。 大量的汉字心理学研究结果表明人们在书写汉字时,首先考虑的是关于该字的结构模型,当它在辨析一个汉字的字义时,并不需要精确地分解每一个笔划,而是近似地,甚至是模糊地从字形结构角度来捕捉字形的特征。根据大致的偏旁部首,根据上下文关系最后确定该字的含义。 本法为了最大限度减少人们对基本部件的记忆量,充分利用人们最基本的思维活动-联想力,对基本部件采用宏观方法,进行同构处理,即将那些形体相似相近的基本部件定义在一个键位上,等价一个字符。 例如在“L”键上定义了六个基本部件门、冂、匚、凵、、也就是说从宏观的角度考虑,L键上的六个基本部件的码值具有单值性,统一为“L”。 3.编码规则注重逻辑性,严密性,简易性 汉字是一种冗余量较大的图形文字,既使舍去一些笔划,人们还能辨析出字义;识字心理状态是抓住汉字的特征部分,注意边框,忽略中间。本法对每一个汉字采用了“首次尾”的编码原则,丢失了汉字的冗余量,这是提高输入速度的关键。 4.中西文兼容输入,另附加拼音输入法,国标码,区位码及电报码输入法。 以上输入方法随时可以切换,使用非常方便,适用于文字编辑,字符处理工作。 在本法输入中还可对138个西文字符和常用图案直接编码,方法独特,使用灵巧。 5.适用于IBM-PC/XT/AT,IBM-PC-5550,及其兼容的微型计算机中,支持IBM-PC机大部分软件,可进行文书处理,插字、删字、插段、删段、存盘、读盘等中文操作,并在字符串一级支持各种语言加工系统。 二.专利技术创造历史背景 自从计算机问世以来,汉字信息的编码输入一直深受人们的重视,这些年来,不少人已根据汉字字符,发音的特性对汉字从各个角度采用不同的方法进行了编码,目前用西文代码输入计算机的编码方法已超出400多种,而在各类计算机中能实现汉字输入的也已超出40多种,可进行如下归纳 1.流水码 包括电报码,气象电报码及各种通讯编码。其特点是专业性强,不易掌握,难于推广。 2.纯音码 直接把拼音(汉语拼音方案)用字符或数字来进行编码,由于汉字同音字多,重码率高,输入速度慢。 3.音形码 或称作声韵与部形结合编码。这种编码方法较难掌握,因为不但要知道某些字的声韵,而且还要掌握其部首,意义等,支码就是音形码。 4.形码 取汉字结构特征的笔形,用字符或数字作为码元进行编码,这对于不熟悉汉字声韵的人来说,带来了方便。目前采用形码进行编码的人也不少。如 河南南阳科委的王永民 大连工学院的胡宝华、朱子龙 公安部上海876所的虞柏年 他们这些编码都是按字形结构进行编码,但对各自定义的各种组字部件难于很快记牢(即缺乏联想能力),不少汉字的拆字方法难于全面掌握。 本法就是在这种历史背景下诞生的。它也是一种形码,但不同于其它形码,它的突出之处是将汉字以其宏观的特征和结构进行编码,并使基本组字部件具有联想力,为学习编码带来了方便,并具备输入速度快等特点。 三.专利技术创造已有技术及特点 本法是一种字形编码,而形码又是当前汉字信息领域中相当活跃的一个部分。目前已获得国外专利或正在申请办理的汉字编码大致有如下几种 汉字键盘 李一华等 北京大学 汉字笔形编码法及其微型键盘 李金凯 北京师范大学 汉字编码 张淑英 清华大学(拼音) 26键五笔字型编码 王永民 河南 (形码) 声韵部形 郭淑贞 (音形) 唯物中文电脑输入法 黄金富 香港 (字形) 现将形码中较有代表性的“26键五笔字形编码”(王永民)的已有技术作如下讨论 1.参考汉字部件实用频度,选取150个左右基本部件,每个键位上刻有1~3个有代表性的基本部件。 2.编码顺序与书写汉字习惯顺序一致。 3.给优选部件及字型赋于记忆代号,做到部件键入与代号键入 双轨并行。 4.使用26键标准小键盘,构件及代号在键面上的安排兼顾构件的实际频度及键盘指法。 5.不等长编码。凡按规则取够四码者,由软件自动识别,凡取不足四码者,加击空格键一次。每一汉字最多按键四次。 6.设立26个高频字及600个简码。 7.重码尽量少,并可能挤到2级字库中去。 8.处理国家标准GB2312-80基本集全部汉字。 9.汉字的笔划横 竖 撇 捺 折 一 丨 丿乙 10.汉字字型 左右型 上下型 包围型 单体型 11.汉字部件 横类 竖类 撇类 捺类 折类 王干夫 目上止 禾攵竹 言文方 心乙 土十于 日虫 白斤手 立广衤 子卩 大厂石 口 月用豕 水不 女刀九 木寸四 田四酉 人八亻 火小米 已马尸 廾无丁 山贝门 金鸟勹 之又宀 纟弓匕 12.汉字键位表 见附图(四) 13.编码规则 ①构件码与识别码 任何构件,只要同位一键,在任何字中任何位置都享用同一代码,谓之构件码。 凡取不够四个构件的汉字需追加一个识别码。识别码一般由字的末笔代号与字型代号结合而成。 例江末代号1,字型代号1,识别码即为11; 笔末代号5,字型代号2,识别码即为52; 困末代号4,字型代号3,识别码即为43; 必末代号3,字型代号4,识别码即为34; ②单体字拆分原则 依书写顺序逐笔写成最大基本构件为止,如再加一笔构不成基本构件,则另起再写成第二个基本构件,如申日 丨;两;一冂人人。 ③码式与码长。 单体字依单体字折分原则取3~4个构件码,不足四个时,追加识别码。 合体字按构件书写顺序依次取构件码,不足四个时,追加识别码。 多合字按构件书写顺序依次取第一、第二、第三,及末一个本文档来自技高网...

【技术保护点】
汉字字形输入法是一种汉字形码输入法,其特征在于从宏观角度把汉字特征和结构相似或相近的便于联想的基本部件予以归类,并辅以基本笔划。

【技术特征摘要】
1、汉字字形输入法是一种汉字形码输入法,其特征在于从宏观角度把汉字特征和结构相似或相近的便于联想的基本部件予以归类,并辅以基本笔划。2、按权利要求1所述的输入法,其特征在于把汉字组字结构归为六种基本笔划,一百五十三个基本部件。3、按权利要求2所述的输入法,其特征在于把基本笔划和基本部件定位在39个键位上,如附图(一)所说明的。4、按权利要求1所述的输入法,其特征在于把汉字繁体字归为...

【专利技术属性】
技术研发人员:钱伟长
申请(专利权)人:上海工业大学
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1