当前位置: 首页 > 专利查询>周伟平专利>正文

汉字部件按表形的五种笔画分类的编码法制造技术

技术编号:2891012 阅读:371 留言:0更新日期:2012-04-11 18:40
汉字部件按表形的五种笔画分类的编码法,所属技术领域是中文信息处理。主要解决的技术课题是中文计算机汉字输入技术中编码方案的易学、易记、易用同汉字快速输入之间的矛盾。其特征在于将汉字部件按表形的五种笔画(横、竖、撇、点、折)分成五大类,又将每类汉字部件按其形状相似或其直接或间接的联系分组,从而形成的中文信息处理系统,简繁体、字词兼容。适用于各类人员使用,可实现从“易学”到“高速”的自然过渡。(*该技术在2015年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种计算机的汉字编码输入法及其键盘,特别是一种汉字部件按表形的五种笔画分类的计算机汉字编码输入法及其键盘。所属
是中文信息处理。将近二十年来,尽管已经出现了上千种汉字编码,但是“万变不离其宗”。这许多编码方案,基本上仍然离不开数码、音码、形码这三大范畴,或是音、形、数码的结合体。数码,就是用数字对汉字编码,典型的“有理序号数字编码方案”是电报码和区位码,基本上可以做到每个汉字和符号只有一个码没有重码。从理论上说,如果按照汉字的使用频率进行编码,频率越高的码长越短,并且安排在键盘的最佳输入位置上,无疑将会大大提高汉字的输入速度。但是这种被称为“无理序号数字编码方案”设计困难,至今只有广西省肖水清的“肖码”一家,至少在目前还无法比较这一类编码哪家的最好。音码,就是根据汉字的读音来编码,典型的音码方案是汉语拼音输入法,山东省唐樊宽的“中文声数码”,四川省钱玉趾的“未来码”也属于这一类。音码的优点是容易学。五十年代以后,汉语拼音已经相当普及,至少在北方地区的中小学毕业生大都会用。因此拼音输入法在广大的北方地区,特别是非专业录入人员中拥有相当众多的用户。缺点是重码多,难以达到盲打和快速这两条要求。二是南方人普通话读不准,在方言区使用比较困难,三是不认识的字就无法输入,除了翻字典查读音之外仍不得不借重区位码,笔画或部首等输入法作为补充。形码就是根据汉字的字形来编码。典型的形码输入方案,可以河南省王永民的“五笔字型”为代表,刘国斌的“层次四角”和江西省万仁芳的“前三末一”也属于这一类。形码输入方案的优点是重码率低,码长大都比较短,不认识的字也能够输入,缺点是各有一套拆分汉字进行编码的方案,要记住一百多个字根在键盘上的分布位置,规则多达一二百条,还有许许多多的例外,即便是智商高、年纪轻的人,没有一两个月时间的专门训练,大都很难熟练掌握,就是完全掌握了,每天上机工作时间也不能太长,不然,由于精神过分集中,脑力过于疲劳,会影响操作人员的身体健康。形码还有一个缺点,那就是不能放。一旦放下,就会忘得精光,再要“拣”回来,虽然不象新学那样困难,也还是要花费许多精力和时间的。音形码是既根据汉字读音,又兼顾汉字字形的输入方案,这一类方案已经很多,例如四川省陈代于的“大众码”,北京市郭淑珍的“声韵声声”,扶良文的“智能码”,周志农的“自然码”等,由于汉字本身具有“同音不同形,形似不同音”的内在规律,编码兼顾音形,在一定程度上可以降低重码率,但是,每个汉字都根据音形编码,码长必然累赘;某些字只根据读音编码,某些字则结合音形编码,则又打乱了体系,缺乏严格的准则,最后只能依靠死记硬背来使用编码,增加了学习的困难。经过将近二十年时间的研究和思考,人们发现作为中文信息处理最基本最重要手段之一的汉字键盘输入技术,虽然已经解决了有无的问题,但离实际需求还差得很远,真正适合于各类人员使用的规范化、通用型汉字键盘输入系统还没有产生,汉字键盘输入技术的研究还没有结束。因此,目前除了普及之外,关键在于进一步提高。所谓普及,就是充分发挥现有汉字键盘输入的效益,扩大汉字键盘输入系统的应用。所谓提高,就是在规范化、智能化的基础上,在系统化国际化的前提下研制出一种或几种既容易学又打得快的综合集成型汉字键盘输入系统。研制规范化、智能化、系统化、国际化的综合集成型汉字键盘输入系统不仅是计算机工业生产和广大用户的迫切要求,也是汉字键盘输入发展的必然结果。在“八五”期间,我国的汉字键盘输入技术首先必须相对集中,逐步统一,形成规范。数码、音码、形码三大体系及其混合形式不妨先综合出一两种最佳或较佳方案来,进而对三大体系加以综合集成,扬长避短,互为补充,使之融为一体,最后形成规范化的汉字键盘输入系统。其次要使目前存在的“专业高速型”和“普及易学型”两大类型汉字键盘输入法有机地结合起来,真正做到从“易学”到“高速”,从“普及”到“专业”的自然过渡,形成既容易学又打得快的二者兼优的汉字键盘输入系统。第三要对繁简汉字、中外汉字、今古汉字以及单字与词语的编码作统一的考虑有机地结合,包容在一个汉字键盘输入系统之内。一、规范化汉字编码的基础是语言文字。要使汉字键盘输入系统规范化,首先必须对语言文字的成份、结构、语法、语义等有关规律进行研究,逐步加以规范化和标准化。规范化方面的工作有(1)进行汉语字词读音规律的研究,使双拼法的声韵母替代及其键位安排合理化、规范化,字词及短语的拼写与标调规范化。(2)进行汉字字型结构及其演变规律的研究,使各种字体的汉字字形规范化,笔画、笔顺规范化,偏旁、部首、字根规范化,汉字结构图形规范化以及汉字字型分解合成规则和步骤等的规范化。(3)进行汉字(包括笔画、字根)和词语频度的研究,建立字词流通频度统计系统,定期公布统计结果,进行使用词语规范化,建立标准的通用词语库。(4)进行汉语语法、语义和句型的研究,使常用句型规范化。(5)进行汉语字、词、语句其他属性的研究,建立标准的汉语字词属性库和知识库。二、智能化汉字键盘输入与计算机交互的界面,汉字编码的实质是把人所能认识和识别的自然语言符号体系(汉字)唯一地、正确地转换成计算机能够识别和处理的符号体系(ASCII字符),这种转换要求做到唯一性(无重码)、正确性(无差错)、一致性(规律一贯)、快速性(高效)、简易性(学用容易)。但是由于汉字本身的复杂性,使得这些要求很难在同一方案中完美地兼容,长期以来一直困扰着编码专家们。从用户角度看,目前的汉字键盘输入方法不外乎两大类一类是适合于普通用户的普及型方案。编码规则简单且多数方案是建立在国民文化教育背景基础之上的,所以学用大都比较容易。但是码长比较长,重码比较多,输入速度普遍不高。另一类是适合于专业操作人员使用的高速型方案,编码规则大都比较复杂,而且还有许多特殊的例外约定(即一致性较差),因此需要经过专门学习特殊训练和较长时间的熟练以后才能掌握。如果集中这两类方案的优点,把汉字键盘输入方案建立在国民文化教育背景知识的基础上,并把编码过程中需要人脑记忆的规则交给电脑去完成,充分发挥计算机的智能作用,从而产生一种既容易学,又打得快的通用型汉字键盘输入方案,那就理想了。三、系统化当前汉字输入方案需解决的问题(1)数码、音码、形码三大编码体系的共容互补、有机结合。(2)简繁汉字、中外汉字、今古汉字的统一处理和自然过渡。(3)汉字键盘输入方法与计算机系统软件、常用办公软件的有机结合,使之成为功能完善的集成办公软件。四、国际化当今世界是一个信息世界,各国和各地区之间的信息交换日益频繁,由于中文信息处理所使用规范、标准和系统没有统一,严重影响了亚洲国家和地区之间的信息交换。所以,汉字键盘输入系统虽然主要是为中国人服务的,但是不能不考虑到还有许多亚洲国家和地区也在使用汉字,所以国际化问题是存在的,其主要内容是(1)亚洲国家和地区所使用的汉字内码、交换码之间转换。(2)简繁体之间的互相转换。(3)常用词语的转换。(4)各中文信息处理系统之间兼容问题的研究。(5)研究完成"中文大字符集"并据此完成新的汉字键盘输入系统。根据以上所述,可以得出如下简短的结论规范化是使汉字键盘输入技术取得突破性进展的基础;智能化是具体实现的技术方法;系统化是使汉字键盘输入技术本文档来自技高网...

【技术保护点】
一种汉字部件按表形的五种笔画分类的编码法及其输入键盘,其特征是将汉字部件按表形的五种笔画(横、竖、撇、点、折)分成五大类,从而将国际通用的标准西文键盘划分成五个区,每个区(或每一类)中构成汉字的部件(基本字根)又据汉字部件的特有规律(汉字部件形态相近,形状相似,或各部件间直接间接的联系)逐一分组,使每组基本字根同A-Y键一一对应,Z键为查询键,用音码、末笔作为识别码,从而形成的拼形组字、组词的汉字编码法及其输入键盘。

【技术特征摘要】

【专利技术属性】
技术研发人员:周伟平
申请(专利权)人:周伟平
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1