当前位置: 首页 > 专利查询>陶振维专利>正文

正维数字输入汉字的方法技术

技术编号:2833685 阅读:302 留言:0更新日期:2012-04-11 18:40
本发明专利技术在研究汉字、字母与数字三者之间形和义关联的基础上,采用面向字类对象编程的方式,用字母和单引号’作编码元来定义汉字的基本笔画和类结构。汉字的各个编码则是用这些编码元和类结构对具体对象的描述和组构。本发明专利技术的编码设计把汉字、字母和数字三者的形状或字义联系在一起,开发了一个更为简便和有效的汉字、字母与数字之间的对照关系,使汉字书写形式与数字直接相对应。采用本发明专利技术的数字输入汉字方法,在计算机及其它智能产品上输入汉字比输入西方字母文字更为简便、快速和高效,使中文输入处于领先于西方文字输入的地位。

【技术实现步骤摘要】

本专利技术涉及一种计算机中文输入编码方法.确切地说,本专利技术是 专利技术人原有专利技术《字母形状匹配汉字输入方法》基硇上的新发展.本 专利技术的方法不仅仅涉及更为优化的形状匹配汉字编瑪设计和更为有效的字母榆入中文方法;还介绍形配编码、数字与汉字三者之间形和义的 关联,以及以形配编码字母为基础,采用数字鍵将汊字输入计算机或 其它智能装置(如手提电话、个人数字助理等)的方法。
技术介绍
中国语言属于非拉丁语系,其书写字符为汉字. 一个汉字是代表 某种概念或物体的抽象符号.汉字的困形表达是笔画在二维方块中的 造形,而笔画則是笔在纸上书写时的一次勾画.中文字量庞大,字典 中收录的汉字有的多达5万个以上.为了方便学习与记忆,汉字按部首分类,最常用编排汉字的方法是采用部首排序法.字典中的汉字排 列首先按部首分类,其次按笔画数,然后再按基本笔画次序.汉语拼 音排序法則是按拼音字母顺序,语音声调以及笔画次序等。 一般而言, 汉字的书写形式和排序结构与拉丁文字相比要复杂许多.尽管汉文书写复杂,但它是一种表形传意先进的文字系统.汉字 的形成来源于它所描绘的物体和它要表达的意思.经过不断的鲔化和 抽象,汉字外形逐渐演化, 一个字成为中文发音的一个音节并传达某 种意思.外形上看现代与古代汉字相比有着很大的差异,但是每个汉 字都是代表某种抽象物体或意念的特征則没有改变.汉字是一种表 形、达意和形声结合的文字,是一种面向对象的人类高级形式的文字(Object-Oriented Human Advanced Notation-00HAN) 困形汉字具有很强的重复使用特性,它表形达意、形声结合,是一种十分优异的二维困形式文字系统.然而,汉字的应用在计算机资讯时代面临着巨大挑战.文字的键盘输入是一维的时序方式,采用一 維字母音序为基础的文字输入则十分吻合.计算机采用ASCII七位鳊码代表128个字母符,该系统处理英文字符相当方便.另一种编码是 ANSI八位系统,它有256个字符包括欧洲所有语言的字母.与字母文字相比较,中文在计算机科学中的状况却不是那么幸运.因为中文字库的基本字符庞大,很难想象用一个健盘可以包含所有汉字而又能方 便地掌捱这样的鍵盘.文字输入是一种最常用的人与计算机或其它智 能产品的对话手段,然而中文在达一领域面临着唯一严峻挑战.文字输入主要地采用两种方式字母鍵榆入和数字鍵(O, 1,…,9)输入.用字母输入中文的方法已经有多种,主要地有三类.一种方法是采用以一維音序为基础的汉语拼音法.拼音字母输入 法只需要很少训练就能使用,但是使用者必须准确掌握标准发音.而 掌握发音则是一个长时期的学习过程,况且汉语中许多是同音字,即 一音多字。在拼音字母输入过程中要依賴視觉感官从众多的同音字中查找所需汉字,闳而输入速度慢。第二种输入法是以汉字的字形为依据.例如五笔字型输入方法,它用字母去代替一百八十余汉字部首,并将字母键分为五个区域.谗 用者一般根据五笔结构规則,用字母所代表的字根去组构汉字作为输 入。这种输入方法的主要缺点是重码多、记忆量大以及培训费时.一 个字母要代表多个字根,而且字母与它所代表的字根之间基本没有任 何意义上的关联.第三种中文输入方法基本上是对上迷两种方法加之以某种技巧的 综合和改进.随着信息技术的进步和发展,计算机智能产品体积小、功能强, 文字输入往往采用数字键方式.例如,利用移动电话传逸短讯或打开 电子邮件等.用数字鍵榆入文字的方法是将字母、标记(如标点符号 等)和功能鍵(如选項++)对应于0至9的数字键,其输入方式主要 地有两类。其一是采用重复按同一个数字鍵挑选所代表的某个字母.豳际通 用的字母与数字鍵之间的对照关系见表一.表一.标准数码-字母对照表<table>table see original document page 8</column></row><table>这种方式的优点是记忆体少,是一种头脑贿单的笨办法.这种方法的按键次数多,榆入速度慢.例如输入so坦e的按鍵系列是 7777-666-6-33,需要榆入IO个数字键.这种方式不适用于输入汉字.数字输入文字的另一个常用方法是增加字词库记忆体,采用羊字 母羊数字输八和重复字用功能鍵挑逸的方式,如T9方法.逸种方法输 入速度快,是一种较为有效的方式.例如,some和pond的输入数码 都是7663,每个字母只须按一次数字键,单词输入完后再用功能鍵(O 鍵)选取所需要的字.这种T9数字输入方法同样可以应用于汉字输入.但是现有的拼 音、笔型和拼音-笔型混用的字母输入都包含有大量的重码。再将它们 转换成小字符集的数字,其重码童更是遂增,西而输入效率低下.五 笔字型字母输入法的专利技术者于2005年提出一个系列式的数字输入方 法,把数字输入中文从简单到困难分为5个等级.这种把输入方法多 层分级方式,使学习费时而不易全面掌握。况且, 一条简短的短讯发 送根本就难以避免较'难,字的出现.汉字是一种面向对象的文字, 一种优异的二维困形文字,人的視 觉读入困形文字十分有效,易于识别和记忆.然而,现有的计算机技 术在并行处理困形的输入方面仍然十分笨拙. 一般说,采用现有的中 文榆入法(字母、数字或书写困形方式)都相当复杂,不便于中文计 算机的广泛普及和深入应用.特别是对于一个以汉语为第二语言的外 闺人,现行的以发音,字形或混合应用为依据的汉字输入方法对他(她) 们更是另人头痛而难以掌握.本专利技术人在专利申请文献《字母形状匹配汉字输入方法》中提出 一种汉字输入编码方法,用英文字母简易而有效地代表汉字.只须经 过简单处理,形配编码可实现无重码设计,在计算机中文输入过程中 可以不依赖視觉的帮助实现盲打输入.按无重码设计的形配编码直接 转换到数字码的重码数量远比其它方法要少.为了更为有效地采用字 母或数字输入中文,本专利技术《正维数字榆入汉字的方法》在原有《字 母形状匹配汉字榆入方法》〉的基础上提出新的编码设计方法.在新的 形配编码设计中把字母、数字和汉字的形和义相结合.采用本专利技术的 形配编码既可用字母作中文榆入,又可以将形配字母转換成数字榆入 中文,还可以按形配编码字母顺序编排汉语字典,实现一码多用、快 速准确地输入或搜寻汉字.
技术实现思路
根据本专利技术的一个方面,提供一种计算机或智能产品的汉字输入 编码,该编码既可用于字母输入汉字又可简便地转换字母为数字输入汉字。所述方法包括如下步稞.分类步緣采用面向字类对象编程的方式,用26个英文字母和羊 引号,定义汉字的基本笔画元、行为元和类结构.而这些字母和各字母 加后缀u配对所代表的笔画组成汉字编码的基本字根笔画.在面向字 类对象编码的基础上,本专利技术给出一个适应汉字书写特征的字母与数 字转换关系,将字母转換成为数字输入码.输入步骤各个汉字的编码是用这些面向字类对象的编码元和类 结构对具体对象的描述和组构。文字输入是根据汉字的结构依汉字的 书写顺序,用形配基本字根组合的代码字母输入该汉字;或根振汉字 书写形式与数字的形或义相对应用数字榆入该汉字.附困说明困l是计算机的鍵盘布局的示意困, 困2是手机的鍵盘布局的示意困.具体实施例方式本专利技术在研究汉字、字母与数字三者之间形与义关联的基础上, 以汉字的本文档来自技高网
...

【技术保护点】
一种计算机汉字编码方法,在计算机键盘或智能产品上用字母输入汉字,或转换为数字输入汉字,所述方法包括:    分类步骤:采用面向字类对象编程的方式,用26个英文字母和单引号’定义汉字的基本笔画元、行为元和类结构共83个基本字根笔画;其中每个字母代表两个或三个基本笔画元共58个,各字母与u配对代表一个基本笔画或常用汉字共25个;基本字根笔画构成本专利技术编码中文采用的计算机键盘布局(图一);在面向字类对象编码的基础上,转换字母和单引号’为数字1至9的数字作输入代码;    输入步骤:各个汉字的编码是用这些面向字类对象的编码元和类结构对具体对象的描述和仿构;本方法的文字输入分为字母输入和数字输入两种;用字母输入是根据汉字的结构依汉字的书写顺序,用基本笔画元和类结构的组合仿写代码输入单个汉字和用缩略编码输入汉字词组;用数字输入是以本方法的字母编码为基础,用本专利技术的字母与数字对照关系转换成数字,按“头5尾1”缩略方案输入单个汉字和用汉字词组的缩略编码转换成数字输入汉字词组。

【技术特征摘要】
1. 一种计算机汉字编码方法,在计算机鍵盘或智能产品上用字母输入汉字,或转換为数字输入汉字,所迷方法包括分类步骤采用面向字类对象编程的方式,用26个英文字母和羊 引号,定义汉字的基本笔画元、行为元和类结构共83个基本字根笔画; 其中每个字母代表两个或三个基本笔画元共58个,各字母与u配对代表一个基本笔画或常用汉字共25个;基本字根笔画构成本发明编码中 文采用的计算机键盘布局(困一);在面向字类对象编码的基础上,转 换字母和单引号,为数字l至9的数字作输入代码;输入步骤各个汉字的编码是用这些面向字类对象的编码元和类 结构对具体对象的描述和仿构;本方法的文字输入分为字母输入和数 字输入两种;用字母输入是根据汉字的结构依汉字的书写頻序,用基本 笔画元和类结构的组合仿写代码输入单个汉字和用缩略鳊码输入汉字 词组;用数字输入是以本方法的字母编码为基础,用本发明的字母与数 字对照关系转换成数字,按头5尾1缩略方案输入单个汉字和用汉 字词組的缩略编码转换成数字输入汉字词组.2. 如权利要求1的计算机汉字编码方法,其中的分类步騍用字母 的大小写形状代表与其象形的汉字或笔画组合,它们是字类的基本成 员.3. 如权利要求1的计算机汉字编码方法,其中的分类步樣除用字 母形状代表与其象形的汉字或笔画组合外,少量字母采用转借英文中 的某种用法或采用指定的方式,定义汉字笔画作为字类的基本成员.4. 如权利要求1的计算机汉字编码方法,有的字母除了表示某个 笔画外,还用其字形或字义表达笔画间的某种关系;它们是字类结构 的行为算子。5. 如权利要求l的计算机汉字编码方法,利用汉字部首的分类特 性,用字母定义常用的部首类结构作为基本笔画;形状相异但同属一 类的部首归并为相同的编码(如人>(~/R).6. 如权利要求4的计算机汉字编码方法,其中配对关系算子是u; 任一字母加上后缀u构成新字画,派对与笫一个字母的笔形一般具有 某种联系;它们或者表示同类中的一个常用字根或笔画的延续;或者 表示与发音相吻合的笔画.7. 如权利要求4的计算机汉字编码方法,其中表示举字母笔豳重 复的算子是s,8. 如权利要求4的计算机汉字编码方法,其中表示多字母笔豳字 根的二重复算子是M; Ms为字根的三重复,M迈为字根的四重复.9. 如权利要求4的计算机汉字编码方法,其中S和M有时也表示 汉字笔画的镜/平面对称.10. 如权利要求4的计算机汉字编码方法,其中表示汉字笔豳相 交关系算子是f, t,和x。11. 如权利要求1的计算机汉字编码方法,除字母和配对笔豳定 义的汉字和部首外,其余部首和汉字的编码則是用这些基本笔画对具 体对象的描述和仿构.12. 如权利要求1的计算机汉字编码方法,其中的分类步槺中, 汉字的编码按无重码设计。13. 如权利要求12的计算机汉字编码方法,把具有相同编瑪的汉 字字根在单独使用时加以区别,采用在不常用字根的本发明鳊码后加 区別字符的方法.14. 如权利要求12的计算机汉字编码方法,如果汉字在写法和笔 画順序上完全相同,只是笔画位置上有差异,所采用的区分办法仍然 是在不常用字的本发明编码后加区别字符.15. 如权利要求13或14的计算机汉字编码方法,其中当编码仅 为一个字母时所加区别字符是单引号,,编码为多个字母时所加区別字符是j.16. 如权利要求1的计算机汉字编码方法,其中当一个汉字有多 个可能的编码时,采用以下规則选取编码如果一个汉字或笔画組合所对应的字母或配对已列入鍵盘,刑总是选用已定义的最简单字母表达;如果一个汉字或笔画组合困案已定义为一个字根笔型或部首,则总是应用基本字根或部首的字母单词来代表它的本发明编码,而不是 用其它方式重构;一个汉字无论其单独存在或隶属于某个其它汉字块中,当这个汉 字可以用树干结构或者其它形式表达,并且所用字母个数相同时,刑 总是用树干结构的字母来表达它,以突出映射字形主干和轮廊; 如果一个汉字可能有多种方案用字母象形地去仿构时,总是选取 所用字母数较少的表达.17. 如权利要求1的计算机汉字编码方法,其中的分类步樣中, 多笔画汉字部首和少数多笔画而常用的汉字可以进行筒略编码,采用头二尾一方案,即前二位与不简略的编码原码相同,简略码的 第三位則选用编码的最后一个字母符.18. 如权利要求1的计算机汉字编码方法,其中字母形状匹配汉 字所形成的编码构成一种表达汉字的字母书写文字。19. 如权利要求1的计算机汉字编码方法,其中的分类步稞中, 汉字行政区域、地名的编码可以进行筒略编码,采用头二头一方 案,即第一个汉字的头两个不简略编码字母和笫二个汉字的笫一个 不筒略编码字母.20. 如权利要求1的计算机汉字编码方法,其中词組输入的规則 如下两字词组的输入采用头三+头...

【专利技术属性】
技术研发人员:陶振维
申请(专利权)人:陶振维
类型:发明
国别省市:AU[澳大利亚]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1