当前位置: 首页 > 专利查询>李公宜专利>正文

26104电脑汉字自动转换输入法制造技术

技术编号:2876740 阅读:240 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及的既是一种新的高效拼音输入法,又是一种形、音、义一体化的、可以在电脑网络环境下进行交流的汉字拼音系统。它是根据形体国际化、表音声韵化、表意集约化、字词组合化的原则,在26个拉丁字母基础上扩充开发10个数字韵母及4个声调符号作为主要措施,建立完整表音体系,并利用本系统现有字符建立34个语义分类,从而形成形、音、义一体化的拼音汉字体系。本系统把汉字建立在语素化基础上,通过解决同音字从根本上解决同音词的问题。既继承了语素字的传统又确立了词的独立形态。本发明专利技术将为汉字拼音化开拓一条成功的工程实验之路。为我国语文现代化建设尽菲薄之力。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】
26l04电脑汉字既是一种新的高效拼音输入法,又是一种有音有意、可以阅读和交流信息的汉字系统。但只能在电脑网络的环境下和相互熟悉该系统的网友之间才能有效进行,所以称为电脑汉字。在当前诸多的汉字编码输入方法中,拼音一直处于第一家族的位置,使用的人数最多。但它始终存在着一种不容忽视的缺点,即输入速度较慢,效率较低。无法与西方拼音文字的高速盲打相匹敌。为了改善这种被动状态,最近几年来,一些专家学者企图通过“纯拼音句输入自动转换系统”省去频繁的选字、选词操作,实践的结果并不理想,有的甚至还不如一般的汉字输入系统。主要原因有三;一是句输入本身有很大的局限性,只有文稿输入才能用句输入,选词、选字及歧义排除需要强大的数据库和语义分析软件的支持,智能化处理的满意度或准确性,当前仍处于较低的水平,特别是单音节词比例高的句子、夹杂着生字、生词的句子以及较长的句子,更容易出错,如果一个句子发生了一处错误,都必须回到手工纠错状态,纠正后再进入下一句的输入。纠错一多,操作员就会出现烦躁情绪,输入速度反而更慢了。二是即使在顺利状大态下,按照汉拼全拼输入法,不标调、不分词、无纠错,平均需要3.2键/字,但这是不可能达到的。因为任何输入法都无法排除击键的错误。为了减少智能化处理的错误,通常需要标调和分词,就要增加相应的标调健和空格键,此外还要增加3%-5%同码选择键(这是目前句输入可能达到的较高水平),因此实际上可能达到的平均码长是3.8键/字-4.2键/字。效率与速率仍然较低。三是纯拼音句输入自动转换系统,本质上就是以汉语为目标的自然语言理解系统。它需要一个十分庞大的海量词语库,需要建立并能实时进行调整扩充的语法词典库,以及强有力的语义智能化判断软件等。开发这样一个系统的投资将是一个普通的汉字输入系统的几十倍、数百倍甚至更高。而其结果并不比一个普通的汉字输入系统高明多少。这样的系统,在市场经济中,是没有发展前途的。事实上现在人们广泛使用的只是一般的拼音输入法,并不是纯拼音句输入自动转换系统。实践是检验真理的唯一标准,中国人向西方学习拼音文字的理论,已有一百多年的历史;以三纯(纯音素化、纯拉丁化、纯口语化)为指导原则的拼音化实践,也有七十来年了;作为法定的汉语拼音方案,在全国普遍推行,已快半个世纪;纯拼音汉字编码的试验也有二十多年了;现在又有丁纯拼音句输入自动转换的试验。有哪一项试验可以证明,以三纯为指导原则的汉语拼音能作为文字使用吗?它能精密、快速、高效地表述汉语吗?事实上这样的质疑和挑战,在中国拼音文字理论的发展史上,自从确立了三纯的绝对权威以后,从来就没有停止过。而全面、系统和公开否定拉丁化纯拼音路线的是资深汉字学家袁晓园先生,并且提出了她所专利技术的民族化的拼音汉字方案。该方案在继承和发扬汉字本质特点上是一个很好的方案,但她显然忽视了方块字的固有缺点和文字形体国际化的重要性,造成了难以弥补的重大缺陷。方块字的形体已经使我们失去了一个文字机械化的时代。在信息化时代里,它又使我们背上了一个沉重而且无法卸掉的大包袱。在面对高速发展日新月异的软件和硬件资源纷至沓来时,永远无法与西方处于同一起跑线上,总是比人家迟后一到数拍,总是落在人家的屁股后头。不就是因为方框汉字这个大包袱的存在吗?方块字的另一重大缺陷是它严重束缚了词的独立形态的发展,影响了文字表述的精密度的提高。就是作为一个语素字,实行字母化和拼音化以后,也是有长有短的,有单个字母表示的,有两个、三个以至多个字母表示的(因为还有多音节的语素),息么可以千篇一律地固定在面积相同的小方块里呢?第一个具有实用意义的电脑汉字输入法,是浙江大学张飞鹏先生专利技术的“汉语表意拼音输入法”(1999.9.29获得国家专利授权)。它以汉语拼音为基础,通过实词加意尾、虚字定型化的方法,有效地分化了大量同音词,使重码率下降到5%,平均码长达到3.6键/字。这个水平对于文字而言是不高的,根据统计分析,一个方块字相当于3.2个英文字符,这表明用张先生的输入法比英文的输入效率要低10%还多。如果考虑重码处理的影响,以及键位分布有利于英文输入而不利于中文输入等因素,实际的中文输入效率,还要低得更多。从阅读效率看,以汉语拼音为基础的表意拼音输入法,对相同内容的文章来说,它的篇幅比英文还要多10%以上,比方块字要多80%,其必然结果是使阅读效率最高的汉字反而不及英文的阅读效率了。汉字拼音化和现代化的根本目的是为了提高汉字的综合效率,要创立高效率的拼音汉字,就必须突破七十多年来纯音素化、纯拉丁化的汉语拼音路线强加在我们头上条条框框,用更加符合两千多年来切音的民族传统与汉语语音特点的声韵双拼取代西方音素化的全拼,将是我们在语文现代化的道路上面临的一个重大选择。文字的形、音、义三要素,形是外壳,音是中介,义是内核,是联系万事万物的纽带。汉语的自然音节只有410多个,而所表达的语义却多达15000多项,平均每个音节有36个义项。如果以纯拼音为准则,就只能有四百多个可以相互区别的单音节形体,每个音节平均承担36个义项(多的甚至数以百计),当然无法建立音义之间的条件反射,也就谈不上精密、快速地表述语义。这一点与西方语言有着本质的区别,同样作为单音节,其形态却十分丰富,有单元音领头、双元音领头、单辅音领头、双辅音领头、三辅音领头等,相应的还有多种结尾形态,其单音节的发音是复杂多变的,对应纯拼音的音节结构一般都有四、五千之多,再加上双音节和多音节复杂多变词形结构,就足以建立起形音义高度一致的西方拼音文字体系。中国文字改革只能走继承与创新相结合的路,也就是走汉字改革的路,走汉字现代化的路。而不是完全脱离汉字、否定汉字、斩断汉字的历史发展,按三纯原则以词为纲创建与汉字没有任何联系与汉语内在特点不相适应的纯拼音文字。字是中国文字大厦的基础,是形音义最小的统一体。它的单个语素的特征、音义共存的特征以及没有形变的特征等本质特点,必须得到继承和强化。同音异义的矛盾必须而且可能最大限度地以音意整合的方式在字的基础界面上取得突破。这是汉字拼音化和现代化进程获得完胜的关键。在总结分析汉字拼音化理论与实践的基础上,26104电脑汉字系统的指导思想是形体国际化、表音声韵化、表意集约化,以字为基、按词组串、通过试验、逐步完善。26104电脑汉字系统的基本构架如下所述。一、字母字a阿b不c出d的e而f发g工h和i-j及k看l了m们n能o我p批q起r人s是t他u有v为w无x小y要z在二、数字0○1-2二3三4四5五6六7七8八9九三、声母b p m f d t n l g k h j q x z(z,zh)c(c,ch)s(s,sh)r四、零声母w y a e i o u v五、韵母韵母通常是由下列单个字母或阿拉伯数字表示,位于声母或零声母之后。a(a,ia,ua)e(e,ie)i(i,uai)o(o,uo,üan)u(u,ü)v(ei,ui,üe)n(en,in)w(un,ün)y(u,ü,uau)0(ong,iong,ueng)1(iao,ao,uai)2(ai,ie,uai)3(an,ian)4(ang,iang)5(ao)6(iang,uang)7(in,ing,eng)8(ian,uan)9(i本文档来自技高网...

【技术保护点】
本专利技术所以被称为26104电脑汉字,在于它是由26个拉丁字母、10个阿拉伯数字和4个国际通用键盘符号“-/\丶”等共40个基本符号所构成的电脑汉字系统。它承担着综合表述汉字形、音、义的功能;实现了汉字形体的国际化、表音的科学化和表意的集约化;为汉字现代化在本世纪取得决定性的突破开拓出一条成功的试验之路。

【技术特征摘要】

【专利技术属性】
技术研发人员:李公宜李海飚
申请(专利权)人:李公宜
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1