当前位置: 首页 > 专利查询>陆国华专利>正文

四维码汉字输入技术制造技术

技术编号:2893345 阅读:1698 留言:0更新日期:2012-04-11 18:40
四维码汉字输入技术是发明专利技术一种汉字编码及输入方法,综合了汉字的字形、字音、声调和使用频度等四维信息,在简单规则下做到在二级汉字库内四键惟一无重码,四键一个词组。用26个英文字母代表40个基本码元,形象音似,易学易记,可统一处理繁体和日文汉字;可在一种状态下随意按音、形、音形、形声及高频字、词组等六种方式输入汉字,可高速盲打,可应用于计算机、终端、电子打字机、电子资料、翻译机等中文信息处理机器。(*该技术在2010年保护过期,可自由使用*)

【技术实现步骤摘要】

汉字信息处理技术技术背景汉字编码方案已经提出几百种,应用较广的有电子部六所的CCDOS(首尾,拼音),中国专利85100837五笔字型编码,中国专利85102777宏观字形码,万仁芳的前三末一拼形方案,北大的“西山汉卡”、上海交大等的双拼码,郭淑贞的声韵部形码等等。所有这些方法都有三个问题1.每一个汉字在一种状态下只能按一种编码输入;2 都有重码;3规则较为复杂,对操作者的要求较高。专利技术陆码系统汉字输入技术的目的专利技术一种易学易记的汉字编码及输入技术,可以在同一种状态下,随操作者的意愿,方便地按汉字的字形、字音、形声或声形等多种编码输入汉字,规则简单而又能达到国标BG2312-80二级汉字库内无重码。内容一、理论基础作者对汉字的字音、字形中所包含的时空信息进行深入分析探讨认为古老的汉字的字音和字形,是我们的祖先基于对时间和空间的深刻认识而创造出来的一种优秀的信息记录载体。其优越性在于用最少的元素却包含了最大的信息量,这是中华民族对人类文明的最伟大贡献之一。由于这个优点,汉字最适合于编码和计算机输入。作者基于上述认识,致力于挖掘汉字所包含的时空信息,综合了汉字的字形、笔顺、字音、声调和使用频度等特点,提出了“秩”的新概念,创造出一套陆码汉字系统,在统一的编码原则下,用26个英文字母代表40个基本码元,形象音似,见字识码,好学易记,而且用同一种编码可以方便地统一处理简体、繁体和日文汉字。二.陆码系统汉字编码方案陆码对每一个汉字都给出三类编码音码,形码和秩码。(1)音码包括声,韵,调三种声码该汉字按拼音方案的声母或第一个字母,遇声母是Zh,Ch,Sh的,则分别用V,I,U来代表。韵码该汉字按拼音方案的尾韵或最后一个字母,遇尾韵是如下复韵的,则分别以下表中其对应的代码字母来代表ao_K ai_L an_J ang_Hen_F eng_G ing_Y ong_Sei_Z ui_V ü_V调码该汉字最常用字的声调,分别用如下符号来代表-(一声) (三声)\(四声和轻声)综合以上,形成陆码音码的键面图如图一所示。记忆口诀“追吃熟鱼,粉煎烤来,夯松更硬。”表示Zh-V-ui Ch-i Sh-u ü-v(Z-ei)F-en J-an K-ao L-ai,H-ang S-ong G-eng Y-ing。这样,每一个汉字的字音都可用声韵调,整齐的三键编码给出。例如汉字 计 算 机 科 学陆码简拼 JI\ SJ\ JI- KE- XE[(2)形码包括首,二,三,尾四种。陆码形码的码元按空间方向分类,汉字笔划最基本的单元有五种点、横、竖、撇、捺,用以下五个字母代表D(丶) Y(-) I(丨) J(丿) C( )由这五基元可组合成为许多空间类型,将汉字的二百多种常用构件,按其主要的空间类型特征归为26类,用26个英文字母作为代码,尽量做到形象或者音似,如三角形类厶A 两横一竖类 干F 三横一竖类 王E 月Y 木M 西C 等等。这样,形成陆码基本码元键面图和陆码码元表如图一和表一所示 注意陆码不要求机械地硬背码元表,而要求掌握构件按其空间类型的主要特征归类的原则,如代码“Q”并没有对应的码元,只是给出一条原则“四面包围,内有笔划之码元”,因此,“昌QQ”而“日OY”,因“昌”中的“日”是一个组成码元。取码原则精练成六句口诀“按照笔顺,外框先取,先大不重,右上点略,先取首尾,再取二三”,具体方法如下A.按照汉字书写的标准笔顺,主要是约定俗成的十条先上后下,先左后右,先外后内,先中后旁,先整后零,先横后竖,先横后撇,先撇后捺,先撇后点,先钩后挑。个别有二义性的加以适当的规定,如“刀刁力”作“LJ”,而“几九”作“JZ”。B.外框型的字,适当调整一下笔顺,先取完外框的所有笔划,如“匡”作“CE”。C.从第一笔开始,按笔顺尽量形成笔划最多的码元即为首码,用过的笔划不重用。D.从最后一笔向回取笔划,尽量形成笔划最多的码元即为尾码;如最后一笔为右上一点的,取尾码时先省略不计,以免以D作尾码的重码字太多;如首码已取完所有笔划,则尾码重复首码。E.先取完首尾码之后,余下的笔划再顺次形成二码和三码,如已无笔划,则根据该字的结构类型取二码为S(上下型)或Z(左右型)或W(无定型),而三码同尾码,但如尾码是“Q”时,三码取“Q”之内部笔划。如“相MZYQ”。F.如遇笔划较多的复杂字时,而该字能分为两部分的,分别取这部分的首尾;如该字由三部分组成,则二码和三码取中间部分的首尾。如“裤BVTS”,“微JIUX”。(3).“秩”码这是陆码汉字系统所特有的一种编码。首先给出“秩”的概念“秩”就是汉字编码里形、音或调的编码都相同的重码汉字,按其使用频度高低排列的秩序,最常使用的高频字为0秩,顺次为1秩、2秩…,秩越高,频度越低。“秩”的本质是“带通数字滤波”。由于“秩”的引入,提供了区分重码字的有效手段,实现了简单规则下二级汉字无重码。陆码系统定义三种秩1.首尾声调秩首尾声三码全同的重码汉字中,再按声调分类,再相同者按使用频度分类,最常用的0秩字用A,B,C,D代表四声,次常用的1秩字顺次用E,F,G,H代表四声,依此类推,如表二所示表二 秩 声调 一 二 三 四(轻)0 A B C D1 E F G H2 I J K L3 M N O P4 Q R S T5 U V W X6 Y Z2.声韵首调秩声韵首三码全同的重码汉字中,再按声调分类,再相同者按使用频度分类,最常用的0秩字用A,B,C,D代表四声,次常用的1秩字顺次用E,F,G,H代表四声,依此类推,如表二所示。3.首尾声二秩首尾声三码全同的重码汉字中,再按其二码分类,再相同者按使用频度分类,最常用的0秩字其秩码等于其二码,1秩字其秩码取其二码的下一个字母,(ASCII+1),不存在2秩以上的字在陆码的音码,形码,调码和秩码的基础上,可以组织成许多种编码组合,如首尾声二(秩);首尾声调(秩);首尾声韵;声韵调首;声韵首调(秩);首二三尾;等等。其中三种第四键为秩码的编码组合,在二级汉字库6763个汉字无重码,而且最常用的0秩字占88%至94%,所以绝大多数情况第四键只要按A,B,C,D打入该字的四声即可,最好的一种是首尾声二(秩、组合,0秩字占98%,1秩字在一级库内仅有38个扳 蹭 幢 囤 钒 肤 秆 咕 嘿 饺 矫 窖 秸 痉 竞 励 隶 燎 凛 糜 漠 睦 脐 乞 窃 稍 帅 矢 遂 托 烯 戌 刑 耶 萤 远 栈 椎只要记住这38个字第四键打其二码的下一个字母,如“失”打“JRUY”而“矢”打“JRUZ”,就可实现高速盲打。当用“- \”表示四声调码时,又可以实现多种编码兼容输入,详见第三部分。三.陆码系统汉字输入方法按国标GB2312-80标准字集的顺序建立一张汉字的索引表,每一个表项占5byte,存放该位置汉字的陆码编码信息,其中首码,二码,三码,尾码,声码,韵码各占5bit,共30bit,0表示A,25表示Z;调码占2bit本文档来自技高网...

【技术保护点】
一种对汉字的字形、字音、声调、使用频度以及词组进行全面编码的汉字编码系统,其主要特征是:1.将汉字的笔划和构件按空间类型主要特点归为26类,用26个英文字母作为形码的代码,或形象,或音似,如“四面包围内有笔划之码元"为"Q";"三面包围 左笔下伸类"为"P";"木"为"M"等等,按笔顺取码,见字识码,好记好学。2.音码的三个声母和十个复韵母用代码表示,首略中间,实现了由声码、尾韵和声调组成三键等长简拼,调码用符号来表示(-[]\),给多种编码兼容输入创造了条件。3. 定义了三种“秩”码,使音和形相同的重码汉字按使用频度排列秩序,实现了简单规则下二级汉字四键无重码。4.词组用四个陆码的形码或音码统一格式编码,其规律为:二字词:一首一尾二首二尾;三字词:一首二首三首三尾;多字词:一首二首三首末首。给字词 兼容输入创造了条件。

【技术特征摘要】

【专利技术属性】
技术研发人员:陆国华
申请(专利权)人:陆国华
类型:发明
国别省市:81[中国|广州]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1