当前位置: 首页 > 专利查询>肖启宏专利>正文

汉字全息码计算机输入系统技术方案

技术编号:2892897 阅读:386 留言:0更新日期:2012-04-11 18:40
一种用于输入全部汉字的汉字全息码计算机输入系统的编码方案,是将字元、部件、笔画、结构、体式五种汉字信息源经筛选提练为不再拆分的稳定模块,分为字元表、键盘图、笔画类三个部分,分别用由汉语拼音转为声韵双拼的读音码、音形码、形码、笔画码四种编码方法转换成汉字全息源代码组,根据汉字全自源组成汉字字形的原则,以全息源的固定代码组,按汉字书写顺序组码,转换出单个汉字的代码,用于建立几万字的大字符集。(*该技术在2011年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种汉字信息的计算机输入系统,更确切地说是涉及一种汉字的全息码编码方案输入系统。汉字信息的计算机处理技术,已在我国从无到有地建立起来,并得到不断发展,但目前还处于实现办公室自动化和解决印刷业自动排版技术问题的阶段,而汉字信息计算机处理技术的发展目标是实现印刷业,情报业的自动化,现有的汉字信息计算机输入系统所流行的汉字输入编码方案,包括笔画码、形码、读音码、音形码等,所处理的汉字数量都限于8000常用字级,而印刷业的真正革命约需1.6万字(辞海范围的字)的大字符集,大型印刷厂约需2.5万字,大型图书馆如果没有大型的汉字库,也不可能实现对古籍书目的现代化检索和管理,因此汉字信息计算机处理技术真正进入印刷业和情报业的计算机自动化处理中,迫切需要有大字符集的字模库,有解决包括繁体字、简体字、异体字的全汉字系统的汉字编码的计算机输入方案。现有技术的笔画码方案和以部首、部件集群的形码方案,给出的信息量太少,难以达到高效描写几万数量汉字的目的;音码和最为流行的音形码,虽在常用字范围内有较大的通用性,但随着字集扩大到一万以上的字时,仅读音一项就会造成不少障碍,由于这些编码方案都是以抓住汉字全息要素中的某一点或几点为编码的线索,以求贯串始终,超出8千字范围,延伸到全汉字系统的管理与适用,实际上成为不可能。本专利技术的目的是应用汉字的全部信息源,用汉字全息码描述全部汉字(包括简、繁、异体),实现汉字字模库从几千字扩展到几万字的数量的变化。本专利技术根据对汉字全息理论的研究,认为5.7万字形的巨型汉字字符集(汉语大字典)有一个汉字信息源头的全息基础,这个全息要素可归结为(1)字元,由象形文字流传下来表示字意和读音的字根,是在同一音节里造形和意义都完全不同的独立的字,且在汉字集群里有很强的组字能力。(2)部件,由字根简化和变形而来的表示意义和分类的部首或构字部件,部件是部首和构件的总称。(3)笔画,隶变楷化后稳定下来的基本笔画。(4)结构,字元、部件、笔画是汉字的基本材料,它们灵活多变的结构形式,使汉字字形得以充分发展。(5)体式,同一字音字意,不同形的写法。本专利技术将字元、部件、笔画、结构、体式五种信息源,经筛选提炼为不再拆分的稳定模块,分为字元表、键盘图、笔画类三部分,分别用由汉语拼音转为声韵双拼的读音码、音形码、形码、笔画码四种编码方法转换成汉字全息源代码组,根据汉字全息源组成汉字字形的原则,以全息源的固定代码组,按汉字书写顺序组码,转换出单个汉字的代码,与不同字形一一对应,所述的字元表见附图2~4,键盘图见附附图说明图1。下面对照附图1~4详细说明本专利技术的输入方案。本专利技术按单字使用频度高和组字能力强的原则选择了575个字元模块,它们在任何情况下都是固定不变的整体,按其发音的声母字母顺序排成一张字元表,各字元注有对应的双拼代码,可根据声母从字元表中找到字元及其代码,也可根据字元从字元表查找它的代码。字元表中包括335个一级字元模块,直接用其双拼音作为固定代码组,一级字元模块在字元表中以大号粗体字示出。如巴(BA)白(BB)包(BC)半(BD)……表(BZ)派(PB)番(PD)旁(PF)朋(PG)……票(PZ)马(MA)卖(MB)毛(MC)曼(MD)……苗(MZ)牙(EA)翁(EG)永(EL)而(ER)……要(EZ)字元表中还包括240个二级字元模块,排在字元表中一级字元模块固定代码组下面,以不同于一级字元模块的字号示出,其代码是用其对应的一级字元模块代码加其第一笔画的代码组码,构成固定代码组。如友(BA1)暴(BC2)副(BI1)畢(BI2)鼻(BI3)必(BI4)辟(BI5)兵(BP3)北(BQ2)卑(BP3)扁(BR3)……尧(BZ1)舀(BZ3)本专利技术按大部件结构组字的原则选择了70个部件,放在字元表中一级字元模块和其固定代码之间,以其所跟随的一级字元模块的固定代码组为其代码,如 (BD),帀比(BI),北(BQ),髟(BZ), (PF), (PI),酉(PQ),卯(MC), (FH),非(FQ),歹(DB), (DI), (NF), (NV), (LM),……,旡(OU), (EX)由于在575个一、二级字元模块中,包括了相当数量的繁体字元,因此多数繁体字与简体字的区分在组合中自然得到解决,其中90个字元的繁简体字不能通过组合区分,本专利技术在该简体字旁加注▲,编码时,以其在字元表中的固定代码加字母K组码,换成繁体字,如宾(BM),賓(BMK),变(BR),變(BRK),丽(LI1), (LI1K),岁(SV6),歲(SV6K)。要说明的是,字元表中如 (BD)比(BI)北(BQ)卯(MC)非(FQ)行(HF) (JV) (XP)这样的部件,中间插入另一字元模块或部件构字时,该字的代码为其对应字元表中第一级字元模块的两个代码中间再加入所插入字元模块或部件的代码组码。如斑(BKBD),街(HAAF),卿(MGNC)。本专利技术的键盘图,26个字母键上,标记有汉语拼音和它的双拼音用法,与目前流行的音码及其键位分布基本一致,但W、K键不用于表示韵母,包括Q-Q ei üe,W-ch,E-E e,R-R ian er,T-T uen ün,Y-sh uai ü,U-U,I-i,O-O uo O,P-P ing,A-a ia,S-S uan üan,D-D an,F-F ang,G-G eng ueng,H-H ou,J-J ie,K-K,L-L ong iong,Z-Z ua iao,X-X uang iang,C-C ao,V-zh uei iou,B-B ai,N-N en,M-M in本专利技术另外选择了105个高频字,字元模块,分别离散在键盘26个字母键位的正中、左上角、右上角、左下角四个不同的方位上,以四种不同的使用方法随机产生出四种不同的变化,而形成固定代码组,键位正中的高频字,单独成字时,用键名为其代码,与其他字元或部件组字时,用其键名加字母W组码;键位左上角的高频字,在键名前加字母A组码;键位右上角的高频字,在键名前加字母I组码;键位左下角的高频字,在键名后加K字母组码。如1大(A)不(B)于(C)……是(S)…在(Z)夺(AWCT)甭(BWNW)竽(VCW)匙(SW83)……茬(CZW)如2圭(AA)家(AB)饣(AC)乙(AD)予(AE)王(AF)示衤(AG)禾(AH)意(AI)机(AT)彳(AK)……声(AY)支(AZ)如3丸(IA)穴(IB)食(IC)动(ID)雨(IE)至(IF)戈(IG)巾(IH)久(IJ)克(IK)……式(IY)之(IZ)如4攵文(KB)燕(KC)制(KD)鱼(KE)力(KF)光(KG)火(KH)金(KJ)衣衤(KK)……数(KY)资(KZ)本专利技术选择了89个部件,按其在汉字字形中通常所处的位置,分别离散在26个键位正中高频汉字的上、下、左、右和键位的右下角五个位置上,分布在键位正中高频汉字上、下、左、右的部件,直接用其键名字母组码,分布在键位右下角的部件,重复键名字母组码。如 、虫、鱼、阝、扌、山、土、石、口、讠、日、纟、氵、王、火、钅、亻、月、、忄、女、木,通常处于汉字字形的左边,因此分别置本文档来自技高网...

【技术保护点】
一种计算机汉字全息码编码输入系统,其特征在于输入全部汉字的编码方案是:将字元、部件、笔画、结构、体式五种汉字信息源,经筛选提炼为不再拆分的稳定模块,分为字元素、键盘图、笔画类三个部分,分别用由汉语拼音转为声韵双拼的读音码、音形码、形码、笔画码四种编码方法转换成汉字全息源代码组,根据汉字全息源组成汉字字形的原则,以全息源的固定代码组,按汉字书写顺序组码转换出单个汉字的代码。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:肖启宏
申请(专利权)人:肖启宏
类型:发明
国别省市:11[中国|北京]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1