【技术实现步骤摘要】
本专利技术涉及一种计算机汉字输入法,特别是一种适用于所有CJK国际表意汉字的无 重码快捷输入法及其中文键盘。技术背景汉字输入法是一种利用键盘符号进行排序/检序的中文电脑检索方法,与査字典 原理相通。由于计算机字库中的汉字以十六进制内码排列,与汉字音形义特征没有关联, 不具备打字操作的实用性,故需要由输入法提供一种实用的检序方法,通过对汉字音、 形、义特征的提取和归简,完成从平面图形到线性数码编序的抽象变换,实现中文电脑 打字。而汉字经过编码变换,事实上已成为一种新型的计算机数码文字。几十年来,随着信息交换量和应用领域的激增,计算机汉字库已由初期的6千多字 增加到IS0/IEC-10646 Unicode3. 1版CJK Ext-A, Ext-B的70195个国际表意汉字(下 称CJK表意汉字),汉字编码任务也随之而扩大了 10倍。汉字输入法作为我国特有 的群众性科研项目,素有万马(码)奔腾之称,但由于缺乏坚实的研究基础和正确的 理论指导,大多只是在字根集定义的层面上折腾,没有根本性的突破方案。泱泱十五亿 华人世界,迄今没有一款公认科学易用的输入法成为国家标准输入法,也没有适用的高 效率中文键盘。国家权威部门只对2万字的GH(字符集颁布了 500多个编码部件,而对 于7万余字的CJK超大字符集,并没有适用的编码标准;对于严重制约录入效率的重码 问题,也没有有效的解决方案。而不具备编码惟一性、科学规范性和好学易用性的输入 法,就不成其为完善的汉字输入法。为此,笔者在CN00112137.5号专利申请中提出了一种双重简码、双路输入的 编码方案,通过增加一个 ...
【技术保护点】
一种汉字无重码快捷输入法及其中文键盘,特别是一种适用于所有CJK国际表意汉字的无重码快捷输入法,其特征在于:采用“三实一虚”编码制,以“序码”为末位标识码、以“多列简码、多路输入”为主体编录模式,以及相应的多通道并列输入中文键盘,通过一系列编码新技窍的组合应用,在当屏列示的前提下,实现所有GB18030标准汉字基于常用字(声形码)优先的无重码简码录入,所有CJK表意汉字基于纯形码编码的无重码快捷录入;可以通过以下相辅相成的技术方案及其组合加以实现,其特征是1.1字根集:适用于所有七万多CJK表意汉字无重码编码的《快捷码字根集》,它由基本字根、归类字根、笔画码和二义字根四部分组成,并按音似或形似的特征与键符字母对应归码:如下表所示:***附表说明:表中并列于归码字母后面的为一级简码字,可根据需要调整;□为含折笔的笔画组码集合;“ㄑ”代表所有折笔笔画,如:“亅乛乚ㄋ”等等;粗体字为二义字根;1.1.1基本字根:由130余个字典规范部件和自定义字根如“我也丑了見○”等组成,除少数象形字根如“八业羊(V),○(0),十木(I)”等按形似特点归码外,其余均按拼音或英文谐音归码;1.1.2归类 ...
【技术特征摘要】
1. 一种汉字无重码快捷输入法及其中文键盘,特别是一种适用于所有CJK国际表 意汉字的无重码快捷输入法,其特征在于采用三实一虚编码制,以序码为 末位标识码、以多列简码、多路输入为主体编录模式,以及相应的多通道并列输 入中文键盘,通过一系列编码新技窍的组合应用,在当屏列示的前提下,实现所有GB18030标准汉字基于常用字(声形码)优先的无重码简码录入,所有CJK表意汉字基于 纯形码编码的无重码快捷录入;可以通过以下相辅相成的技术方案及其组合加以实现, 其特征是1. 1字根集适用于所有七万多CJK表意汉字无重码编码的《快捷码字根集》, 它由基本字根、归类字根、笔画码和二义字根四部分组成,并按音似或形似的特征与 键符字母对应归码如下表所示<table>table see original document page 2</column></row><table>附表说明表中并列于归码字母后面的为一级简码字,可根据需要调整;口为含折笔的笔画组码集合;〈代表所有折笔笔画,如j ]L13等等;粗体字为二义字根;1.1.1基本字根由130余个字典规范部件和自定义字根如我也丑了見O等 组成,除少数象形字根如八业羊(V), O(O),十木(I)等按形似特点归码外,其 余均按拼音或英文谐音归码;1.1.2归类字根包括与基本字根同名的偏旁部首,特殊定义的类同字根以及类 归的笔画组码(如〈代表折笔笔画1L飞)等;1.1.3笔画码由五种单笔画及其两两组合的十五种笔画组码构成,并按音似或 形似特征归码为[一]—H,[门一I, [、] —D, [J] —P, [〈] —Z;同组笔画不 分先后,折笔J LV'单独归码Z,结构关系固定的双笔字元厶^门勺U IJ4 等不宜拆散;含折笔的笔画组以集合形式表示;1.1.4二义字根双字元字根殳支見用隹在双字根字中分拆成二码,在多元字中不分拆;字根羽在字右部时不分拆,在字下部时分拆成二码;1.1.5等同字根字根门韦页乌鸟贝长车马亚简繁体等同适用;1.1.6乖戾字元对于CJK超大字符集中不符合汉字书写规范的乖戾字元如OW上dLSqr^Cyi旌線等,除〇归码O,其余都按难的谐音归码N;1.2编码制式1.2.1编码方案词组编码采用四位制字母编码;单字编码先将汉字按使用频度 编排成多字并列简码,再以同组简码字的排列序位即序码进行去重码标识;即对 于GB2312常用字采取声形形序(声码+形i+形2+序码)编码,对于余外的生僻字采取形形形序(形l+形2+形3+序码)编码;1.2.2序码按同组编码字的排列序号作为末位标识码;序码可使用任意键盘符 号,最好是非字母键符',./;[\]',超出十列的并列简码字用字母码标识;每组编 码最多可有36个同码字;1. 2. 3编码字库按照GB2312、 GBK、 GB18030和CJK超大字符集的顺序,根 据高频先见,常用字优先原则,依次组装成积木式编码词库,以GBK/GB18030 作为标准字库,并通过中文输入法平台软件加载30万多条140余万字超级大词库;对 于CJK国际表意汉字,采用纯形码单字编码,并独立安装于相关中文操作系统,作为 古文等特殊文档的査遗补漏之用;1.2.4编码版本根据不同操作界面和汉语使用区域分设GBK、 GB18030、 CJK 三级输入平台,并设简、繁体两种版本,简体版快捷码输入法以简体字(声形码) 优先,繁体字和生僻字(纯形码)从后,繁体版则反之;1. 3编码规贝U:1.3.1取码规则1)、独体字按书写顺序依次取首次末三码;合体字以汉字表义 字元结构间隙为界,按上下、左右或内外的组合类型,区划为字头+字身两部,字 头部取一个首形码(形l),字身取首、末二码(形2、形3),字身只能取到一码时,返取 字头部一个末形码作补码(形3); 2)、双字根字只取2码、不取补码;3)、双笔画字按 单笔画分解取码4)、对称结构组合字先取居中的字元(形l),次取左上、右下角的字 根(形2、形3); 5)、与前后字元都能组合成字的双向字元,归入字身部取码;6)、形 码有字根时取字根码,无字根时取笔画码;1.3.2编码细则1)、在不拆散相邻成字字元前提下,当前字根能取大不取小, 能取离不取交;2)、十大木夫以及在轴对称字中居中的字元优先取码;3)、合体字 中竖笔串字元不分割,横笔串起的字元可分割;4)、品字形合体字取三角部位字根归 码,品字形重叠字元视为单字元;5)、闭合字元末码取外,开放字元末码取内,收笔 右上角的、不取返码;6)、嵌套字元先外...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。