当前位置: 首页 > 专利查询>秦一明专利>正文

全部汉字汉词简易无重码统一输入法制造技术

技术编号:11376609 阅读:171 留言:0更新日期:2015-04-30 17:04
全部汉字汉词简易无重码统一输入法,用313构块拼写一切汉字;构块全都本有或汉语自然地赋有块音,串连每一字/词的最多4/5块音,即成该字/词的拼块音,如同德国人能依简明规则从德语词形直接读出词音,中国人也能依简明规则从汉语字形/词形直接读出字拼块音/词拼块音;默念字/词的拼块音同时便确定它的准码或拼块码,拼块码字典序是汉语全部约十万/百万标准字形/词形的简易无重码序。应用本发明专利技术,任何汉字/汉词的电脑手机输入,键/写/读完其简码或拼块码即输入该字/词;辞书文档检索,查得其准码即查得该字/词。汉字作为全球主要文字之一将不再难处理。

【技术实现步骤摘要】
全部汉字汉词简易无重码统一输入法
本专利技术涉及全部汉字汉词简易无重码统一输入法。
技术介绍
汉字从来位列全球前几种文字,但至今无法快易统一地检索输入。考察大量用户偏爱的汉语简拼键入法的定码环节,无非默念任何常用汉词中几个字的方言普通话音同时确定该词的简拼码(比如默念“诚信”中两个字的音cenxin同时确定cx),不需学习记忆;能否也默念任何汉字/汉词中几个易识块的方言普通话音同时确定该字/词的某种码,少需学习记忆,而且消除简拼码固有的用处狭窄和“一码多词”病象?本人长期探索后的结论是“能”。本专利技术要在申请人先前多个专利技术专利/申请(特别是CN103838392A)基础上,将拼块码方法推向汉语自然和逻辑精简的极限;推向汉字处理最大限度的通用性,即通用于汉语全部字词,通用于电脑、手机及其它信息处理设备,通用于键盘、手写、语音等各种输入方式,通用于输入、检索、存储、写记等各个处理领域。
技术实现思路
本专利技术对CN103838392A作以下几类改进:1.处理的字词范围从高频词与全部汉字扩大到全部汉字汉词;2.优化了字的块顺规则以及相关多处规定,使之更加明确合理;3.简化了字的拼块音规则,尤其是取消了其中涉及笔形音的层次;4.构块从325个调整、减少到313个;上述改进改变了数以万计的原有字码、词码,用户将能更加轻松地进行汉语全部字词的计算机输入:1)键入任何汉字/汉词的简码或拼块码即键入该字/词,电脑的词语键入模式动态字均击键次数(不含空格键次)仅约1.5,逐字键入模式动态字均击键次数(不含空格键次)仅约2.1;2)写入任何汉字/汉词的简码或拼块码即写入该字/词,词语写入模式动态字均块码数仅约1.5,逐字写入模式动态字均块码数仅约2.1;3)因为每个汉字/汉词的拼块码或简码都是由它的拼块音或其前段确定的,所以读入任何汉字/汉词的拼块音或其前段即读入该字/词,词语读入模式动态字均块音数仅约1.5,逐字读入模式动态字均块音数仅约2.1。附图说明图1是本专利技术的中英文两用键盘字母键位图;图2是本专利技术的手机键盘数字/字母键位图。具体实施方式本专利技术的一个具体实施例由下列6个步骤组成:1.拼音汉语拼音都恢复本来写法,再y代替ü;例如yi/wu/yu恢复成i/u/ü,再y代替ü,成i/u/y。2.子块每个字中按笔顺的相继数画称为该字的一个子块;n画字恰有n(n+1)/2个子块,例如3画字“也”恰有3×4/2即6个子块“也,丨、,乚”。子块既是不容歧解的数学式概念,又是选择余地极大的灵活概念(10万字形的子块总数超过1000万),这就给汉字编码排序打开了新境界。字中的几个子块称为相继的,若按笔顺其中每一个的末画与下一个的首画构成该字的上下两画,例如“解”中的“用、刀、牛”是相继的;字中无公共笔画的子块间的相交、相接关系按笔画间的同名关系理解。3.构块、块音和块码用来构成全部汉字的下列313子块称为构块,简称块:构块表0○囗コ匸凵冂1一ナ卌乙乂衤2二亠儿而3三山4四士尸石市礻5五无午勿6六牛7七气8八丷巴扌9九久纟a下大瓦爪爫瓜甲bト匕比必白疒c厂才寸川臣虫專d丶丁イe耳阝卩f凡飞丰夫方g亅干工弓个革宀冖艮h禾彑i又由尢酉也业幺用言j几己巾井斤金k口可丨了勹ク立來m门毛目母皿n乃女内禸廿o火灬或我pノ彡乊片爿皮qチ欠犬犭且丘求曲r人亽入日s丨十上彳手身t土田u亡王文夊v丂水氵隹未鬼w木x夕习西覀乡心y于予z乚ム巛子止ス自表中字号较大的称为根,较小的称为枝。根的拼音属于常识(个别的或需说明一次),例如“刀///衤”的拼音是dao/gu/na/i;枝的拼音规定是其根的拼音(从枝的构形或读音易联想其根),例如“//氵/”的拼音即其根“习/亡/水/或”的拼音xi/uang/shuei/huo;构块的拼音称为块音,仅两三枝的块音不合常用读法但有所依傍,例如“扌”(“把”的构块)的块音是ba而非ti,旨在缩短许多高频字的码长。字若是构块则称块字,若是非笔形根则称根字,根字可说无人不识。多画块的下列3种变形之一若未变成别的块则视同原块:1)块(“未”除外)中某一画的伸缩或位移,如“/”视同“土/亠”;2)块中的某一“乚”换为“”之一,或“丿”换为“丨”,或“一”换为“乛”,如“/忄/”视同“巳//土”;3)块(“”除外)中的某一画或其末段换为它的对偶(称“一”与“”、“丨”与“亅”、“丶”与“”对偶),如“冫/////”视同“亠/氵//才/ス/八”。此外,个别多画块的其它稍许变形亦视同原块,例如“///”视同“丰///”。块码是块音首字母,但依次有下列5种变通之一:1)若块(“耳、十”及其枝除外)音与“○、一、二、…、九”中某字的块音相同(不计声调,不区别起头的sh和s、n和丨及结尾的ng和n),则块码是对应阿拉伯数字(如“巴”的块码是8);2)若块音末字母为a,则块码是a(如“下”的块码是a);3)若块音末二字母为uo,则块码是o(如“火”的块码是o);4)若块音末三字母为uei,则块码是v(如“未”的块码是v);5)“木”的块码是w。可见块码仅包括10个阿拉伯数字和26个汉语拼音字母,且兼容构块的众多方言普通话音,用户极易见块定码;设置5种变通,目的仍在缩短大量高频字的码长。块码按国际通行顺序列在构块表左端。4.块顺依次遵守下列3条数学式规则逐一拆下某字的相继构块直至拆尽该字的全部笔画,得到的惟一一串块称为该字的块顺:1)块少拆得的块尽量少(但笔顺可类推多画字拆成至少2块,其构块“日、口、冂、コ,厂、、、”依次力避拆散);2)字大拆得的诸根字总画数尽量大(但相继两块依次力避相交、相接);3)先小先拆得的块画数尽量小。规则的但书令拆字更轻松,例如“東”的块顺是(一日)而非(一冂未)。字的“”型子块应拆时单独分拆,且约定“*”的余部自成一块(除非拆得的块更少),例如“鲴”的块顺是(囗十口);当字含有笔顺难判的子块,其笔顺约定使拆分维持“块少、字大、先小”3规则,但字中包含该子块的列分明方块先写左列后写右列,例如“”的块顺是(一丶),“”的块顺是(刀刀干)。字的块顺含n个块,该字即称n块字,例如“鲴”是5块字。5.拼块音和拼块码字的拼块音按下列数学式规则确定:词的拼块音按下列数学式规则确定:词字数拼块音1字拼块音2首字拼块音首末块音+末字拼块音首次末块音3首字拼块音首末块音+次字拼块音首块音+末字拼块音首末块音4首3字拼块音首块音+末字拼块音首末块音≥5首4及末字拼块音首块音词中的每个阿拉伯数字/汉语拼音字母视为1块字;1/2块字的首次末块合三为一/二,例如“一/虎”的拼块音首次末块音是i/huji。高频词的拼块音按下列数学式规则确定:词字数≤23≥4拼块音各字音+末字首末块音各字音首3及末字音这里一字的字音特指该字被看做根时赋有的块音,例如高频词“同一/文艺复兴”的拼块音是tongii/uenifuxin。由字/词的拼块音将其中每一块音换为同块码,即成该字/词的准码(因此字和高频词的准码长≤4,词的准码长≤5)。例如,由“/容易”的拼块音quanfengba/gaikouriu(作为词)或rongiriu(作为高频词)将其中每一块音换为同块码,即成“/容易”的准码qf8/gkr5或r1r5。可见人人皆易“读定”任何汉字汉词的准本文档来自技高网...
全部汉字汉词简易无重码统一输入法

【技术保护点】
全部汉字汉词简易无重码统一输入法,其特征是包括下列步骤:汉语拼音都恢复本来写法,再y代替ü;每个字中按笔顺的相继数画称为该字的一个子块,n画字恰有n(n+1)/2个子块;字中的几个子块称为相继的,若按笔顺其中每一个的末画与下一个的首画构成该字的上下两画;字中无公共笔画的子块间的相交、相接关系按笔画间的同名关系理解;用来构成全部汉字的下列子块称为构块,简称块:构块表0 ○匸凵1 一乙乂衤2 二亠儿而3 三山彐4 四士尸巳石市礻5 五无旡兀午勿6 六牛7 七气廾8 八丷巴扌9 九久臼纟a下大瓦爪爫瓜甲b 卜匕比必白疒c 厂镸才寸川臣虫車d 丶丁亻e 耳阝卩f 凡飞丰夫甫方g 亅干工弓个革宀冖冎艮h 禾彑i 又由酉也业幺用言j 几己巾井斤金k 口可l 了勹立來m 门毛目母皿n 乃女内廿o 火灬丱或我p 丿彡片爿皮q欠犬犭且丘求曲r 人亽入日s 丨十上彳手身t土田u 亡王文攵夂v 丂水氵隹未鬼w 木x夕习西覀乡心y 于予与z 乚厶巛子止自表中字号较大的称为根,较小的称为枝;根的拼音属于常识,枝的拼音规定是其根的拼音,构块的拼音称为块音;字若是构块则称块字,若是非笔形根则称根字;多画块的下列3种变形之一若未变成别的块则视同原块:1)“未”除外的块中某一画的伸缩或位移;2)块中的某一“乚”换为之一,或“丿”换为“丨”,或“一”换为“乛”;3)除外的块中某一画或其末段换为它的对偶,这里称“一”与“丨”与“亅”、“丶”与对偶;块码是块音首字母,但依次有下列5种变通之一:1)若“耳、十”及其枝除外的块音与“○、一、二、…、九”中某字的块音在不计声调、不区别起头的sh和s、n和l及结尾的ng和n的前提下相同,则块码是对应阿拉伯数字;2)若块音末字母为a,则块码是a;3)若块音末二字母为uo,则块码是o;4)若块音末三字母为uei,则块码是v;5)“木”的块码是w;依次遵守下列3条规则逐一拆下某字的相继构块直至拆尽该字的全部笔画,得到的惟一一串块称为该字的块顺:1)块少  拆得的块尽量少,但笔顺可类推多画字拆成至少2块,其构块“日、口、厂、”依次力避拆散;2)字大  拆得的诸根字总画数尽量大,但相继两块依次力避相交、相接;3)先小  先拆得的块画数尽量小;字的型子块应拆时单独分拆,且约定“*”的余部自成一块除非拆得的块更少;当字含有笔顺难判的子块,其笔顺约定使拆分维持“块少、字大、先小”3规则,但字中包含该子块的列分明方块先写左列后写右列;字的块顺含n个块,该字即称n块字;字的拼块音按下表确定:词的拼块音按下表确定:词字数拼块音1字拼块音2首字拼块音首末块音+末字拼块音首次末块音3首字拼块音首末块音+次字拼块音首块音+末字拼块音首末块音4首3字拼块音首块音+末字拼块音首末块音≥5首4及末字拼块音首块音词中的每个阿拉伯数字/汉语拼音字母视为1块字;高频词的拼块音按下表确定:词字数≤23≥4拼块音各字音+末字首末块音各字音首3及末字音这里一字的字音特指该字被看做根时赋有的块音;由字/词的拼块音将其中每一块音换为同块码,即成该字/词的准码;设依次按降频、CJK字符集、扩展A集、B集、C集、…、各字块数、各块画数、各画笔形、各字结构排列的若干字的准码都是S1S2S3S4,规定第t字的拼块码是S1S2S3S4后缀t‑1个0;又设若干字的准码都是S1S2S3同时n个字的准码都是S1S2S30,规定前者第1字的拼块码是S1S2S3,第t字的拼块码是S1S2S3后缀n+t‑1个0,这里t≥2;再设若干字的准码都是S1S2同时m个字的准码都是S1S20且n个字的准码都是S1S200,规定前者第1字的拼块码是S1S2,第t字的拼块码是S1S2后缀m+n+t‑1个0,这里t≥2;如此继续直至不同字形赋有不同拼块码;同样处理,不同词形/高频词形也必有不同拼块码;任何汉字汉词的键盘输入步骤如下:在中英文两用键盘上依次单击完某字词/高频词的拼块码对应各键位和左键/右键,电脑视屏仅在编辑位置显示该字词/高频词并进入下一键入;在手机键盘上依次单击或双击完某字词/高频词的拼块码对应各键位和*键/#键,手机视屏仅在编辑位置显示该字词/高频词并进入下一键入,这里规定仅当输入块码i~z时双击对应键位;简码键入方式,用户完全不必操心哪些高频词有哪一级简码,他只需在键盘上逐块码敲击所欲高频词的准码至该词在视屏编辑位置出现;任何汉字汉词的手写输入步骤如下:在既定设备的拼块码感应区用手指或触笔依次写完某字词/高频词的拼块码并给出结束信号,拼块码识别器接受该码,码‑字词转换器检出赋有该码的唯一字词/高频词,视屏仅在编辑位置显示该字词/高频词并进入下一写入;简码写入方式,用户完全不必操心哪些高频词有哪一级简码,他只需在拼块码感应区逐块码书写所欲高频词的准码至该词在视屏编辑位置出现...

【技术特征摘要】
1.全部汉字汉词简易无重码统一输入法,其特征是包括下列步骤:汉语拼音都恢复本来写法,再y代替ü;每个字中按笔顺的相继数画称为该字的一个子块,n画字恰有n(n+1)/2个子块;字中的几个子块称为相继的,若按笔顺其中每一个的末画与下一个的首画构成该字的上下两画;字中无公共笔画的子块间的相交、相接关系按笔画间的同名关系理解;用来构成全部汉字的下列子块称为构块,简称块:构块表表中字号较大的称为根,较小的称为枝;根的拼音属于常识,枝的拼音规定是其根的拼音,构块的拼音称为块音;字若是构块则称块字,若是非笔形根则称根字;多画块的下列3种变形之一若未变成别的块则视同原块:1)“未”除外的块中某一画的伸缩或位移;2)块中的某一“乚”换为之一,或“丿”换为“丨”,或“一”换为“乛”;3)除外的块中某一画或其末段换为它的对偶,这里称“一”与“丨”与“亅”、“丶”与对偶;块码是块音首字母,但依次有下列5种变通之一:1)若“耳、十”及其枝除外的块音与“○、一、二、…、九”中某字的块音在不计声调、不区别起头的sh和s、n和l及结尾的ng和n的前提下相同,则块码是对应阿拉伯数字;2)若块音末字母为a,则块码是a;3)若块音末二字母为uo,则块码是o;4)若块音末三字母为uei,则块码是v;5)“木”的块码是w;依次遵守下列3条规则逐一拆下某字的相继构块直至拆尽该字的全部笔画,得到的惟一一串块称为该字的块顺:1)块少拆得的块尽量少,但笔顺可类推多画字拆成至少2块,其构块“日、口、厂、”依次力避拆散;2)字大拆得的诸根字总画数尽量大,但相继两块依次力避相交、相接;3)先小先拆得的块画数尽量小;字的型子块应拆时单独分拆,且约定“*”的余部自成一块除非拆得的块更少;当字含有笔顺难判的子块,其笔顺约定使拆分维持“块少、字大、先小”3规则,但字中包含该子块的列分明方块先写左列后写右列;字的块顺含n个块,该字即称n块字;字的拼块音按下表确定:词的拼块音按下表确定:词字数拼块音1字拼块音2首字拼块音首末块音+末字拼块音首次末块音3首字拼块音首末块音+次字拼块音首块音+末字拼块音首末块音4首3字拼块音首块音+末字拼块音首末块音≥5首4及末字拼块音首块音词中的每个阿拉伯数字/汉语拼音字母视为1块字;高频词的拼块音按下表确定:词字数≤23≥4拼块音各字音+末字首末块音各字音首3及末字音这里一字的字音特指该字被看做根时赋有的块音;由字/词的拼块音将其中每一块音换为同块码,即成该字/词的准码;设依次按降频、CJK字符集、扩展A集、B集、C集、…、各字块数、各块画数、各画笔形、各字结构排列的若干字的准码都是s1s2s3s4,规定第t字的拼块码是s1s2s3s4后缀t-1个0;又设若干字的准码都是s1s2s3同时n个字的准码都是s1s2s30,规定前者第1字的拼块码是s1s2s3...

【专利技术属性】
技术研发人员:秦一明
申请(专利权)人:秦一明
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1