字词句组合汉字输入方法技术

技术编号:2890888 阅读:317 留言:0更新日期:2012-04-11 18:40
本发明专利技术是一种字词句组合汉字输入方法,属于计算机汉字输入技术领域。该方法由声母码、韵母码、部首码、笔画码、字词组合码和句子组合码构成,它以拼音为基础,词句为主导,对字和词组进行音、形、笔画混合编码。该方法易学、码短、速度快,对不认识的字和不会写的字都能输入,平均码长为1.6键,词组的编码可以由计算机自动生成,词组量不受限制,可由用户扩充。高频字和高频词可由用户修改。(*该技术在2015年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术专利由声母码、韵母码、部首码、笔画码、字词组合码和句子组合码构成,属于计算机汉字输入
现有的汉字输入法可分为三类音码(如,拼音、联想、拼音语句、自然码)、形码(如,五笔字型、郑码)、音形码(如,五分钟码、飞两笔码)。音码有两个难以克服的问题,一是对不认识的字不能输入,二是重码多。形码难以克服的问题是对不会写的字无法输入,对于每个字都要拆分,还要记住每个字的部首用什么字母代替。音形码大都以字的声韵母和字的部首或笔画混合编码,同时存在对不认识的字和不会写的字均难以输入。本专利技术的目的是为了避免以上所述的不足之处,现提供一种。本方法对国家标准(GB2321-80)汉字字符集进行混合编码,用户只要记住每个汉字的三种基本编码音码、部首码、和笔画码,在输入汉字时,对这些编码进行组合,就能输入几十万条词汇和国标字。1.音码将每个汉字的拼音分为两个独立部分,第一部分为声母S,用24个符号表示,第二部分为韵母Y,用17个符号表示。它们分别为S=(b,c,d,f,g,h,j,k,l,m,n,p,q,r,s,t,v,w,x,y,z,],′,/}Y={1,2,3,4,5,6,7,8,9,0,-,=,a,e,i,o,u}其中每个符号与拼音字母之间的关系为编码Sb c d f g h j k l m n p q r s t v w x y z ] ′ /| | | | | | | | | | | | | | | | | | | | | | | |声母 b c d f g h j k l m n p q r s t w x y z zh ch sh其中v对应为不发声的零声母。编码Y1 2 34 56 7 8 90 -= a e i o u| | || || | | || ||| | | | |韵母 ai an uan ei ang ao en in ing ou eng ong a e i o uuai ian ui iang iao er un iou ueng iong ia ieuo uuang üe2.部首码X对GB2321-80汉字设立40个部首和五种笔画,每个部首、笔画和它们的编码X之间的关系如下金钅木水氵火土,日月山石 方匚冂凵j m / h t r y / / f女 王衣衤礻 食饣 足 ,犬犭 虫马牛牜 羊 n w y s z q ′m n y人亻手扌 □ 耳阝 目,鱼米禾草艹 竹r t k v m y m h c ]心忄病疒 车 门广厂 ,言讠 丝纟 宝宀冖二 两亠冫丷x b ′ m g y j b v l点丶 横一 竖丨 亅撇丿折 乛乙ㄑj h /p ]每个部首、笔画和它们的编码之间的对应关系是部首、笔画和它们的拼音的声母的编码对应。即每个部首、笔画都可以对应到S中的一个符号。3.笔画码B对每个汉字的最后一笔设立笔画编码B,B和笔画之间的对应关系如下笔画码B。; \ ,,′,/,}首码集;Y={0,1,2,3,4,5,6,7,8,9,-,=,a,e,i,o,u}韵母码集;S={b,c,d,f,g,h,j,k,l,m,n,p,q,r,s,t,v,w,x,y,z,],′,/}声母码集;X={b,c,d,f,g,h,j,k,l,m,n,p,q,r,s,t,v,w,x,y,z,],′,/}部首码集;K空格;a小写字母a;则有如下16种组合汉字编码编 第 第 第 第 字一 二 三 四 与号 码 码 码 码 词1 G K 高频字12 D F 高频字23 S Y 二码字4 S Y X K三码字5 S Y X X四码字16 D G 高频二字词17 S S 次高频二字词8 S S S K三字词9 S S S S四字词10 S S S Y多字词11 S Y S Y二字词12 X X B 不认识的字13 X X B S四码字214 G B 高频二字词215 S S S B三字词16 a F 各种符号5.句子组合码句子组合码以`符号打头,后面是以上16种编码的任意组合,回车符是句子组合编码的结束符,句子的编码最长为250个字符。本专利技术与已有技术相比的优点如下①易学性好,普及率高,因为我国小学生对拼音已经完全掌握,只要知道字的发音就能输入汉字。②编码短,速度快,字词句组合输入,80%用词组和高频字输入。③打字与构思一致,因为人是以词和语句进行思维的,字词句输入是以词句为主导,词组的数量不受限制,一般文章可以达到70%的内容用词组输入,所以打字时能与构思基本一致。④对不认识的字(用编号12)和不会写的字(用编号3)都能输入,对于不认识的字,可以输入该字的两个部首码和最后的笔画,就可以找到。对于写不出来的字可以用两码拼音和翻页符`即可输入。⑤词组编码由计算机自动生成,根据6763个字的音码、部首码、笔画码,词组编码生成器是根据词组文件(用逗号把词组隔开的文本文件),自动识别二字词、三字词、四字词和多字词,然后对它们进行编码,最后将词组和编码有序地存入字词句知识库中。⑥用户可以用自己的专业词组文件,自动建立用户自定义词库。⑦高频字和和高频词可由用户定义和修改。本专利技术的附表表面说明表1.计算机键盘与编码对应表。表2.输入形式和识别出来的字、词和符号表。表3.一码+空格输入的高频字与键盘对应表。表4.二码高频字码表;表5.高频二字词码表本专利的附表结合实施例作如下详述表1注该键盘为计算机英文标准键盘。表2 表中的大写字母表示如下内容F={0,1,2,3,4,5,6,7,8,9,-,=}复韵母码集;D={a,e,i,o,u}单韵母码集;B={。,;,,′,/}首码集;Y={0,1,2,3,4,5,6,7,8,9,-,=,a,e,i,o,u}韵母码集;S={b,c,d,f,g,h,j,k,l,m,n,p,q,r,s,t,v,w,x,y,z,],′,/}声母码集;X={b,c,d,f,g,h,j,k,l,m,n,p,q,r,s,t,v,w,x,y,z,],′,/}部首码集;K空格;a小写字母a;表中编号为3、7、12、16的输入形式需要在提示行上选择编号,字词才能到达光标位置。编号为17的输入形式是句子输入,在句子输入中,组合编码可以是表中的16种输入形式的组合,若其中某种输入形式有重码,则取其频度最高的字或词。由此可见,利用2到4位符号对字词混合编码并用这些编码的组合进行汉字输入,就是。利用这种方法,可以进行各种各样的字词句输入。例如,打入rm,提示行显示为“字词句rm人民1任命2人命3认命4人们”,再打入空格,“人民”就到达光标处;若打入的是r7m7,“人们”就直接到位;打入zmy,“怎么样”到位;打入ymdx,“一马当先”到位;打入]hro,“中华人民共和国”到位。若用句子输入,输入编码`]hro/i g wd d oj,“中华人民共和国是一个伟大的国家”立即显示到当前光标位置。本文档来自技高网...

【技术保护点】
字词句组合汉字输入法,由声母码、韵母码、部首码、笔画码、字词组合码和句子组合码构成,其特征是由: ①,声母码S和声母的对应关系为:编码S:bcdfghjklmnpqrstvwxyz]’/声母:bcdfghjklmnpqrstwxyzzhchsh 其中v对应为不发声的零声母; ②,韵母码Y与韵母的对应关系为:编码Y:1234567890-=aeiou 韵母:aianuaneiangaoeniningouengongaeiou uaiianuiiangiaoeruniouuengiongiaieuo∴ uang∴e ③,部首码X与部首的对应关系为:编码X:bcdfghjklmnpqrstvwxyz]’/部首:疒艹、方广火金口两木牛丿犬人食土二王心言足竹车水 ∴丶匚厂禾钅亠马女犭亻∴士耳忄讠∴虫氵宀冂一糸冫目日手阝月∴山 ∴U纟∴米扌衣∴石 ∴门∴∴丨 ∴∴∴ 羊∴∴ 鱼 ④,笔画码B,它与汉字的最后一个笔画的对应关系为:笔画码B:.;\,[笔画:点(、,丶)横(一)竖(丨,∴∴)撇(丿,∴),折(∴,∴,∴,∴); ⑤,字词组合码:设: F={0,1,2,3,4,5,6,7,8,9,-,=}:复韵母码集; D={a,e,i,o,u}单韵母码集; B={.,;,[,\,,]:笔画码集; G={a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,r,s,t,u,V,w,x,y,z},’,/}:首码集; S={b,c,d,f,g,h,j,k,l,m,n,p,q,r,s,t,v,w,x,y,z},’,/]:声母码集; X={b,c,d,f,g,h,j,k,l,m,n,p,q,r,s,t,v、w,x,y,z,},’,/]:部首码集; K:空格;a:小写字母a;则有如下16种组合汉字编码:编第第第第字一二三四与号码码码码词 1GK:高频字1 2DF:高频字2 3SY:二码字 4SYXK:三码字 5SYXX:四码字1 6DG:高频二字词1 7SS:次高频二字词 8SSSK:三字词 9SSSS:四字词 10SSSY:多字词 11SYSY:二字词 12XXB:不认识的三码字 13XXBS:四码字2 14GB:高频二字词2 15SSSB:三字词 16aF:各种符号 ⑥,句子组合码:句子组保码以’符号打头,后面是以上16种编码的任意组合,回车符是句子组合编码的结束符,句子的编码最长为250个字符。...

【技术特征摘要】

【专利技术属性】
技术研发人员:李先国
申请(专利权)人:西北工业大学
类型:发明
国别省市:61[中国|陕西]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1