当前位置: 首页 > 专利查询>唐国栋专利>正文

汉字输入方法技术

技术编号:2918942 阅读:178 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及汉字输入方法及其专用键盘,它包括:汉字拼音输入、字形输入、声调和笔划输入,声调输入是根据汉字的结构选择输入声调,声调用一个键位表示,笔划输入是在声调的后面用一个键位表示的该字的笔划数,该汉字输入方法与现有汉字输入方法相比,无论对字形还是对发音都具备编码的唯一性,并且它的扩展性、排序检索性和兼容性都优于现有的汉字输入方法,该汉字输入方法易学、易记、易于推广、便于查询、检索、教学和研究,用本发明专利技术输入方法设计的软件加入语音识别技术,就可做到人机用汉语互动,甚至用汉语对机器人下达指令,其专用键盘是根据操作者使用字母的频率和输入字母之间的连接关系而得出的,它有利于操作者快速地进行盲打。

【技术实现步骤摘要】

本专利技术涉及一种汉字输入方法及其专用键盘,特别是涉及了一种具有编码唯一性的汉字输入方法和专用键盘。
技术介绍
汉字的编码目前主要有两个方面,一是用于计算机识别的汉字内码,如GB2312(6763个字)、GBK(21886个字)、BIG5(13868个字)、GB 18030(27484个字)等。另一种是用于人们输入和识别的输入法编码,如五笔输入、全拼输入、双拼输入和仓颉输入法等。可以说是汉字的外码。目前的各种编码标准每个汉字的内码很机械难以记忆和输入,与输入法是完全脱节不同的两套编码,严重阻碍了中国的信息技术的发展,最简单的例子就是要开发汉语高级程序设计语言首先就要面临汉字的输入和编码问题,数千种的输入法却没有一种能囊括所有的繁简体汉字,这让编程工作者无所适从。所以国人学习编程基本都是英文的C语言等。一统汉字编码是中国信息产业必需通过的一个瓶颈。内码的优点1、编码对字形唯一性。2、便于计算机识别缺点1、编码不对发音唯一,这也意味着对字义也不唯一。难以区分多音字和多调字,导致汉字发音软件发音错误,如将“子弹zǐdàn”发音为“zǐtàn”,将“强大qiáng dà”发音为“qiǎng dà”。阻碍了汉字发音软件的发展。2、编码不等长,不利于计算机处理。3、不便于人为识别。如输入各种特殊符号非常困难。4、扩展性差,由于采用序列紧凑编码,使编码规范一但确定难以增删其它汉字,导致GB等标准的各种扩展和后续版本出现,难于统一。这同时也限制了新生汉字的产生和发展,缺乏创新的汉字极易被英文所淘汰。5、编码空间有限,限制了更多字符的编入。6、兼容性差,如GB2312与ASCII有重叠。7、统一性差。中国大陆和港、澳、台地区使用GB码、大五码等内码,导致同一编码在不同的编码标准内可能代表不同的汉字,阻碍了汉语的统一数码化。7、对汉字进行排序检索的性能差,不能同时对所有汉字分别以音、调、部首、笔划数进行排序和检索,防碍了搜索引擎、高级汉语编程语言等的应用。外码优点1、便于人为识别。2、便于输入。缺点1、重码多,编码不唯一,不便于机器识别和人们学习记忆。2、形码字根难记,音码重码多且输入错别字的机率极高。其它音形结合码编码规则晦涩难懂,难于记忆。3、各种输入法编码规则能有效唯一编码输入的汉字有限,如专利号CN1388430A“现代汉语音文输入法”只能实现5000汉字的唯一编码输入。4、各种输入法和编码方法所表达的汉字各项要素不全,要么是只有音码,要么只有形码,较全的是专利号CN1388430A的现代汉语音文输入法共有声、调、韵、形4种要素,而一统汉字编码有声、韵、调、结构、部首、笔画共6种要素,可以说是目前反映汉字特征最完备的编码方法。5、各种输入法特别是形码都在一定程度上破坏了汉字原本的构字原则和方法,比如五笔,让汉字研究工作者扼腕痛惜。
技术实现思路
本专利技术的目的在于解决现有汉字输入法的重码率高、编码不唯一的缺点,提供一种具有编码唯一性的汉字输入方法及其专用键盘。本专利技术提供的一种汉字输入方法,它包括汉字的拼音输入、字形输入和在拼音和字形输入的后面加入该汉字的声调输入,其中它还包括在声调输入后面的笔划输入,声调输入是根据汉字的结构选择输入声调,声调用一个键位表示,笔划输入是用一个键位表示的该字的笔划数;本专利技术提供的一种汉字输入方法,其中所述根据汉字的结构选择输入声调是按下列情况进行选择(1)当该汉字为独立字,轻声对应输入键位t,一声对应输入键位r,二声对应输入键位e,三声对应输入键位w,四声对应输入键位q;(2)当该汉字为包围或半包围结构的字,轻声对应输入键位y,一声对应输入键位u,二声对应输入键位i,三声对应输入键位o,四声对应输入键位p;(3)当该汉字为左右结构的字,轻声对应输入键位g,一声对应输入键位f,二声对应输入键位d,三声对应输入键位s,四声对应输入键位a;(4)当该汉字为上下结构的字,轻声对应输入键位h,一声对应输入键位j,二声对应输入键位k,三声对应输入键位l,四声对应输入键位m;(5)当该汉字为叠形字,轻声对应输入键位b,一声对应输入键位v,二声对应输入键位c,三声对应输入键位x,四声对应输入键位z;本专利技术提供的一种汉字输入方法,其中所述用一个键位表示的该字的笔划数是用数字0-9键表示0-9笔划数,用小写字母a-z表示10-35笔划数,用大写字母A-Z表示35-61笔划数,用“;”键表示62笔划数,“”键表示63笔划数;本专利技术提供的一种汉字输入方法,其中所述汉字的拼音输入在所述字形输入的之前或之后;当所述汉字为简体字时,用小写字母输入该字的拼音和字形;当所述汉字为繁体字时,用大写字母输入该字的拼音和字形;本专利技术提供的一种汉字输入方法,其中所述汉字的拼音输入是采用两个键位输入该汉字的声母加韵母,其中双声母zh、ch和sh分别用v、i和u替代;复合韵母iu用q替代、ia和ua用w替代、uan、üan和er用r替代、üe用t替代、uai用y替代、uo用o替代、un和ün用p替代、ong和iong用s替代、uang和iang用d替代、en用f替代、eng用g替代、ang用h替代、an用j替代、ao用k替代、ai用l替代、ing用“;”号替代、ei用z替代、ie用x替代、iao用c替代、ui和ü用v替代、ou用b替代、in用n替代、ian用m替代;本专利技术提供的一种汉字输入方法,其中所述汉字的字形输入是采用四个键位表示,采用下面的汉字拆字步骤进行拆分(1)当汉字为部首字,该汉字本身为第一部首;(2)当汉字为包围或半包围结构的字,包围或半包围结构的部首为第一部首;(3)当该汉字为左右结构的字并且该汉字的左侧为一单独部首时,左侧的部首为第一部首;若该汉字的左侧不是一单独部首时,而右侧为一个单独的部首时,右侧的部首为第一部首;(4)当该汉字为上下结构的字并且该汉字的上部为一单独部首时,上部的部首为第一部首;若该汉字的上部不是一单独部首时,而下部为一个单独的部首时,下部的部首为第一部首;(5)当该汉字为叠形结构的字,找出组成该字的三个或者四个相同的单字,先将该单字按照上述(6)(1)、(3)或(4)的顺序拆分成第一部首、第二部首或第三个部首,再将叠字的三个或者四个相同单字的上述部首组合,排列成第一部首、第二部首……或第n部首;(6)上述(2)-(4)步骤中拆出第一部首后,该汉字剩下的部分再按照上述(2)-(4)的汉字拆字步骤进行拆分,直到均拆为部首为止,拆分后的部首依次为第二部首、第三部首、第四部首……或第n部首;字为部首字上述汉语拼音输入中的双声母或复合韵母是用上述汉字的拼音输入的双声母和复合韵母所替代的键位替代;本专利技术提供的一种汉字输入方法,其中当该汉字为部首字,第一部首的名称用一个汉字表示时,输入该部首名称的声母加韵母,其余两个键位用“00”添加;当第一部首的名称用两个或两个以上的汉字表示时,只输入该部首名称的前两个汉字的声母,其余两个键位用“00”添加;本专利技术提供的一种汉字输入方法,其中当该汉字被拆成两个部首时且第一部首和第二部首的名称均用一个汉字表示,先输入第一部首名称的声母加韵母,再输入第二个部首名称的声母加韵母;当第一部首和第二部首的名称均用两个或两个以上的汉字表示,先输入第一部首名称中前两个汉字的本文档来自技高网
...

【技术保护点】
一种汉字输入方法,它包括:汉字的拼音输入、字形输入和在拼音和字形输入的后面加入该汉字的声调输入,其特征在于:它还包括:在声调输入后面的笔划输入,其中声调输入是根据汉字的结构选择输入声调,声调用一个键位表示,笔划输入是用一个键位表示的该字的笔划数。

【技术特征摘要】

【专利技术属性】
技术研发人员:唐国栋
申请(专利权)人:唐国栋
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1