当前位置: 首页 > 专利查询>陈保国专利>正文

音型位置码汉字输入和字典检索方法技术

技术编号:2847184 阅读:252 留言:0更新日期:2012-04-11 18:40
音型位置码汉字输入和字典检索方法是一种用于电脑键盘等设施的汉字输入音形码技术和一种按注音字模块拼音首字母、型式、笔画位置编码检索查字技术。1.选用注音字模块合188个,置于标准键盘A-Z键;五种基本笔画按汉字三型分五区置A-Y键;置注音字模块识别键V;所有汉字不超过4码输入。2.选用注音字模块数量少、规律性强、规则简单,先分字型、次取注音字模块、笔画位置编码、顺序编码、词汇输入,通用字表汉字可少重码输入。3.按汉字三型、注音字模块、基本笔画、优先级的组合建立字库,由字型出发到模块(或笔画)再模块(或笔画)再模块(或笔画)的树状检索结构程式,可进行汉字字典检索。

【技术实现步骤摘要】

本专利技术是一种应用于电脑键盘等设施上的汉字输入技术和一种全新的根据汉字结构型式、注音字模块(含选定部首)、笔画位置检索的字典查字方法的技术。
技术介绍
1、现有的汉字输入方法可分为音码、形码、音形/形音码三大系列音码和音形/形音码对方言区的人士常因读音而影响使用效果,还有重码多的缺点;形码普遍有非规范的汉字部首拆分、不符合规范的笔划顺序、字根太多难于记忆、或键码太多输入效率低的缺点,且多数方案与现行的语文教育体系中汉字教学大纲脱节、或丧失汉字结构型式上的完整性。2、现有的字典检索方法有部首法、拼音法、四角法、笔划数法,缺少汉字结构型式的整体性特征,与现行的语文教育体系中汉字教学大纲有较大的距离。
技术实现思路
1、本专利技术选用了汉字全集中构字能力较强的符合成字规范的注音字模块188个,按标准键盘的A-Z取26键位配置;五种基本笔画按照汉字的上下型、左右型、独体—围中型共三类型式划分,依上下型的上部/下部、左右型的左部/右部、独体—围中型分五区与键盘的A-Y共25键位相匹配;设定注音字模块子汉字集专用的V识别键,配置在V键位,此类汉字合计有162个;所有汉字在标准键盘上用不超过4码的编码实现汉字的输入。本方法属于音形码这一类别。(1)、汉字型式方法中引用了《汉字写法规范字典》中的汉字形体结构类型表的细分方法,归并为上下型、左右型、独体—围中型共三大类别。①、上下型—即为上下结构类型汉字,示例如下忠=中+心、想=相+心=(木+目)+心、霜=雨+相=雨+(木+目)、髹=髟+休=(镸+彡)+(亻+木)、蕊=艹+惢=艹+(心+(心+心))、 蟹=解+虫=(角+(刀+牛))+虫、崮=山+固=山+(囗+(十+口))、翼=羽+異=(习+习)+(田+(+八))、岗=山+冈、器=哭+ =((口+口)+犬)+(口+口)、纛=毒+縣=(+母)+( +(幺+小))、孽=薛+子=(艹+( +(立+十)))+子,②、左右型—即为左右结构类型汉字,示例如下村=木+寸、锄=钅+助=钅+(且+力)、楼=木+娄=木+(米+女)、剽=票+刂=(覀+示)+刂、撵=扌+辇=扌+((夫+夫)+车)、撬=扌+毳=扌+(毛+(毛+毛))、墁=土+曼=土+(日+罒+又)、劓=鼻+刂=(自+田+丌)+刂、缀=多+叕=纟+((又+又)+(又+又))、搬=扌+般=扌+(舟+(几+又))、掰=手+分手=手+((八+刀)+手),③、独体—围中型包括独体型结构汉字(也称独体字)、包围结构汉字和全围合结构汉字,又可细分出八个系列,示例如下独体型结构一、乙、人、八、刁、中、电、毛、主、工、斤、凡、业、重、扎,左上右包围凤=几+又、闼 =门+达、阈=门+或、阔=门+活、阗=门+真,左下包围廷=壬+廴、迦=加+辶、氇=毛+鲁、邂=解+辶、飚=风+焱,上左下包围匹=匚+儿、匿=匚+若、匦=匚+轨、匾=匚+扁,左下右包围凼 =水+凵、函=承+凵、幽=幺幺+山,上左包围庆=广+大、屁=尸+比、戽=户+斗、厢=厂+相、瘊=疒+侯,上右包围句=勹+口、匈=勹+凶、氛=气+分、氤=气+因,全围合结构困=囗+木、圆=囗+员、囿=囗+有、圈=囗+卷、圉=囗+幸; (2)、注音字模块、基本笔画的键盘配置 (3)、五种基本笔画方法中引用了《汉字写法规范字典》中的汉字笔画分类和名称,按照规范归并为横一(含提ン)、竖丨、撇丿、点丶(含捺乀)、折乙共五个基本类别,其中仅折乙笔就有25种形式,形式最为多样和丰富。五种基本笔画在现代汉语的运用,横笔一(含提ン)使用频率最高、其后依次是竖笔丨、点笔丶(含捺乀)、撇笔丿、折笔乙。五种基本笔画相应于汉字三种形式的键盘配置如(2)中表之“基本笔画”列所示。(4)、特选键位的配置本方法特选了现代汉语中26个使用频率高的高频字,26个为方便记忆而给键位命名的键名字(或为注音模块、或为包含注音模块的汉字等),另补充有26个较常用的字称为较高频字(即三次码),选用V键作为注音字子汉字集中专用的识别键;①、高频字、较高频字(二次码)与键名字的键盘配置 ②、V键位列示的识别码汉字清单同头田日二儿而耳为无五文勿万未午其且犬丘七区齐也业衣羊曰央永又由酉雨右尤已尹弋乂聿幺之平止旁皮果光更广革弓戈鬼骨冈艮瓜非反飞丰大电当石刀豆丁东事上十四史书身食尸巳氏厶勺司后乎禾黑互见今几己九斤角巾臼及甲夹开考里老力立门六米皿龙兰面民目毛麦母末免那年内南农牛鸟不比百八并匕卜巴半北在重者竹舟左专出成产虫厂车彳寸长小向兴习西穴夕乙 (5)、汉字拆字编码原则先分字型上下型(上部/下部)、左右型(左部/右部)、围中型(内部/外部),每个部分都不少于两笔划,或为单个字或为注音字模块或含注音字模块或为笔画组合;独体型,不能拆分以上三种型式,或为注音字模块加单笔画,或为注音字模块与笔画相连,或为注音字模块与笔画相交,或者只能拆出单笔画的字。次取模块注音字模块优先、其次是基本笔画,取模块时尽量取多笔画结构。顺序编码上下型(上部/下部)、左右型(左部/右部)、围中型(内部/外部)汉字编码4个或以上模块的字,依笔顺取一、二、三、末模块编码,为四码字;3个模块的字,依笔顺取三模块编码①、无剩余笔画为三码字,②、有剩余笔画,取余末笔编位置码,为四码字;2个模块的字,①、无余笔a)、左右型汉字,取两模块编码,为二码字,否则,b)、上下型/围中型字,加取末笔位置码,为三码字;②、有余笔,取余末笔编位置码,为三码字;1个模块的字,先取模块码,加取首末余笔编位置码,为三码字。独体型汉字编码注音字模块字,取V+模块码+末笔位置码,为三码字;1个模块的字,a)、余一笔,双取余笔编位置码,为三码字;否则,b)、余多笔,取首末余笔编位置码,为三码字;无模块汉字,①、二笔画字、顺取二位置码,三笔画字、顺取三位置码;②、四笔或以上笔画字,顺取一、二、三、末笔画,为四码字;(6)、词汇输入二字词输入,首字的(首码+首码+次码)+次字的首码,为四码;若首字为高频字,则(首字+首字+次字)的首码,为三码; 三字词输入,首字的(首码+首码)+(次字+末字)的首码,为四码;四字词输入,(首字+次字+三字+四字)的首码,为四码;多字词输入,(首字+次字+三字+末字)的首码,为四码。2、本专利技术所述的字典检索方法,引用了如1中的三种汉字结构型式、26个键盘字模块、162个注音字模块和5种基本笔画。现在常用的汉字字典的偏旁部首在这里或为注音字模块、或为与注音字模块有相应的同源关系,参见1中之(2)表所列;只有以下24个笔画数较少、现代汉语中未独立成字的部首如匚、刂、、冂、丷、勹、、亠、冫、冖、、凵、廴、尢、、彡、夂、彐、彑、巛、攵、肀、爫,未有相对应的注音字表示,只能用5种基本笔画来描述。检索原则是(1)、汉字分三型左右型、上下型、独体—围中型;(2)、分型后取模块注音字模块、或基本笔画;(3)、遵从优先级注音字模块取大优先、最后基本笔画;(4)、模块逐个分首取模块、不足三模块汉字加取一个或二个基本笔画。依这四项原则,构造出字型—模块(或笔画)—模块(或笔画)—模块(或笔画)的由字型出发到模块(或笔画)再模块(或笔画)再模块(或笔画)的树状汉字检索程式。本专利技术的特点是(1)、注音字模块独立成字、数量少仅18本文档来自技高网...

【技术保护点】
一种选用汉字集中构字能力较强、容易认读并符合通常成字规范的注音字模块188个,按标准键盘A~Z共26键位配置;及五种基本笔画按照汉字的上下型、左右型、独体一围中型共三类型式划分,依上下型的上部/下部、左右型的左部/右部、独体一围中型分五区与键盘A~Y共25键位相匹配;还设定有注音字模块汉字子集专用的识别键,配置在V键位,合计此类汉字162个;所有汉字在标准键盘上不超过4码即可实现汉语文字的输入。

【技术特征摘要】
1.一种选用汉字集中构字能力较强、容易认读并符合通常成字规范的注音字模块188个,按标准键盘A~Z共26键位配置;及五种基本笔画按照汉字的上下型、左右型、独体—围中型共三类型式划分,依上下型的上部/下部、左右型的左部/右部、独体—围中型分五区与键盘A~Y共25键位相匹配;还设定有注音字模块汉字子集专用的识别键,配置在V键位,合计此类汉字162个;所有汉字在标准键盘上不超过4码即可实现汉语文字的输入。2.权利1中汉字先分型、再拆分,按注音字模块优先、其次基本笔画的优先级别,依照汉字笔画顺...

【专利技术属性】
技术研发人员:陈保国
申请(专利权)人:陈保国
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1