当前位置: 首页 > 专利查询>高永贤专利>正文

十码汉字输入法Ⅱ制造技术

技术编号:2849477 阅读:230 留言:0更新日期:2012-04-11 18:40
十码汉字输入法Ⅱ为了词组编码时少产生歧义,在十码汉字输入法的基础上做了一些改动。它是一种字形码。以国家规定的五种基本笔画为基础,根据汉字部件中起笔笔画分布不均匀,笔形是动态变化的特点,把汉字的笔画、笔画组合、偏旁部首分成十类,以横起笔的分成三组,以竖、撇、点起笔的各分成两组,以折起笔的不分。记住每组的特征和说明就能对汉字拆分和编码。

【技术实现步骤摘要】

本专利技术属于计算机中文信息处理领域。随着科技的进步,信息时代的到来,汉字输入成为了社会信息化,数字化进程的“瓶颈”。笔画输入方便易学,但汉字是拼形文字,大多以部首开头,一定长度的部首笔画,增加了区分汉字的码长,降低了汉字的输入速度。本专利技术针对数字设备上输入汉字速度上存在的不足,提供一种输入速度有些改进的数字化汉字输入方案。汉字的造字历史延续了几千年,经历了从甲骨文到仿宋体的演变;繁体字到简化字的演变;有篆、隶、草、行、楷等多种书体;说明汉字也有一个不断发展完善的过程。构成汉字的笔画有几十种,而且是有规律的。在楷书中,笔画分为八种基本类型点、横、竖、撇、捺、钩、折、提(挑),每个基本类型又分出许多变化形态。如“点”就有“左点、右点、长点、短点”等。国家语委制定的笔画规范规定汉字有“横、竖、撇、点、折”五种基本笔画,其中规定“提”放“横”中;“竖钩”放“竖”中;“捺”放“点”中;横向钩、右向的各种钩归于“折”中。“一、二、三、四、五、六、七、八、九、十”十个数字,是最常用的汉字,也可能是先祖最先造的汉字。其中以横起笔的就有六个,对《新华字典》中的汉字进行分析,以横起笔汉字多,折笔的变化多。为了部件间的相互协调,字形美观,有些部件的笔形会随所处的位置不同而发生变化。如“己”字在右边构字时,最后一笔为“乚”, 在左边构字时,最后一笔为“し”。十码汉字输入法II为了词组编码时少产生歧义,在十码汉字输入法的基础上做了一些改动。它是一种字形码,以国家规定的五种基本笔画为基础,根据汉字部件中起笔笔画分布不均匀,笔形是动态变化的特点,把汉字的笔画、笔画组合、偏旁部首分成十类,对汉字进行拆分和编码。一、分类情况十码输入法II以起笔笔画的类型及笔画组合分类,以横起笔的分成三组,以竖、撇、点起笔的各分成两组,以折起笔的不分,共十组。记住每组的特征和附注中的注解,就能简便而快速对汉字拆分和编码。有些笔画组合字库中没有,汉字组字时用到,可以用文字描述其结构特征。下面为具体的分类表 说明1、第一笔为“一”,第二笔为“亅、し、、乚”的笔画相连组合,与“丁七”相似,拆分时当作“丁七”,编码为“1”。2、“冉、禺”中“冂”+“丨”组合,拆分时当作“巾”,编码为“4”。3、“脊”的最前四笔、“隶”的最后四笔,拆分时当作“四点”;编码为“7”。4、第一笔为“丿”,第二笔为“、し、、乚”的笔画组合,与“勹儿匕”相似,拆分时当作“勹儿匕”,编码为“9”。5、“四横”拆分成“三横”+“一横”。二、汉字的拆分和编码在汉字集中,笔画、笔顺一样,下笔的位置、长短不同,会产生字形、字义不同的字。如“九几,人入八乂,太犬……”,要使汉字编码无重码,几乎不可能。汉字是由多种笔画组合而成的方块形式,对于同一汉字,各人拆分方法不同。十码输入法II尽可能减少码长和重码,对汉字的拆分和编码作以下规定1)按照国家规范规定的笔形标准和笔顺拆分和编码。如与→一ㄅ一→101万→一丿→108义→丶乂→68 比→一し匕→19(一、し相连当作“七”)2)汉字的编码长度为1-4个,分类表中的部件不拆分,码长为1个;当拆分的部件数为2-4个时,编码按顺序有多少,取多少;当拆分的部件数多于4个时,前3码按顺序取、第4个码取最后一个部件的编码。如春→三人日→385 隹→亻亠→863堡→亻口木土→8432 愉→忄人一冂二刂→78143)有的偏旁部首在书写时不是连续笔画,除“匚、囗、心”可以不拆,其它的不是连续笔画的部件都要拆分。如巨→匚一→101 国→囗王丶→436必→心丿→78 黑→囗丷丨二灬→47574)“冂、囗、日、目”外粘连有“丿”的,拆分为“丿”加“冂、囗、日、目”。如向→丿冂口→844 囟→丿囗乂→848白→丿日→85 自→丿目→845)有些字有多种拆分的方法,有的字取笔画少的部件,部件数或重码会少一些,或者更符合习惯。规定“开→一井、未→一木、正→一止、缶→一山、亚→一 丷一”,字的下面有“廾、木、止、山”的比照拆分。如井→一廾→12 末→一木→13戒→一廾乚丶→1206朱→木→93正→一止→15 武→二止乚丶→2506出→丨山→055 卸→一止丨→9155严→一 丷厂→1473 缶→一山→9156)“弋”的下面有“横”的,与“弋”的“一”是连续笔画,拆分时“弋”的“横”单独编码。如式→一丅一乚丶→1316贰→一二贝乚丶→12467)除上面4、5、6例举的几种情况的部件外,其余的汉字按笔顺遵循“有多不取少”的拆分原则,即拆分时先取笔画多的部件,不用笔画少的部件。如曹→一冂艹一日→1425东→七亅八→158曹→一囗艹日→1425 臣→匚丨丅→1503牙→一亅丿→1058 瓦→七乙丶→106共→艹一八→218 其→艹三八→238直→十冂三一→2431 干→二丨→25酉→西一→31青→冂二→342由→囗十→42也可以 曲→囗艹→42也可以由→冂土→42曲→冂艹一→421见→冂儿→49亡→亠→60手→丿二亅→825 丘→亻丅一→831豸→丿二点勹二撇→8799 及→丿折捺→806生→牛一→91己已巳→七→01民→七七→011 聿→三十→032等等三、词组的编码1)对于两字词组、取每个字的前两个码,当词组中有分类表中的部件时,就只取一码。如词组→6004 车辆→1112)对于三字词组,取前两字的第一个码,第三字的前两码,当第三个字为分类表中的部件时,就只取一码。如太平洋→2177 心连心→7173)对于四字及以上字的词组,取每个字的第一个码。如三言两语→3616 岗位责任制→58389十码输入法II可以对《新华字典》中所有的字编码。对于更大的汉字集一样能够编码,只是增加了一些重码。本文档来自技高网...

【技术保护点】
十码汉字输入法Ⅱ为了词组编码时少产生歧义,在十码汉字输入法的基础上做了一些改动。它是一种字形码,以国家规定的五种基本笔画为基础,根据汉字部件中起笔笔画分布不均匀,笔形是动态变化的特点,把汉字的笔画、笔画组合、偏旁部首分成十类,对汉字进行拆分和编码。以横起笔的分成三组,以竖、撇、点起笔的各分成两组,以折起笔的不分,共十组。“一七、二十、三厂”为以横起笔的三组的主要特征“*口、丨日”为以竖起笔的两组的主要特征 “丶、冫氵”为以点起笔的两组的主要特征 “八一撇、九二撇”为以撇起笔的两组的主要特征。汉字的编码长度为1-4个,分类表中的部件不拆分,码长为1个;当拆分的部件数为2-4个时,编码按顺序有多少,取多少;当拆分的部件数多于4个时,前3码按顺序取、第4个码取最后一个部件 的编码。

【技术特征摘要】
1.十码汉字输入法II为了词组编码时少产生歧义,在十码汉字输入法的基础上做了一些改动。它是一种字形码,以国家规定的五种基本笔画为基础,根据汉字部件中起笔笔画分布不均匀,笔形是动态变化的特点,把汉字的笔画、笔画组合、偏旁部首分成十类,对汉字进行拆分和编码。以横起笔的分成三组,以竖、撇、点起笔的各分成两组,以折起笔的不分,共十组。“一七、二十、三厂”为以横起笔的三组的主要特征“ 口、丨日”为以竖起笔的两组的主要特征“丶、冫氵”为以点起笔的两...

【专利技术属性】
技术研发人员:高永贤
申请(专利权)人:高永贤
类型:发明
国别省市:36[中国|江西]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1