当前位置: 首页 > 专利查询>蒋贤春专利>正文

汉字十笔画编码制造技术

技术编号:5521384 阅读:968 留言:0更新日期:2012-04-11 18:40
本发明专利技术是一种根据汉字字形将七万字符集汉字用0-9共10个数字编码的方法。本发明专利技术将汉字笔画分为十类,分别对应数字0-9;根据字形结构将汉字拆分成两部分或三部分,各部分根据规则按笔画编码;通过一种补码的方法,将所有汉字编码码长规定为统一的6码,实现了重码多少可控制;采用高频先见和分段排序的方法,将汉字实际输入的编码大大缩短。按使用统计,平均一个汉字为2.3码,重码最多为5个,具有小学四年级文化程度者三分钟可以掌握。使用本发明专利技术输入汉字,不仅能提高汉字的输入速度,还能帮助使用者熟记汉字的正确书写方式,从而解决了提笔忘字的常见问题。本发明专利技术特别适用于手机等手持设备中的汉字输入,也适用于计算机中的汉字输入。

【技术实现步骤摘要】

本专利技术属于IT自然语言理解领域,提供一种利用计算机上0-9这10个数字对汉 字编码的方法。
技术介绍
中文输入法是指为了将汉字输入计算机或手机等设备而采用的编码方法。目前 大多数中文输入法都使用26个英文字母编码。随着手机等手持设备的大量使用,使用数 字键输入中文汉字已越来越普遍。
技术实现思路
1.概述本专利技术是一种根据汉字字形将七万字符集汉字用0-9共10个数字编码的方法。 本专利技术将汉字笔画分为十种,分别对应数字0-9;根据字形结构将汉字拆分成两部分, 各部分根据规则按笔画编码;通过一种补码的方法,将所有汉字编码码长规定为统一的 6码,实现了重码多少可控制;采用高频先见和分段排序的方法,将汉字实际输入的编 码大大缩短。按使用统计,平均一个汉字为2.2码,重码最多为5个,具有小学四年级文 化程度者三分钟可以掌握。使用本专利技术输入汉字,不仅能提高汉字的输入速度,还能帮助使用者熟记汉字 的正确书写方式,从而解决了提笔忘字的常见问题。 入。 本专利技术特别适用于手机等手持设备中的汉字输入,也适用于计算机中的汉字输2.笔画编码 2.1笔画分类 汉字笔画分为十种1.“横”笔画直的横,如“_■,等·’2."OS,,. 、·笔画直的竖,如“[夕等;3."ir 笔画撇,如“]” 等 4.“捺”笔画捺,如“'V,等;5.“横折”笔画第一段为横方向的折,如“刁”、“ ” 、6.“提,,笔画提,如‘V”Uζ,,等;7.“竖钩”笔画竖钩,如“ J *等;8.“撇点”向左撇的点,如“ J”等;9.“捺点”向右撇的点,如“、”等;10.“竖折,笔画第一段为竖方向的折,如“L”、"L" 2.2每种笔画对应的编码 l. “横”一>编码“l”; 2. “竖”一>编码“2”; 3. “撇”一>编码“3”; 4. “捺”一>编码“4”; 5. “横折”一>编码“5”; 6. “提”一>编码“6”; 7. “竖钩” 一>编码“7”; 8. “撇点” 一>编码“8”; 9. “捺点” 一>编码“9”; lo. “竖折”一>编码“o”. 3.汉字拆分方法 l.独体字不拆分; 2.部首不拆分; 3.非独体字根据字型结构拆分为两部分 .笔画交叉不拆分,如 “串”1 “孓”不能拆; .拆分后第一部分笔画数小于等于2不拆分,如 “尸”不能拆分为“1尸” .非上述两种情况皆拆分,如融一>需兔;等一> 寺. 4.独体字指CFOOl3—2009 《现代常用独体字规范》中的独体字和本专利技术汉字拆分方法 不允许拆分的汉字;部首指GF0011—2009 《汉字部首表》 中的部首和附形部首. 4.汉字十笔画编码 4.l独体字十笔画编码 l.根据汉字笔画顺序,取前6个笔画编码或结束, 如我一>317603;不一>1329. 2.若不足6码,则连续补“7”直至6码, 如不一>132977. 4.2可拆分成两部分的汉字十笔画编码 l.对汉字拆分后的两部分按下面的顺序分别共取6个笔画编码或结束 .按笔画顺序取第一部分前两个笔画编码; .按笔画顺序取第二部分前两个笔画编码; .若第二部分不是部首,则按笔画顺序取第二部分最后两个笔画编码; .按笔画顺序取第一部分最后两个笔画编码; 2.若不足6码,则连续补“7”直至6码. 4.3词十笔画编码 l.词的第一码为词标志“7”; 2.对词中汉字分别共取6个笔画编码或结束; 3.双字词按下面的顺序取码 取第一个汉字十笔画编码的前两码(不取补码); 顺序取第二个汉字十笔画编码(不取补码); 从第一个汉字十笔画编码的第三码顺序取码(不取补码);4.三字(含)以上词按下画的顺序取码 取第一个汉字十笔画编码的前两码(不取补码); 取第二个汉字十笔画编码的前两码(不取补码); 顺序取最后一个汉字十笔画编码(不取补码);5.若对词中汉字取码不足6码,则连续补词中汉字的个数直至6码。附图说明图1笔画对码功能图。权利要求1.一种汉字编码方法,其特征在于包括笔画编码、汉字拆分方法、汉字十笔画编 码、词十笔画编码。2.根据权利要求1笔画编码,其特征在于包括 (1)汉字笔画分为十种‘横”笔画直的横,如“一”等; ‘竖”笔画直的竖,如“丨”等; 笔画撇,如“ j ”等; 笔画捺,如“ 乂,,等; 笔画第一段为横方向的折,如“ ” 笔画提,如“Z” 、等; 笔画竖钩,如“ j ”等; 向左撇的点,如"J"等; 向右撇的点,如“、”等; 笔画第一段为竖方向的折,如“匕” 2)每种笔画对应的编码横,,一>编码“1 IJS ” 、一>编码“2 撇,,一>编码“3 捺,,一>编码“4 横折’’ 一>编码‘'5”提,,一>编码“6 竖钩’’ 一>编码‘‘rj ”撇点’’ 一>编码‘'8,,捺点’’ 一>编码‘'9,,竖折’’ 一>编码‘'0,,。3.根据权利要求1汉字拆分方法,其特征在于包括(1)独体字不拆分;(2)部首不拆分;(3)非独体字根据字型结构拆分为两部分 笔画交叉不拆分; 拆分后第一部分笔画数小于等于2不拆分; 眷非上述两种情况皆拆分。(4)独体字指CF0013-2009《现代常用独体字规范》中的独体字和本专利技术汉字拆分 方法不允许拆分的汉字;部首指GF0011-2009《汉字部首表》中的部首和附形部首。4.根据权利要求1汉字十笔画编码,其特征在于包括独体字十笔画编码、拆分成两部 分的汉字十笔画编码。5.根据权利要求4独体字对码编码,其特征在于包括(1)根据汉字笔画顺序,取前6个笔画编码或结束;(2)若不足6码,则连续补“7”直至6码。6.根据权利要求4拆分成两部分的汉字十笔画编码,其特征在于包括 (1)对汉字拆分后的两部分按下面的顺序分别共取6个笔画编码或结束 按笔画顺序取第一部分前两个笔画编码; 按笔画顺序取第二部分前两个笔画编码; 若第二部分不是部首,则按笔画顺序取第二部分最后两个笔画编码; 按笔画顺序取第一部分最后两个笔画编码; ⑵若不足6码,则连续补“7”直至6码。7.根据权利要求1词十笔画编码,其特征在于包括(1)词的第一码为词标志“7”;(2)对词中汉字分别共取6个笔画编码或结束;(3)双字词按下面的顺序取码 取第一个汉字十笔画编码的前两码(不取补码); 顺序取第二个汉字十笔画编码(不取补码); 从第一个汉字十笔画编码的第三码顺序取码(不取补码);(4)三字(含)以上词按下面的顺序取码 取第一个汉字十笔画编码的前两码(不取补码); 取第二个汉字十笔画编码的前两码(不取补码); 顺序取最后一个汉字十笔画编码(不取补码);(5)若对词中汉字取码不足6码,则连续补词中汉字的个数直至6码。全文摘要本专利技术是一种根据汉字字形将七万字符集汉字用0-9共10个数字编码的方法。本专利技术将汉字笔画分为十类,分别对应数字0-9;根据字形结构将汉字拆分成两部分或三部分,各部分根据规则按笔画编码;通过一种补码的方法,将所有汉字编码码长规定为统一的6码,实现了重码多少可控制;采用高频先见和分段排序的本文档来自技高网...

【技术保护点】
一种汉字编码方法,其特征在于包括笔画编码、汉字拆分方法、汉字十笔画编码、词十笔画编码。

【技术特征摘要】

【专利技术属性】
技术研发人员:蒋贤春
申请(专利权)人:蒋贤春
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1