当前位置: 首页 > 专利查询>复旦大学专利>正文

一种基于字根拆分的常用汉字编码体系制造技术

技术编号:9434371 阅读:231 留言:0更新日期:2013-12-12 00:28
本发明专利技术属于汉字编码技术领域,具体涉及一种基于字根拆分的常用汉字编码体系。本发明专利技术选取93个最常用的字根作为基本字根,对其它常用汉字进行表示;每个汉字用至少两个至多三个字根进行表示。在93个基本字根中有5个基本笔画——“一、丨、丿、丶、乙”作为具有相同字根表示的汉字间的识别码,它们一般位于汉字的字根组合的最后一位。本发明专利技术的编码的结果为使用率较高的汉字用2个码元进行表示,使用率次之的汉字用3三个码元进行表示。本发明专利技术极大地减少了基础字根的使用数量,提高了单个字根的使用率。同时5个基本笔画作为汉字之间的识别码被放在某些汉字的最后一个码元位置上,能够高效地从一段连续码字中判断出断点。

【技术实现步骤摘要】
【专利摘要】本专利技术属于汉字编码
,具体涉及一种基于字根拆分的常用汉字编码体系。本专利技术选取93个最常用的字根作为基本字根,对其它常用汉字进行表示;每个汉字用至少两个至多三个字根进行表示。在93个基本字根中有5个基本笔画——“一、丨、丿、丶、乙”作为具有相同字根表示的汉字间的识别码,它们一般位于汉字的字根组合的最后一位。本专利技术的编码的结果为使用率较高的汉字用2个码元进行表示,使用率次之的汉字用3三个码元进行表示。本专利技术极大地减少了基础字根的使用数量,提高了单个字根的使用率。同时5个基本笔画作为汉字之间的识别码被放在某些汉字的最后一个码元位置上,能够高效地从一段连续码字中判断出断点。【专利说明】一种基于字根拆分的常用汉字编码体系
本专利技术属于汉字编码
,具体涉及一种基于字根拆分的常用汉字编码体系O
技术介绍
汉字编码(Chinese character encoding )是为汉字设计的一种便于输入计算机的代码。目前较通用的方法是通过汉字编码方法使汉字进入计算机。汉字编码因其数量庞大,字形复杂,存在大量一音多字和一字多音现象而造成了编码的困难。据统计,现有400多种编码方案。其中,五笔字型输入法由王永民于1983年专利技术。五笔字型完全依据笔画和字形特征对汉字进行编码,是典型的形码输入法。将汉字进行分解,分解出一种基本的字型单位叫做“字根”,五笔字型即是基于字根对汉字进行分解输入。将100多个字根大致平均地分布在键盘的25个字母键上,并依照笔画顺序键入字根所对应的字母键以实现汉字输入。与拼音输入法相比较,五笔字型输入法具有低重码率的特点,熟练后可快速输入汉字。但现有的字根分解方法存在冗余。为了最大限度的消除冗余,使得每个字根的利用率最大化,本专利技术出一种新的字根拆分方法。将具有相似字形的字根进行合并,将在常用汉字中出现次数不多的字根用其它字根替代来表示,以此将用于表示其它汉字的字根压缩为93个,且所选用的字根本身都尽量是一个完整的汉字。
技术实现思路
本专利技术的目的在于提供一种操作方便,重码率较低,输入速度快的基于字根拆分的常用汉字编码体系。本专利技术提供的基于字根拆分的常用汉字编码体系,选取93个最常用的字根作为基本字根,对其它常用汉字进行表示。每个汉字用至少两个至多三个字根进行表示。在93个基本字根中有五个基本笔画一“一、丨、)、、、乙”作为具有相同字根表示的汉字间的识别码,它们一般位于汉字的字根组合的最后一位。本专利技术在拆分字根的基础上对3000多个常用汉字进行了自定义分类,进而依据字根进行编码。基本字根表如表I所示。表I基本字根表【权利要求】1.一种基于字根拆分的常用汉字编码体系,其特征在于:选取93个最常用的字根作为基本字根,对其它常用汉字进行表示;所述93个基本字根如下表所示: 【文档编号】G06F3/023GK103440044SQ201310164733【公开日】2013年12月11日 申请日期:2013年5月7日 优先权日:2013年5月7日 【专利技术者】黄书锦, 沈一帆 申请人:复旦大学本文档来自技高网
...

【技术保护点】
一种基于字根拆分的常用汉字编码体系,其特征在于:选取93个最常用的字根作为基本字根,对其它常用汉字进行表示;所述93个基本字根如下表所示:A、93个基本字根中,五个字根:“一、丨、丿、丶、乙”为基本笔画字根,其余为基本笔画字根;每个汉字由两个或者三个字根组合而成,若用"A"表示基本字根中的基本笔画字根,用"B"表示基本字根中的非基本笔画字根,则本编码体系中汉字的所有字根组合方式为:BB,BBA,AA,BA,BAA,共五种组合;B、基本字根中除“丨、丿、丶”3个以外,其余90个字根本身是一个完整的汉字,若用"B"表示这90个字根,则其作为独立的汉字的表示为:BB;C、5个基本笔画字根作为识别码位于汉字的字根组合的最后一位,对于具有同样的汉字字根表示的“甲”与“乙”两个汉字来说,若其字根表示均为B1+B2,B1与B2均表示一个非基本笔画字根,则在使用率较低的汉字后面添加一个A类字根作为识别码,则“甲”表示为B1B2A;“乙”表示为B1B2。dest_path_image001.jpg

【技术特征摘要】

【专利技术属性】
技术研发人员:黄书锦沈一帆
申请(专利权)人:复旦大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1