当前位置: 首页 > 专利查询>贾守治专利>正文

一种汉字直查三码检字法制造技术

技术编号:3766304 阅读:242 留言:0更新日期:2012-04-11 18:40
一种汉字直查三码检字法,它属于一种汉字检字方法。它克服了部首、拼音音序、四角号码、笔画等检字法所存在的检字步骤繁杂、速度慢、规则难记忆、准确度低、同码字过多等缺点。其要点是:用“12345”五个数字,分别代表“一丨丿丶乙”五种基本笔形,这五个数字称作“笔形码”;用“67890”五个数字,分别代表在汉字结构中出现频率较高的五个部首“扌艹木 氵口”,这五个数字称为“部首码”。笔形码和部首码统称为“笔码”。编码规则:直查三码=笔画数,首笔码+第二笔码+末笔码圆点“.”左边是该字的笔画数,圆点右边是由首笔码、第二笔码、末笔码等3个笔码组成的“三码”。本发明专利技术可用于中文字词典等汉字工具书的编篡。

【技术实现步骤摘要】

本专利技术属于一种汉字检字方法,是涉及一种主要用于中文字词典的汉字检索的汉字检字法。
技术介绍
目前广泛使用的检字法有部首检字法、拼音音序检字法、四角号码检字法、笔画检字法 等,这些检字法各有其优缺点。部首检字法历史悠久,用的最广,几乎所有的中文字词典都有部首检字表。其缺点是检 字步骤繁多,耗费时间,査一个字需要经过判断部首+査该部首笔画数》査部首目录+找到 该部首在检字表中的页码+查该字除部首以外的笔画数》查检字表+根据在检字表中所示的 页码数翻到字典的正文页码等7个步骤,查一个字最快需要一分钟左右,有的字则数分钟也 査不到。拚音音序检字法的优点是,认识并能够准确读音的字一翻就能査到。其缺点 一是对不 认识的字一筹莫展,而我们査字还往往是査不认识的字;二是同音字太多,增加了査找难度, 有时查一个字也需要数分钟。四角号码检字法的优点是号码多,同码字较少,其缺点是规则多,难记忆,准确度低, 因而现在已很少有人使用。笔画检字法查字速度更慢,更困难,经常是在使用多种方法不灵时才被迫使用。综上所述,目前广泛使用的部首、拼音音序、四角号码、笔画等常用检字法存在着检字 步骤繁杂、速度慢、规则难记忆、准确度低、或同码字过多造成检字难等缺点。本专利技术就是为了克服上述几种常用检字法的缺点而设计的,提出了一种新的快速、简明、 易记、易学的汉字检字法。
技术实现思路
本专利技术依据汉字的笔画和汉字的书写顺序自然取码,提出一种新的汉字编码方法,其要 点是(一)利用"1、 2、 3、 4、 5"五个数字,分别代表"一 (横)I (竖)〗(撇)、(点) 乙(折)"五种基本笔形,即"横1、竖2、撇3、点4、折5",这五个数字称作"笔形码";利用"6、 7、 8、 9、 0"等五个数字,分别代表"矛廿木> 口"这五个在汉字结构中出现频 率相对较高的部首,即"手6、草7、木8、水9、 口 0",这五个数字称为"部首码"。笔 形码和部首码统称为"笔码"。"1、 2、 3、 4、 5、 6、 7、 8、 9、 0"这10个数字就是其所对应的汉字笔码。其中,z (提)归一 (横),J (竖钩)归I (竖),、(捺)归、(点),各种折笔笔 画归为乙(折)。笔码与笔形、部首的对应关系见下列表一。表一 汉字笔码表笔形码部首码笔形和部首— 1、乙净卄木笔码1234567890为了便于记忆,编以下口诀-横1竖2撇是3, 点捺为4折作5, 6手割7草8木, 好酒(9)水配好口令(0)。(二) 编码规则直査三码的编码规则非常简单,其编码规则如下直査三码-笔画数.首笔码+第二笔码+末笔码 艮P:直査三码是由笔画数、圆点和三笔码共同组成的一组编码。圆点"."左边是该字的笔画数,圆点右边是由首笔码、第二.笔码、末笔码等3个笔码组 成的"三码"。圆点的功能是区分和连接笔画数和三笔码。具体方法是先数汉字的笔画数,加一圆点,然后按汉字的书写顺序依次取该字的首笔码、第二笔码、 末笔码等3个笔码组成"三码",放在圆点后,由笔画数、圆点和三笔码共同组成一组编码。"三笔码"不足三码时补加"0", 因为检字时首先直接先査汉字的笔画数,然后再把汉字的首笔码、第二笔码和末笔码组 成三笔码,由笔画数和三笔码共同组成一组编码,因此本检字法称为为"直查三码检字法", 所编的码称为"直查三码"(三) 编码例举例l.对"码"字编码先数"码"的笔画数为8,加一圆点,然后依次取"码"字的首笔码"横1"、第二笔码 "撇3"和末笔码"横1"组成该字的"三笔码"。 即:"码"的直查三码是8.131 园点前的8是笔画数,园点后面的131是"三笔码" 绝大多数汉字可以本例进行编码。 例2.对"核"字编码先数"核"的笔画数为10,加一圆点,然后取"核"字的首笔码"木8"、第二笔码"点 4"和末笔码"点4"组成该字的"三笔码"。 艮P:"核"的直査三码是10.844 园点前的10是笔画数,园点后面的844是"三笔码"字体结构中含有"净^木? 口"这五个部首之一的汉字(此类汉字约占全部汉字数的五 分之一)可以本例进行编码,其特点是,将部首码作为第一码,此部首后面的笔码为第二码, 末笔码是第三码。如在本例中,"核"字由"木"和"亥"两个部件组成的合体字,"木"是 以部首码作为"核"字的首笔码"木8",第二码笔依次是"木"这个部首之后"亥"部件的 第一笔"点4"。同理,如果这五类部首码虽然没有在出现在字的首笔位置,如需要编码时也 要按部首码进行编码。把"净^木? 口"这5个部首设为部首码的依据是在汉字的结构中,"净*木'? 口" 这5个部首的造字能力特别强,例如在《新华字典》中收录的1万个汉字中,"#*木? 口" 这5个部首下的汉字数分别是401、 500、 460、 552、 470个,即这5个部首下的汉字数达2383 个,约占《新华字典》收录个汉字数的五分只一。这也是许多汉字检字法重码率高的主要原 因之一。把"净^木? 口"这5个部首设置为部首码,有效的解决了汉字编码中出现的重码 率高的难题。例3.对"人"字编码先数"人"的笔画数2,将"2"作为该字的笔数码,然后取"人"字的首笔码"撇3"、 第二笔码"捺4",因不够三笔,末笔码补以"0"组成该字的"三笔码"。 艮P:"人"的直三码=2.340只有一、二笔画的汉字(常用的一、二笔画汉字不足20个)可以用此方法。 (四)"直查三码检字法"的优点1. 编码规则少而简单,容易掌握,读者只需花几分钟时间就能看懂并熟练运用。2. 十种笔码简单明了,不需要特殊记忆,极大的简化人们在检索汉字的心理过程。3. 把复杂的汉字简单化,不考虑汉字是独体字还是合体字,也不考虑汉字的结构有多么复杂,只数笔画数,取字的第一、二笔码和末笔码进行编码,极大的减少了影响编码的因素。4. 査字方便、迅速,用该检字法编篡的字词典,根据编码可直接翻到该字所在的页码, 使检字步骤最少化,省略了大多数字典常用的"检字表",节省了检字时间,提高了检字效率。5. 重码率低,绝大多数的"直査三码"的编码所包含的汉字数在IO个以内,提高了检 字的速度。具体实施例方式1. 根据本专利技术可以进行中文字词典等汉字工具书的编篡。例如,用"直査三码"编篡汉语字典、汉语词典、汉语学习字典等工具书,字词典正文 中所收录汉字按照"直査三码"进行升序排列。2. 根据本专利技术可以编写现有中文字词典的辅助检索工具书。3. 根据本专利技术可以编写中文图书、文献、档案、资料等部门的索引工具书4. 根据本专利技术可用于移动电话、电子字典的中文编排输入,以及与汉字输入、检索有关 的其它领域。权利要求1.一种汉字直查三码检字法,其特征在于用“1、2、3、4、5”五个数字,分别代表“一(横)丨(竖)丿(撇)丶(点)乙(折)”五种基本笔形,这5个数字称为“笔形码”;用“6、7、8、9、0”等五个数字,分别代表“扌艹 木 氵口”这五个在汉字结构中出现频率相对较高的部首,这5个数字称为“部首码”;笔形码和部首码统称为“笔码”;“1、2、3、4、5、6、7、8、9、0”这10个数字就是其所对应的汉字笔码;汉字直查三码是由笔画数、圆点、三笔码组成;汉字直查三码可用于中文字词典等工具书的编篡以及与汉字输入、检索等相关领域。2. 根据权利要求1所述的"汉字直本文档来自技高网...

【技术保护点】
一种汉字直查三码检字法,其特征在于:用“1、2、3、4、5”五个数字,分别代表“一(横)丨(竖)丿(撇)丶(点)乙(折)”五种基本笔形,这5个数字称为“笔形码”;用“6、7、8、9、0”等五个数字,分别代表“扌艹 木 氵口”这五个在汉字结构中出现频率相对较高的部首,这5个数字称为“部首码”;笔形码和部首码统称为“笔码”;“1、2、3、4、5、6、7、8、9、0”这10个数字就是其所对应的汉字笔码;汉字直查三码是由笔画数、圆点、三笔码组成;汉字直查三码可用于中文字词典等工具书的编篡以及与汉字输入、检索等相关领域。

【技术特征摘要】

【专利技术属性】
技术研发人员:贾守治
申请(专利权)人:贾守治
类型:发明
国别省市:37[中国|山东]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利