当前位置: 首页 > 专利查询>闫卫专利>正文

汉字简易笔划检索方法技术

技术编号:4096395 阅读:701 留言:0更新日期:2012-04-11 18:40
汉字简易笔划检索方法适用于以汉字图形特征为线索进行汉字检索的领域,包括汉语辞书的汉字索引、电脑网络和移动通讯设备等的汉字输入。其主要特征是彻底脱离了以汉字传统的偏旁部首和复杂的笔画为线索进行分类检索的基本思路,无需背记汉字字根和代码以及码键对应关系,仅使用6种简易笔划(横、竖、撇、捺、点、弯)及其简单的规则,通过对输入的汉字图形特征的任意顺序和组合进行筛选,逐步求精检索汉字。其最大的特点就是简便易行、中外皆宜、人人能用。

【技术实现步骤摘要】

本专利技术涉及一种汉字检索方法,尤其是涉及一种以汉字图形特征为线索的汉字检 索方法。
技术介绍
汉字属于语言学的范畴,每个汉字都包含三方面语言学信息,S卩形、音、意。汉字 检索方法是人们为查找汉字而使用的方法,已专利技术的汉字检索方法很多,大致可以分为三 类(1)以汉字图形信息为线索的检索方法和(2)以汉字发音信息为线索的检索方法,还 有(3)以汉字图形和发音信息为线索的检索方法。汉字检索方法的应用领域目前主要有汉 语辞书和电脑汉字处理,用户以中国人为主,外国人也不少,并且正在不断增加。目前在汉 字检索方法上所面临的挑战主要来自于应用领域,例如易学好用、适合快速输入的汉字编 码,以及一种既可以用作汉语辞书的汉字索引又能够用于电脑的汉字检索方法。目前尚无 一种全能的汉字检索方法能够完美地解决所有应用领域中的所有问题。因此,根据具体应 用领域的特定条件和用户的特殊需求开发一个适用性和使用性俱佳,并且有进一步发展可 行性的汉字检索方法也不失为一个有效的策略。近年来,在来全球性的“汉语热”中学习汉语的外国人越来越多,遇到生字查辞 典是最基本的和必要的学习手段之一。然而,对于大多数学习汉语的外国人来说,在查汉 语_外语辞典时如何确定汉字的偏旁部首和笔画是一个难题,因为他们很难掌握按照汉字 的造字属性所形成的大约两百个偏旁部首,以及根据毛笔书写汉字所习惯俗成的大约三十 种笔画,而当今广泛流行于世的汉语-外语辞典却普遍地使用偏旁部首和笔画作为汉字检 索的第一级索引。其实不仅是外国人对此为难,即便是地道的中国人对于偏旁部首和笔画 也未必都能轻而易举,例如对于“前”、“电”等常用汉字应该查汉语辞典中哪个偏旁部首? 汉字究竟有多少个偏旁部首?有多少种笔画?许多这类基本问题多数中国人一时也讲不 清,那么又如何能有效地使用偏旁部首和笔画去检索汉字呢?而作为汉语辞典(包括电子 辞书)能否提供一种简易的方法,使中外用户都可以容易地检索汉字呢?本专利技术之目的就是创造一个彻底脱离汉字偏旁部首和复杂笔画、使中国人和外国 人都简便易行的、并且可以既适用于印刷品的静态索引又适用于电脑的动态搜索的汉字检 索方法。
技术实现思路
本专利技术包括以下四个内容(1)六种简易笔划、(2)三条笔划规则、(3)九个图形特 征、(4)两项应用成果。六种简易笔划用“横”、“竖”、“撇”、“捺”、“点”和“弯”这六种简易笔划描述汉字的所有笔画。前五种笔划是汉字固有的单一笔画,本专利技术在此基础上分别将它们的代表性延伸到其它笔画 中相近的部分;并且定义了一个新笔划——“弯”,用来代表前五种笔划不能合理表示的笔画部分。这样,用这组六种简易笔划可以完全替代汉字所有的传统笔画,使汉字笔画中有折 点的复合笔画分解成多个无折点的简易笔划。具体地归纳说明如下 (表 1)简而言之就是去“折”,把复杂多变的笔画简化成简便易行的笔划。此举大大地降 低了汉字笔划的复杂性,使之可以容易地为中外人士所掌握和使用,同时还可以有效地避 免由于用户在汉字笔画知识水平上的差异而导致汉字笔画计算上可能发生的错误。三条笔划规则以下三条规则精辟地阐述了在使用本专利技术进行汉字检索中的操作规范和原则,并 且以每条规则一句话、每句六个字,总共用十八个字来诠释本专利技术的精髓,同时也容易为人 们所掌握和使用。 遇折点算一笔。为了容易地计算笔划数,本专利技术把一个有折点的复合笔画分解成 多个无折点的简易笔划来统计其笔划数,此规则其实是对六种简易笔划的高度概括和实际 操作指南。典型实例如下汉字乙口队老笔画 134新笔划 4 4 7字汉么与仓老笔画 334新笔划 4 6 84红68这79·先左边后上边。为了检索更有效,本专利技术取汉字最左边的笔划为第一笔,如果该 字笔划有两笔或两笔以上再取最上边的笔划为第二笔,用以对相同总笔划数的不同汉字进 行分组。典型实例如下 汉字让 止 江 川第横横横点撇-笔第: 横占IJS 、占IJS 、笔第 横 撇IJS 、横 横-笔只计一次。为了取得尽可能多的不同图形特征和避免同一笔划被重复统计, 本专利技术对于那些最左边和最上边为同一笔划的汉字采取这条规则,同时根据上述两条规则 选取下一个合格的笔划作为最上笔划。典型实例如下字汉口和怕红又第竖横点撇撇-笔笔汉字 卜乙 么第-IJS 、横 撇-笔第点撇撇笔字汉下气人第横撇撇-笔第:IM 、横笔九个图形特征所谓九个图形特征是指构成汉字图形的笔划信息,它们是总笔划数、最左笔划、 最上笔划、横、竖、弯、点、撇、捺。其中,总笔划数并非独立数据,其值等于其它六个笔划数之 和(即横+竖+弯+点+撇+捺)。之所以选取这九个信息作为汉字的图形特征是因为 它们从根本上体现了每个汉字笔划构成的组合特点;不仅如此,把根据六种简易笔划和三 条笔划规则所述产生出来的数据用作汉字编码(见图1)。以这种松散的数据结构作为汉字 编码形式尽管看上去不像传统的汉字编码那样紧凑,然而其“编码”(即笔划数)均来自 汉字本身的自然属性,没有人为定义的转换代码,根本就不需要死记硬背;又由于是电脑管 理,用户使用电脑的图形用户界面(即⑶I,完全不同于DOS命令界面)进行操作,因此根 本无须关心这些图形特征数据的存在及其编码形式。而且在动态检索的情况下还可以任意 选取,这样不仅使初级用户容易掌握和使用,也给高级用户更大的余地选取汉字图形特征 最佳的顺序和组合,这在一定程度上可以提高汉字输入的速度,同时也为进一步开发以便 更好地适应不同的需求预留了发展空间。两项应用成果应用本专利技术,使用电脑设备成就了以程序软件为载体的(动态)汉字简易笔划检 索系统,其实践适用于在电脑、网络和移动通讯设备上再现本专利技术的汉字检索功能。图2展 示了以汉字“专利”的“专”为实例的检索情况(见图2)。应用本专利技术,选用汉字图形特征中总笔划数、最左笔划和最上笔划这一特定的顺 序和组合,成就了以印刷品为载体的(静态)汉字简易笔划索引;同时将现行汉语辞典中汉 字检索的三级索引(即偏旁部首一汉字一解释)简化为两级索引(即汉字一解释),使 之更易于掌握和使用,其实践适用于汉语辞典和汉语-外语辞典的汉字索引。图3展示了 以汉字“专利”的“专”为实例的索引情况(见图3)。附图说明图1 汉字笔划图形特征数据示意2 汉字简易笔划检索系统示范图3 汉字简易笔划索引示范详见文件《说明书附图》具体实施例方式本专利技术检索汉字的一般步骤如下 (表 2)总之,本专利技术最突出的特点就是“零起点,容易学、方便用”。本文档来自技高网
...

【技术保护点】
一种汉字检索方法,其特征在于:使用三条笔划规则和六种简易笔划,并且通过对汉字九个图形特征的任意顺序和组合进行筛选,逐步求精检索汉字的同类最小集合。(请注意:在这里“笔划”是指本专利技术所定义的汉字简易笔划;而“笔画”是指汉字传统的笔画;后同。)。

【技术特征摘要】
一种汉字检索方法,其特征在于使用三条笔划规则和六种简易笔划,并且通过对汉字九个图形特征的任意顺序和组合进行筛选,逐步求精检索汉字的同类最小集合。(请注意在这里“笔划”是指本发明所定义的汉字简易笔划;而“笔画”是指汉字传统的笔画;后同。)2.如权利要求1所述的方法,其特征在于所述三条笔划规则是 遇折点算一笔把一个传统的有折点的复合笔画分解成多个无折点的简易笔划来统 计笔划数; 先左边后上边取汉字的最左笔划为第一笔,如果该字笔划有两笔或两笔以上再取其 最上笔划为第二笔; 一笔只计一次对那些最左和最上为同一笔划的汉字采取只计一次的规则,同时根据 上述两条规则选取下一个合格的笔划作为最上笔划。3.如权利要求1所述的方法,其特征在于所述六种简易笔划有“横”、“竖”、“弯”、 “点”、“撇”和“捺”,它们分别采纳了汉字传统笔画中相应的单一笔画(“弯”除外),并且将 复合笔画分解成为多个简易笔划加以归纳。 笔划“横”代表汉字单一笔画“横”和复合笔画中“横”的部分; 笔划“竖”代表汉字单一笔画“竖”和复合笔画中“竖”的部分; 笔划“弯”代表汉字复合笔画“弯钩”和“横撇弯钩”中“弯”的部分; 笔划“点”代表汉字单一笔画“点”和复合笔画中“钩”的部分,以及复合笔画“撇点” 中“点”的部分; 笔划“撇”代表汉字单一笔画“撇”和...

【专利技术属性】
技术研发人员:闫卫张海地
申请(专利权)人:闫卫张海地
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1