当前位置: 首页 > 专利查询>郑远泾专利>正文

汉字二维检索法及其书刊、电子字(辞)典制造技术

技术编号:2878860 阅读:289 留言:0更新日期:2012-04-11 18:40
汉字二维检索法及其书刊、电子字(辞)典,属信息处理技术领域,用于书刊、电子字(辞)典汉字快速检索。特征在于:取汉字首部件代码和尾部件代码为汉字二维代码,实现见字识码;以两个不同的字母组合为字(辞)典正编中页标代码,字(辞)典正编页标可按首代码连续或尾代码连续排序,按汉字二维代码=页标代码原则编排每个页面中的汉字及字典内容,实现知码即知页标;以二维显性页标对应正编隐性页标,实现快速查字;在电子字典中设二维汉字库,用汉字二维代码或汉字拼音检索字、词;发明专利技术了汉字二维首代码横向排列和汉字二维首代码纵向排列两种汉字挂图;以数字序列对应字母序列的方法将字母码检索转换成数字码检索。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】
专利技术所属领域本专利技术属信息处理
已有的汉字检索技术状况及本专利技术特征已有的检索法概述汉字是语素文字,结构复杂,字数繁多,其排序比字母文字要困难得多,字、辞典检索困难是一直尚未解决的普遍问题。20世纪50年代以来,我国有关部门联合组织众多专家对传统检索法进行了整理、审核工作,于1964年4月提出″拼音检索法″、″部首检索法″、“四角号码检索法”和“笔形检索法”方案,推荐到全国试用。近几十年来出版的各类汉字字(辞)典绝大多数是基于上述检索方法编排的。它们都存在难以克服的缺点,如拼音检索法用于知道汉字的字音,而不知其字形的汉字检索。统计表明,汉字的音素只有407个,同时字音分布极不均匀(少的1~2个字,多的则可达数百个字),而且还有许多汉字具有同音不同字和同字不同音的特征,因而用此检索法难以准确快速地查到相应的汉字;部首检索法根据汉字的字形,对汉字进行检索。其缺点是部首多、归部难、程序繁杂、速度很慢;四角号码检索法难以学习,容易出错,分布很不均匀;笔形检索法数笔划麻烦,且易出错,速度缓慢,难以成为汉字检索的主流方法。现在,按音序排列的汉字字(辞)典的结构由“汉字拼音索引”、“部首目录”、“检字表”和“正编”构成。其中汉字拼音音节索引以拼音字母排列顺序和四声规则排序,例字右边标有该字在字典正编中的页码,供由音检索用;部首目录一般有189~250部,部首按笔划数顺序排列,部首右边标有该部首在“检字表”中的页码;检字表将部首相同的汉字归为同类部首汉字,然后再按笔画数(或除去部首后剩余的笔画数)排序,每个汉字后面标有该字在字典正编中的页码;正编按汉字的拼音字母顺序和四声规则排序。根据字形排列的汉字字(辞)典,是按“确定部首”→“检字表”→“正编”的过程完成检索;现在的电子字(辞)典的汉字检索也是按上述步骤进行的。本专利技术概述①以每个汉字的首、尾部件确定其二维代码和所在页码;②由于本专利技术采用的汉字部件只有100种156个,与传统的汉字字(辞)典相比,部件减少了50%。更重要的是,本专利技术所采用的汉字部件均系小学汉字识字教学阶段必教必学的基本笔划或部首,没有生僻部件。每个部件都有其传统俗成的名称,为广大用户所熟悉。因此,用户很容易找出每一个汉字的首、尾部件,从而确定其二维代码,无须繁琐的检索步骤,一次就能准确地翻到所查汉字的所在页面;③按《现代汉语通用字笔顺规范》确定汉字的首、尾部件,使确定首、尾部件有规可循。而在传统的汉字字(辞)典中,是用“构字法”来确定所有部件的,但这种方法使很多汉字的部件难以确定。例如,“画、幽、豳”等汉字,一般用户很容易将“画”的部首确定为“一”部,然而在字(辞)典中部首却为“凵”部。按此类推,“豳、幽”字的部首也应是“凵”部,可是在字(辞)典中部首却是“豕”和“幺”部。“戋、我、成”等字的部首为“戈”部,“囱”的部首为“口”部等,都使用户难以理解。与传统的检索法相比,二维检索法具有①准确“见字识码”,易于准确地确定汉字的二维代码;②简单“知码即知页标”,无须繁琐的检索步骤;③快捷几秒种即可翻到所查汉字所在页面。如“我、身、为、酉、万、专、丐、也”等汉字,根据本专利技术的部件代码表及首、尾部件的选取原则,这类汉字的首部件为其首笔划,尾部件为其末笔划,从而上述汉字的二维代码分别为“pd、pp、dd、hh、hp、hd、hf、ff”,因此,其页标亦分别为“pd、pp、dd、hh、hp、hd、hf、ff”是不难理解的。又如“如、嫡、告、姑、牯、牿、始、犒、牾、嬉”的首代码为“n”,尾代码为“k”,二维代码均为“nk”,它们的页标亦为“nk”。二维检字法汉字字(辞)典的技术要点汉字字(辞)典的结构本专利技术汉字字(辞)典由《汉字部件及其代码表》、《汉字二维检索表》、《(字(辞)典正编)汉字拼音检索表》三部分组成。其中《汉字部件及其代码表》给出本专利技术采用的100种156个部件,部件名称,部件代码;《汉字二维检索表》(字典正编)共有676个主页(个别有附页),以两个字母表示页标代码,每页内汉字的二维代码与页标代码相同。本表是汉字字(辞)典的正编,标有每个汉字的读音、字义解释、常用词组等内容;《汉字拼音检索表》所有汉字按其拼音字母顺序排列,在每个汉字的后面标有其在正编中的页标代码。本表主要供由音检索用。汉字部件及其代码以100种156个小学识字阶段必教必学的基本笔划和部首为检索用部件。以部件名称第一个汉字的声母为该部件的代码。例如,部件“氵”,名称为“三点水”,第一个字为“三”,三的声母为“s”,因此,“氵”的代码为“s”。同理“一、丿、宀、艹、阝、廴、辶、讠、贝、寸、人、口、女、马、土”的代码分别为“h、p、b、c、e、j、z、y、b、c、r、k、n、m、t”。本专利技术规定①“卩(单耳旁)、阝(双耳旁)、亅(竖钩)、亻(单人旁)、彳(双人旁)”5个部件用其名称第二个汉字拼音首字母为代码,它们的代码分别为“e、e、g、r、r”。②5个部件的代码作特殊规定木(ホ)→a;火→q;禾→z;山→e;凵→e。③汉字声母“zh、ch、sh、yu”,分别以“o、v、i、u”为代码。为使汉字的检索在字母键盘和数字键盘上都能自如地操作,本专利技术用01~26个数字组合,将字母键转换成数字键,它们的对应关系如下A B C D E F G H I J K L M N O P Q R S T U V W X Y Z01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26因此,本专利技术的汉字部件、部件名称及其代码为汉字部件及其代码表 汉字的二维代码①按《现代汉语通用字笔顺规范》取一个汉字的首部件,其部件代码为该汉字的首代码,汉字的首代码亦为其所在页面的页标首代码;②按《现代汉语通用字笔顺规范》取一个汉字的尾部件,其部件代码为该汉字的尾代码,汉字的尾代码亦为其所在页面的页标尾代码;③以每个汉字的首代码和尾代码的字母组合为该汉字的“二维代码”,汉字的二维代码即为该汉字所在页面的页标代码。根据上述三条原则,每个汉字的首、尾部件、首、尾代码、二维代码及其页标代码很容易确定。如下列汉字首、尾部件及其首、尾代码、二维代码和页标代码字首部件/首代码 尾部件/尾代码 二维代码 页标代码 字首部件/首代码 尾部件/尾代码 二维代码 页标代码妈女→n 马→m nm nm舅丿→p 丿→p pp pp互一→h 一→h hh hh赢丶→d 丶→d dd dd巾丨→i 丨→i ii ii龙一→h 丶→d hd hd家宀→b →n bn bn这文→w 辶→z wz wz威厂→v 丶→d vd vd钱钅→j 丶→d jd jd婆氵→s 女→n sn sn温氵→s 皿→m sm sm画一→h 凵→e he he根木→a 艮→g ag ag鞠廿→n 米→m nm nm幽丨→i 凵→e ie* ie格木→a 口→k ak ak成厂→v 丶→d vd**vd注*按《现代汉语通用字笔顺规范》规定,“幽”的书写顺序为“丨、幺、幺本文档来自技高网...

【技术保护点】
本专利技术:汉字二维检索法及其书刊、电子字(辞)典,属信息处理技术领域,其特征在于:以汉字的二维代码表征汉字:对一个汉字取其首、尾两个部件,其字母代码或数字代码为汉字首代码和尾代码,由汉字的首代码、尾代码构成汉字的二维代码,其中:1 )汉字部件及其代码:以100种小学识字阶段必教必学的基本笔划和部首为检索用部件,以部件名称第一个汉字的声母为该部件的代码,例如,部件“氵”名称为“三点水”,第一个字为“三”,三的声母为“s”,因此,“氵”的代码为“s”,同理“一、丿、宀 、艹、阝、廴、辶、讠、贝、寸、人、口、女、马、土”的代码分别为“h、p、b、c、e、j、z、y、b、c、r、k、n、m、t”,但规定:①“卩(单耳旁)、阝(双耳旁)、*(竖钩)、亻(单人旁)、彳(双人旁)”5个部件用其名称第二个汉字拼音 首字母为代码,它们的代码分别为“e、e、g、r、r”;②5个部件的代码作特殊规定,它们是:木(ホ)→a;火→q;禾→z;山→e;凵→e;③汉字声母“zh、ch、sh、yu”,分别以“o、v、i、u”为代码;2)为使汉字的检索 在字母键盘和数字键盘上都能自如进行,用01~26个数字组合,将字母键转换成数字键,它们的对应关系为:A B C D E F G H I J K L M N O P Q R S T U V W X Y Z01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26因此,本专利技术的汉字部件及部件名称及其代码为:二维汉字检索法汉字部件及其代码表***3)汉字的二维代码 ①按《现代汉语通用字笔顺规范》取一个汉字的首部件,其部件代码为该汉字的首代码,汉字的首代码亦为其所在页面的页标首代码;②按《现代汉语通用字笔顺规范》取一个汉字的尾部件,其部件代码为该汉字的尾代码,汉字的尾代码亦为其所在页面的页标尾代 码;③以每个汉字的首代码和尾代码的字母组合为该汉字的“二维代码”;4)汉字的二维代码即为该汉字所在页面的页标代码根据上述三条原则,每个汉字的首、尾部件,首、尾代码,二维代码及其页标代码很容易确定,如:下列汉字首、尾部件及其首 、尾代码,二维代码和页标代码为:字首部件/首代码 尾部件/尾代码 二维代码 页标代码 字首部件/首代码 尾部件/尾代码 二维代...

【技术特征摘要】

【专利技术属性】
技术研发人员:郑远泾徐建伟王兰芝虞志球刘文敏
申请(专利权)人:郑远泾虞志球徐建伟刘文敏王兰芝
类型:发明
国别省市:41[中国|河南]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1