汉字数据库首笔组合编码法制造技术

技术编号:2892016 阅读:266 留言:0更新日期:2012-04-11 18:40
汉字数据库首笔组合编码法属于计算机汉字信息输入领域。它是给予汉字偏旁(部首)一相应代码,其要点是对数据库中汉字信息的关键字进行编码,该编码法规则如下:根据专业名词、词汇汉字偏旁(部首)出现的频率,从高到低依次排序,分别赋予相应数字代码;使用频率低的偏旁(部首)可与频率高的用同一代码;起始码=INT(最大的代码/10)+1。它有见名释码、重码率极低,易掌握的优点,本法尤适用于医药等行业。(*该技术在2013年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术是一种汉字数据库首笔组合编码法,属于计算机汉字信息输入领域。随着科学的发展和计算机的性能/价格比升值,微机的应用迅速普及,汉字数据库的编码成为当前迫切需要解决的难题之一。在医疗卫生部门目前所用的数据编码仅起着贷号的作用,微机操作人员很难记忆,手中离不开编码本,怠机现象严重,限制了工作效率。本专利技术针对上述问题,设计一种只在微机小字盘区数字键操作的汉字首笔组合的编码法,它将数据库中的汉字信息直按转化为2-8位数的纯数字码。本专利技术是这样实现的一种汉字数据库首笔组合编码法,是给予汉字的偏旁(部首)一相应代码,其技术要点是利用其代码对数据库中汉字信息的关键进行编码,每一编码即相应一条汉字信息,该编码法遵循以下几个规则(1)根据专业名词、词汇的使用情况,统计出汉字偏旁(部门)出现的频率,按其频率从高到低依次排序,然后分别赋予相应数字代码;(2)使用频率低的偏旁(部首),可与使用频率高的使用同一代码;(3)起始码是由最大的代码缩小10倍之后,其整数部分加1,即a=INT(Max/10)+1其中a-起始码,INT-取整函数,Max-最大的代码。以下对其它技术特点进行展开说明规则(3)是一个避免重码的重要的规则,除此之外还有两点降低重码率的规则(1)对使用频率高,且易造成重码的偏旁(部首)代码,可将该偏旁(部首)用标记框起来,在编码时,取该偏旁(部首)之后的第二笔结构的代码。如“钅”的代码是17,在编氯化钾、氯化钠、氯化镁、氯化钙时,其编码分别是51916、51923、5194、51925,其中带下划线标记部分为上列名词中第三个汉字的第二笔结构的代码。(2)当同一药物有多种剂型时,除片剂省略剂型代码外,其他剂型在其编码不足8位数时,可补加剂型码加以区别。剂型代码如下眼膏0,胶囊1,注射剂2,散剂,粉剂3,溶液剂4,霜剂、膏、糊5,气雾剂、栓剂6,贴剂、膜剂7,耳、鼻用滴剂8,眼药水9。根据规则,本法在西药药品数据库编码中使用的汉字偏旁(部首)与代码之间的对应关系如下所示代码 代表字母 偏旁(部首) 代码 代表字母偏旁(部首)3 a 一王主 17 O 钅(金)勹夕 4 b 二冫丷雨十 18 P 扌(手)白斤5 c 丿竹夂 19 q 人亻八癶 6 d 木艹弋 20 r 乙(习)乛7 e 禾西(酉)忄心 21 s 厶 又8 f 氵水 小() 22 t 子阝耳疒9 g 宀冖 彳 23 u 虫 (己已巳)10 h 三石古 24 v 女彐 臼11 i 幺七弓七 25 w 丨 卜 刂12 j 亠讠广 26 x 山由 几13 k 匚( )丁工厂 27 y 灬米14 l 月爫(爪) 28 z 火车力儿丶15 m 口土士干川 29 乂 (乃)16 n 囗日曰田四目 30 马本法主要优点(1)操作速度快,主要是纯数字码,且直接由汉字结构转换,不是通过其他途径间接转换,其二,是纯数字码只用小键盘区的数字键,单手操作,击键频率高。(2)准确、易掌握利用汉语拼音声母转换、或四角号码转换的所谓“见名释码”法,有些汉字的读音掌握不准、或有些汉字的角码莫棱两可使其准确率不高。本法,只要记熟其偏旁(部首)代码,准确率较高、且易掌握。(3)重码率低本法在实践应用中其重码率比汉语拼音声母转换法低10倍,比角码法低20多倍。(4)用途广泛,易于推广,适用于各行业的微机汉字数据库编码。权利要求1.一种汉字数据库首笔组合编码法,是给予汉字的偏旁(部首)一相应代码,其特征在于利用其代码对数据库中汉字信息的关键字进行编码,每一编码即对应一条汉字信息,该编码法遵循以下几个规则(1)根据专业名词、词汇的使用情况,统计出汉字偏旁(部首)出现的频率,按其频率从高到低依次排序,然后分别赋予相应数字代码;(2)使用频率低的偏旁(部首),可与使用频率高的使用同一代码;(3)起始码是由最大的代码缩小10倍之后,其整数部分加1,即起始码=INT(最大的代码/10)+1。2.按照权利要求1所述的编码法,其特征在于它的降低重码率的规则为(1)对使用频率高,且易造成重码的偏旁(部首)代码,可将该偏旁(部首)用标记框起来,在编码时,取该偏旁(部首)之后的第二笔结构的代码。(2)当同一药物有多种剂型时,除片剂省略剂型代码外,其他剂型在其编码不足8位数时,可补加剂型码加以区别。3.按照权利要求2所述的编码法,其特征在于剂型代码为眼膏0,胶囊1,注射剂2,散剂、粉剂3,溶液剂4,霜剂、膏、糊5,气雾剂、栓剂6,贴剂、膜剂7,耳、鼻用滴剂8,眼药水9。4.按照权利要求1所述的编码法,其特征在于汉字偏旁(部首)与代码之间的对应关系为代码 代表字母 偏旁(部首) 代码 代表字母偏旁(部首)3 a 一王主 17 O 钅(金)勹夕 4 b 二冫丷雨十 18 P 扌(手)白斤5 c 丿竹夂 19 q 人亻八癶 6 d 木艹弋 20 r 乙(习)乛7 e 禾西(酉)忄心 21 s 厶 又8 f 氵水 小() 22 t 子阝耳疒9 g 宀冖 彳 23 u 虫 (己已巳)10 h 三石古 24 v 女彐 臼11 i 幺七弓七 25 w 丨 卜 刂12 j 亠讠广 26 x 山由 几13 k 匚( )丁工厂 27 y 灬米14 l 月爫(爪) 28 z 火车力儿丶15 m 口土士干川 29 乂 (乃)16 n 囗日曰田四目 30 马全文摘要汉字数据库首笔组合编码法属于计算机汉字信息输入领域。它是给予汉字偏旁(部首)一相应代码,其要点是对数据库中汉字信息的关键字进行编码,该编码法规则如下根据专业名词、词汇汉字偏旁(部首)出现的频率,从高到低依次排序,分别赋予相应数字代码;使用频率低的偏旁(部首)可与频率高的用同一代码;起始码=INT(最大的代码/10)+1。它有见名释码、重码率极低,易掌握的优点,本法尤适用于医药等行业。文档编号G06F3/023GK1102262SQ93115190公开日1995年5月3日 申请日期1993年11月2日 优先权日1993年11月2日专利技术者于佳臣, 刘丽娟, 魏爱英, 周爱华, 苏德民 申请人:山东省立医院本文档来自技高网...

【技术保护点】
一种汉字数据库首笔组合编码法,是给予汉字的偏旁(部首)一相应代码,其特征在于利用其代码对数据库中汉字信息的关键字进行编码,每一编码即对应一条汉字信息,该编码法遵循以下几个规则:(1)根据专业名词、词汇的使用情况,统计出汉字偏旁(部首)出 现的频率,按其频率从高到低依次排序,然后分别赋予相应数字代码;(2)使用频率低的偏旁(部首),可与使用频率高的使用同一代码;(3)起始码是由最大的代码缩小10倍之后,其整数部分加1,即起始码=INT(最大的代码/10)+1。

【技术特征摘要】

【专利技术属性】
技术研发人员:于佳臣刘丽娟魏爱英周爱华苏德民
申请(专利权)人:山东省立医院
类型:发明
国别省市:37[中国|山东]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1