当前位置: 首页 > 专利查询>萧学夫专利>正文

反切码计算机汉字输入法制造技术

技术编号:2884639 阅读:618 留言:0更新日期:2012-04-11 18:40
本发明专利技术是一种顺应汉字的形与音拆字取码的汉字编码法,包括:顺形拆分;顺音取码;字、词编码长度不大于四码,不足四码者,用二次分解法和反切法截取识别码补位以分离同码字。本发明专利技术用于计算机汉字键盘输入,简单易学;用于辞书检索,可以直接翻页,一步到位。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及汉字编码领域,特别是顺应汉字的形与音拆字取码的反切码汉字编码法。在计算机汉字输入方面,目前广泛应用的“五笔字形”,其在使用过程中有以下缺陷一是不按汉字构成拆分,不符合传统拆字习惯,有些拆分不符合笔顺规范。如“爸”,本应一分为二,拆为“父巴”,却一分为三,拆为“八乂巴”。“革”字本应一分为三拆为“廿口十”,却一分为二拆为“廿”加一个自造字根(革字的下部)。“犭”本是一传统部首,却人为地取前二笔为一自造字根。“回”本应先写“冂”,次写“口”,最后封笔写“一”,却拆为“口口”,在语文教学中,这叫倒笔。这种拆分既违背传统拆字习惯,也不利于语文教学和维护祖国语言文字的纯洁;二是使用键盘输入字根时,既不管字根本来的读音,又人为地为键盘字母另行定义,如将“王五一”三个不同音的字均赋予G键名,致使原本互不一致的大量字根(约193个)读名与键盘字母名称之间求同译转,增加了记忆的难度;三是编码规则较繁,不易掌握,难学易忘。另外有一类和英文键名挂钩的编码,将汉字部件的形态与英文字母形态求同,如“命”,取码为“AOP”。这种编码也与人们认字习惯相背离。最近面世的一码输入法,是一种顺应汉字的形与音拆字取码的汉字编码,如“香”读xiāng,拆为XHR(xiāng禾日),但一般人对不知读音的字(如“缂”)无法定码。本专利技术的目的之一是克服上述缺陷,为广泛的人群提供一种符合人们认字习惯、规则简单、操作方便、易学易记的汉字输入法。在辞书检索方面,现在的辞书,大多是按读音归类排序,按部首检索。其弊端是按读音归类,造成了多音字的肢解,更主要的是不知读音的字不能查找。按部首检索,查一个字得先判断属哪一部(有些字判断部属较难),再数部首笔画数找到部首,再数字的笔画数找到那个字,然后才是依据页码翻页。一码输入法的汉字编码,由于凭借汉字读音取码,不能用于辞书检索。本专利技术的目的之二是用本编码作辞书检索,直接翻页,一步到位,可以避免现在的辞书在翻页前通常的繁琐查找过程。本专利技术的目的是按下述技术方案实现的顺形拆分;顺音取码;字、词编码长度不大于四码,不足四码者,用二次分解法和反切法截取识别码补位以分离同码字。本专利技术和现有技术相比具有以下优点一是顺应汉字构成拆分汉字,符合传统拆字习惯,适应语文教学,有利于祖国语言文字的纯洁。二是按汉字部件读音取码,利用计算机键盘英文字母键位作汉语拼音字母键位,不人为地为键盘字母另行定义,使文字输入工作操作简易,避免了原本互不一致的大量字根读名与键盘字母名称之间求同译转,没有记忆的负担。三是用独创的二次分解法、反切法拆分取码,使规则简单,易学易记。四是本编码用于辞书检索,汉字查找可以直接翻页,一步到位。下面结合实施例对本专利技术作进一步说明本专利技术是一种顺应汉字的形与音拆分取码的汉字编码法,包括顺形拆分;顺音定码;字、词编码长度不大于四码,不足四码者,用二次分解法和反切法截取识别码补位以分离同码字。上述二次分解法是先作第一级分解,将两件字与三件字分解成部件,或将两字词、三字词词条分解成单字,取主码后,再作第二级分解,将部件或词条里的单字拆分以便截取识别码。两件字以偏旁部件或笔画部件为前件的两件字,先作第一级分解,将字分解成两个部件取主码后,再作第二级分解,拆分后件,用单件反切法,先取后件之首,然后反取后件之尾作识别码;以成字部件为前件的两件字,先作第一级分解,将汉字分解出两个部件取主码后,再作第二级分解,前后两件分别切分,用两件反切法,前件取首,后件取尾,截取识别码。三件字先作第一级分解,将字分解成三个部件取主码后,再作第二级分解,将第三件拆分,取第三件之末件作为识别码。两字词先将词条作第一级分解,按两字读音的音首第一个字母定主码,然后再作第二级分解,将两字切分,用两字前后反切法补上识别码。三字词先将词条作第一级分解,按三字读音的音首第一个字母定主码,然后再作第二级分解,将第三字切分取最后一件定为识别码。上述反切法是一种对两件字或两字词切分反取的方法。前件为偏旁部件或笔画部件的两件字,先作第一级分解,将字分解成两个部件取主码后,再作第二级分解,拆分后件,用单件反切法,先取后件之首,然后反取后件之尾作识别码;前件为成字部件的两件字,先作第一级分解,将字分解出两个部件取主码后,再作第二级分解,前后两件分别切分,用两件反切法,前件取首,后件取尾,截取识别码,两字词第一次按词条两个字的读音取主码后,再将两字分别作第二次拆分,然后用前字取首、后字取尾的两字反切法截取识别码。实施例一.顺形拆分1.按汉字构成拆分汉字由三种部件构成现成汉字;偏旁部首;基本笔画。本方案基本顺应汉字构成拆分。顶,形声字,从页丁声,本方案拆为。‘丁页’(两个成字部件)。信,会意字,从人从言。本方案拆为‘亻言’(一个偏旁部件,一个成字部件)。人,象形字,象侧面站立的人形,象人的手臂与腿,本方案拆为‘丿ㄟ’(两个笔画部件)。2.按汉字书写笔顺拆分。如“式”字,不拆为“弋工”二字,应按书写顺序拆为“一工 ”;“脊”字,起笔应按国家规定的笔顺规范先写“人”字的两边,拆为 人月”。“丑”,拆为“刀二”,不拆为 ”。3.随字取形部件取形以印刷体规范汉字为准。如“周”字,是“冂土口”,而不是“冂吉”。“或”字第五画是挑,不是横。“舍”,是“人干口”,而不是“人舌”。有的笔画在不同字里会发生不同变化,则根据不同变化随字取形。如“乂”(yi),在“父”字里“乂”拆为“丿ㄟ”,而在“风”字里则应取为“丿丶”。本编码视传统的变形体为相似形,并约定一些形体为相似形。如“看”字,“丿”起,起始件为“手”,应拆分为“手目”。“拜”字,应拆分为“手三十”。 是“卜”的相似形。歪尾 等同“羊”。 承袭辞书传统,视作“小”的同一部首。将“亲杀茶”等字的末件视作“木”;将“木”字的后三笔约定为“小”。以上详见附录二、三的有关相似形的说明。附录中未列又不属基本保持原貌的传统变形体者,均不作相似形处理。如“斤”字,最后一笔无钩,是“丿丿一丨”,不是“丿丿丁”。“邦”,应拆分为“三丿阝”,而不是“丰”和“阝”;“寿”字则是“三丿寸”,不是“丰寸”。“判”则拆为“半”和“刂”。4.取大不取小部件容量取大“三”,应拆分为“一二”两件,不拆分为“一一一”三件。“鸿”,拆为“江鸟”;不拆作“氵工鸟”三个部件。“典”,拆为“冂共”;不拆作‘冂廿一八’四件。部件级别取大汉字由三种部件构成现成汉字;偏旁部首;基本笔画。依次排比级别,成字部件最大,偏旁部件次之,再次是笔画部件。夂,拆取为“丿又”,不取为“クㄟ”。5.中分取整如“巫”,拆为“一丨从一”;“坐”,拆为“从土”;“乖”,拆为“千北”“小”字的两边,视作“八”字被中分,“小”拆作 八”。取整时应注意笔形结构,如“乘”字腰中的两边合起来是一个“北”字,而收尾的紧密靠连的“丿ㄟ”两笔不同于两笔离散而有间隔的“八”,故“乘”字应拆作“乖丿ㄟ”,不是“乖八”。6.上下结构靠上不靠下“克”字中的“口”应上靠,拆为“古儿”,不拆成“十兄”;“天”字,拆为“二人”,不拆为“一大”。7.左右结构靠后不靠前“拆”,拆为“扌斥”,不拆为“折丶”;“树”拆为“木对”,不拆为“权寸”。“湖”拆为“氵胡”,不拆为“沽、月”。“彬”拆为“木、杉”,不拆为“林、本文档来自技高网...

【技术保护点】
一种顺应汉字的形与音拆分取码的汉字编码法,其特征是顺形拆分;顺音定码;字、词编码长度不大于四码,不足四码者,用二次分解法和反切法截取识别码补位以分离同码字。

【技术特征摘要】

【专利技术属性】
技术研发人员:萧学夫萧辉萧山萧丹
申请(专利权)人:萧学夫
类型:发明
国别省市:42[中国|湖北]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1