当前位置: 首页 > 专利查询>单岩山专利>正文

模糊码输入计算机的方法技术

技术编号:2878452 阅读:173 留言:0更新日期:2012-04-11 18:40
本发明专利技术是汉字模糊码输入计算机的方法,编码第一个代码称音母,是拼音第一个符号,输入时击一键就有十个高频字随机出现供选择;音母之后依次是字首、次首和字尾三个位置部件代码排序;部件只用了77个,有笔画、部首和本发明专利技术按汉字笔画关系形成的特征信息定义的模糊部件;用符号“V”替代音母,对认识和不认识的字就能同轨输入。本输入方法编码规则只有一条,简单好学,重码少,输入速度快,规范、科学,适宜普及推广。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】
我国著名学者,中国中文信息学会理事长钱伟长教授指出,“人们通常在记忆中所保持的字形是一种模糊映象,多属字的外围轮廓部份”(引之潘德孚编著《汉字输入一日通》)。钱教授的这一真知灼见,客观的揭示了人们对汉字的认知心理,然而,目前的汉字编码,大多都是对汉字“全拆全拼”,其结果是部件数量多,有的100多,有的300多,编码规则也复杂,难学难记,不易普及推广。本专利技术的目的是提供一种汉字,这种模糊码对字音、部件、字形,都采用汉字的模糊信息,编码结构定位在音形码,对认识和不认识的字都能同轨输入,方法简单好学,重码少,输入速度快,规范、科学,适宜普及推广。本专利技术的技术方案是依据人们对汉字的认识心理,用26个拉丁字母作汉字字音、部件、字形有关模糊信息的代码;对字音,只用汉语拼音的第一个符号;对部件,在采用了笔画和少量的部首同时,按汉字笔画关系形成的特征信息定义了模糊部件;对字形,只用字首、次首(第二个部件)和字尾三个位置的部件参与编码;编码时用汉语拼音第一个符号做编码的第一个代码,后面依次加上字首、次首和字尾三个位置部件的代码就是模糊码;用一个符号替代编码的第一个代码,对认识和不认识的字就能同轨输入。下面对本专利技术的技术方案作详细阐述一、笔画模糊码对汉字笔画分类遵照《现代汉语通用字笔顺规范》(以下简称《笔顺规范》),见表1。表1 说明在运笔过程中,笔画方向突然变化都归折笔,如 、 二、部件(一)笔画部件模糊码把《笔顺规范》中规定的五种笔画也称为笔画部件,见表1。(二)定形部件模糊码把国家有关规范规定的一些检字部首、部件,都统称为定形部件,共56个“ 贝、宀、髟、疒、艹( )、廾、寸、扌( 扌)、 攵、夂、氵、广、灬、虫、金、钅、车、见、巾、鹿、力、刂、木( )、目、麻、门、皿、鸟(乌、 )、欠、日(曰)、冖、纟、幺、示、土(士)、田、辶(之)、山、亠、 石、大、王、瓦、小、心、月( )、雨( )、讠、言、页、又、竹()、佳”说明括号中的部件与前面的部件等同,规定的定形部件不准用其它部件替代,如 ≠小、丷≠八、 ≠月、文≠攵(三)模糊部件汉字由部件构成,部件由笔画构成,笔画互相间的“关系”不一样,形成的部件也不一样。如“工”和“土”两个字,虽然笔画数量、笔顺都完全相同,但是形成的字不一样,这是因为两个字的笔画关系不一样,“土”字中的笔画关系有“交叉”,有“相触”,而“工”字中的笔画关系只有“相触”。汉字的部件能分为五、六百种,但是,汉字的笔画关系用七大类就能概括。a)分触类部件的笔画关系只有分离和相触,如江、工、心;b)衔接类部件的笔画关系只有衔接,如阝、厂、己、口、凹;c)分接类部件的笔画关系只有分触和衔接,如山、石、月、日;d)交叉类部件的笔画关系只有交叉,如力、丰、车、井;e)分叉类部件笔画关系只有分触和交义,如禾、米、半;f)叉接类部件笔画关系只有交叉和衔接,如尹、聿、吏、由;g)完全类部件笔画关系有分触,也有交叉和衔接,如鬼、鱼、舟。以上每大类还可以细化,如“丰”字,可称为“≥2叉”;“凹、口”字,可称为“≥3接”;“厂、弓、”字,可称为“≤2接”。综上所述,模糊部件是利用汉字笔画关系形成的特征信息,对汉字部件进行分类,这种部件和我们通常用的部件不一样,通常用的部件是“定性、定量、定形”,而模糊部件“定性而不定形”。模糊部件分为三种,一种是笔顺部件,一种是独体部件,一种是并列部件。1)笔顺部件按笔顺排序由两画构成的分触类笔画关系,称为笔顺部件,共有4个a)撇点笔顺是先撇后点。如“是、亥、其”字,字尾都是笔顺部件“撇点”;“爱、采、番”字,字首都是笔顺部件“撇点”;b)撇折笔顺是先撇后折。如“争、夕、句、尔”字,字首都是笔顺部件“撇折”;“能、比”字,字尾都是笔顺部件“撇折”;c)折撇笔顺是先折后撇。如“召、盈”字,字首都是笔顺部件“折撇”;“ 方”字,字尾都是笔顺部件“折撇”;d)横折笔顺是先横后折。如“至、比”字,字首都是笔顺部件“横折”;“乞”字,字尾是笔顺部件“横折”;2)独体部件把“衔接类”、“交叉类”、“叉接类”笔画关系结构块整体视为一个部件,称为独体部件,共有5个a)≤2接只有一个或两个接点。如“厂、几、弓、己”;b)≥3接有三个或三个以上接点。如“口、凸、凹”;c)1叉只有一个叉点。如“十、九”;d)≥2叉有两个或两个以上叉点。如“女、也、丰、井”;e)叉接笔画关系的叉接点交织在一起。如“尹、中、曲、吏”。3)并列部件在汉字中,有些笔画关系形成的结构块互相并列,如“保、堡、葆”三个字中,“亻”和“呆”互相并列。并列部件是把并列结构块中的每一块整体,在特定条件下视为一个部件,但是,如果并列结构块是笔画、定形或独体部件,仍按笔画、定形或独体部件处理。a)如果全字只是由两个并列结构块构成,只准许用左面的结构块做并列部件,而且它右面的结构块必须由两个以上部件构成才行。如“保”字,“亻”是并列部件;“仲”字,“亻”就不是并列部件,因为它右而并列的“中”只是由一个独体部件构成;b)如果全字只是由三个并列结构块构成,只能取前两个结构块为并列部件,如“褓”字,只能取“衤”、“亻”为并列部件;“糊”字,“米”、“古”是并列部件,“月”是定形部件;c)如果全字是由三个以上结构块构成,其中有两个结构块并列,只要符合定义,就可视为是并列部件。如“葆、堡”字,“亻”、“呆”是并列部件,“艹”、“土”是定形部件。并列部件共有7个a)2分有两画分触类笔画关系构成。如“伴、冰、姿”字中的“亻”和“冫”;b)3分有三画分触类笔画关系构成。如“衍、忙、驼”字中的“彳、亍、忄、马”;c)4分有四画或四画以上分触类笔画关系构成。如“社、紫、貌”字中的“礻、止、豸”;d)分接由分接类笔画关系构成。如“路、够”字中的“足、句”;e)分叉由分叉类笔画关系构成。如“称、藉”字中的“禾、耒”;f)叉接由叉接类笔画关系构成(由一个衔接类和一个叉接类独体部件构成,或者由两个叉接独体部件构成)。如“鞍、糊”字中的“革、古”;g)完全由完全类笔画关系构成。如“魁、船、蓟、藉”字中的“鬼、舟、鱼、昔”。(四)部件界定、排序1)笔画部件、独体部件这两种部件和其它部件之间笔画关系只要是“分触”就可以界定,排序遵照《笔顺规范》。如“上”字,界定排序是“丨、一、一”;“重”字,界定排序是“丿、車、一”;“白”字,界定排序是“丿、曰”;“君”字,界定排序是“尹、口”2)定形部件笔顺遵照《笔顺规范》,先起笔的部件排序在前并取大。如“国”字,部件界定排序是“口、王、丶”;“主”字,部件界定排序是“亠、土”。3)笔顺部件笔顺部件按定义界定,排序遵照《笔顺规范》,但是,笔顺部件不准在定形部件上“拆借”笔画进行界定。如“系”字,不能在定形部件“幺”上借用“折”笔画界定出笔顺部件“撇折”,“系”字只能界定为“丿、幺、小”。4)并列部件笔顺遵照《笔顺规范》,并列部件在界定时,最明显的特征是它和相邻的部件相分离(有明显间隙),在两个结构块之间又没有其它笔画相隔离。如“尬、排、魁、趔、瀚、逖”这些字都是并列结构,结构块之间都相分离;“翟、祭、癸、脊、然、繁”这些字,上部都是并列结构,结构块之间都有明显间隙;“ ”字,上部就不是并列结构,因它和“冖”之间没有分本文档来自技高网...

【技术保护点】
一种汉字模糊码输入计算机的方法,其特征是用26个拉丁字母做代码;编码的第一个代码称音母,是汉语拼音第一个符号,输入时,击一键就有十个高频字随机出现;音母之后依次是字首、次首和字尾三个位置部件代码排序;部件有笔画、部首和本专利技术按汉字笔画关系形成的特征信息定义的模糊部件;用转换符号“V”替代音母,对认识和不认识的字就能同轨输入。

【技术特征摘要】

【专利技术属性】
技术研发人员:单岩山
申请(专利权)人:单岩山
类型:发明
国别省市:89[中国|沈阳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1