当前位置: 首页 > 专利查询>李梧杰专利>正文

段码中文输入法制造技术

技术编号:2849249 阅读:243 留言:0更新日期:2012-04-11 18:40
一种计算机汉字编码和重码字词处理方法。它以汉语拼音为“音”的基本依据,以国家《汉字笔顺规范》和《汉字部件规范》为“形”的基本依据,采取“音形结合”和分段编码的编码方法;以“先音后形”的编码方式适应人们的书写习惯;以兼容“纯形编码”的方式解决不懂读音的汉字输入问题;以“音托”和“形托”字根的方式解决字根难记问题;用明确的字根概念解决字根选用模糊问题;用对字根进行拆分的方法,解决“形码”中识别码难选的问题;用“音码”为主的词组输入方法;有效提高输入速度;创造一种默认上屏栏与选择上屏栏相分离的重码字词处理方法,有效缓解重码对中文录入造成的影响;用确保一级汉字上屏的方法,适应一部分有盲打需求的群体。

【技术实现步骤摘要】

本专利技术涉及一种计算机汉字编码和重码字词处理的方法。
技术介绍
目前流行的计算机汉字输入法以“五笔字型”为代表的“形码”输入方法和以“智能ABC”、“微软输入法”等为代表的“音码”输入方法,虽然都有各自的优点,但又各自都存在着难以避免的弊端。如“形码”输入方法虽然重码少,速度快,但其低重码率往往是通过缩小字库量,增加字根记忆难度,增加汉字拆分难度等方式获得的,故普遍存在着难掌握,易遗忘,很多非通用字无法输入等弊端;“音码”输入方法虽然简便易学(对熟悉普通话和汉语拼音的人而言),但存在着重码率高,输入速度慢,很多不懂读音的汉字难以输入等弊端,且这种输入方法用久还易造成乱用同音字和“执笔忘字”等毛病。最后,无论是“音码”输入方法还是“形码”输入方法,都不能全面体现汉字“音”、“形”、“义”的基本特征。
技术实现思路
本专利技术旨在创造一种取两种输入方法之长,避两种输入方法之短,能全面体现我们中华汉字“音”、“形”、“义”基本特征的计算机汉字输入法。(一)编码的基本模式段码中文输入法对中文输入编码采取“音形结合”和分段编码的方法,这种编码方法能使中文单字或词组的编码更加科学、简明。段码中文输入法编码的基本模式可用下面式子表示单字或词组的编码=汉字码段编码+字根码段编码+根首码段编码其中,单字或词组编码的标准码长均为4码,在实际编码时,可根据不同的情况对各码段进行取舍。(二)汉字码和字根码段码中文输入法取汉字或字根读音的声母作为该汉字或字根的汉字码或字根码,但是,当汉字或字根读音的声母为zh、ch、sh时,用字母V、U、I替代;当汉字或字根读音为零声母时,取其第一个拼音字母作为该汉字或字根的汉字码或字根码。如汉字“贝”(bèi)、“虫”(chóng)、“耳”(ěr)的汉字码分别为“B”、“U”、“E”。(三)汉字的笔画和基本笔形段码中文输入法中汉字的书写顺序以国家语言文字工作委员会,国家新闻出版署1997年4月发布的《现代汉语通用字笔顺规范》为依据;汉字基础部件以国家语言文字工作委员会1997年12月发布的《汉字部件规范》为依据。为便于描述和分析汉字的字形,凡本输入法所描述和分析的汉字,主要指国家语言文字工作委员会,国家新闻出版署1988年3月发布的《现代汉语通用字表》的7000个汉字;汉字字体为常规印刷宋体,对字体笔画的起笔、转角、收笔中属美术修饰而加粗、加长部分,本输入法一律予以忽略。段码中文输入法把汉字的组成分为基本笔形、字根、汉字三个层次。段码中文输入法对汉字笔画的定义是构成汉字字形的最小连笔单位称作笔画。汉字的笔画形态非常多,但如果只考虑笔画的运笔方向,不考虑笔画的长短或轻重,则汉字的笔画可以归纳为五种横(héng)、竖(shù)、撇(piě)、点(diǎn)、折(zhé),汉字的这五种笔画称为汉字的基本笔形,段码中文输入法将其分别记作“一”、“丨”、“ノ”、“丶”、“”,其编码符号及键位取这五个汉字的汉字码,分别为“H”、“I”、“P”、“D”、“V”。段码中文输入法对一些笔画的变形作如下规定 1、“提”归于基本笔形“横”。例如汉字“冷”的第2笔;汉字“地”的第3笔。2、“竖左钩”归于基本笔形“竖”。例如汉字“了”的第2笔;汉字“利”的最后一笔。3、“捺”归于基本笔形“点”。例如汉字“八”的第2笔;汉字“禾”的最后一笔。4、有些长度很短,笔画先轻后重,我们通常称为“斜点”和“竖点”的汉字笔画,这类笔画作为例外主要考虑笔画的长短或轻重。为易于区别,段码中文输入法把它们称作“短点笔画”。短点笔画归于基本笔形“点”。例如汉字“心”的第1笔(竖点)和第3、4笔(斜点)都是短点笔画,它们都归于基本笔形“点”。5、所有带转折、拐弯的笔画均归于基本笔形“折”(笔画“竖左钩”除外)。例如汉字“又”的第1笔;汉字“儿”的第2笔。汉字五种基本笔形的标记、读音、编码符号、键位、运笔方向及笔画的变形如下表所示 (四)两个笔画之间的相对位置关系1、笔画的构成一个笔画由它的笔首、笔身和笔尾3个部分构成,其中笔首和笔尾可统称为笔端。笔画的笔首(或笔尾)是指从笔画的起笔端点(或收笔端点)起沿运笔方向(或运笔相反方向)量得长度等于笔画直径的那一段笔画,其中笔画的直径是指笔画所在字体中或参与讨论研究的各笔画中最粗的那一段笔画的直径;笔画的笔身为该笔画除了两个笔端外余下的(或中间的)那一段笔画。特殊例外短点笔画只有笔身而没有笔端。2、连结两个笔画的两种基本形式当两个笔画的笔端与笔端、笔身与笔端或笔端与笔身相连结时,则称这种笔画连结形式为相接形式,其连结部位叫相接部。如汉字“厂”(笔端与笔端相连结)、汉字“人”(笔身与笔端相连结)和汉字“匕”(笔端与笔身相连结)的两个笔画都是以相接形式相连结,这三个汉字内的两个笔画的连结部位都叫两个笔画的相接部;当两个笔画的笔身与笔身相连结且每个笔画都有笔画的一部分分别落在另一个笔画的两侧时,则称这种笔画连结形式为相交形式,其连结部位叫相交部。如汉字“九”的两个笔画以相交形式相连结,这两个笔画的连结部位就叫两个笔画的相交部。3、两个笔画之间的相对位置关系(可简称为笔画关系)假定笔画A比笔画B的书写顺序在先,则这两个笔画之间的相对位置关系可分为(1)当笔画A与笔画B在笔首相接而其它部分互不连结时,则称这两个笔画为笔首单接关系,可用符号 表示。如汉字“厂”的两个笔画为 关系。(2)当笔画A与笔画B在笔尾相接而其它部分互不连结时,则称这两个笔画为笔尾单接关系,可用符号 表示。如汉字“口”的第二笔与第三笔为 关系。(3)当笔画A的笔尾与笔画B的笔首相接而其它部分互不连结时,则称笔画A与笔画B为尾首单接关系,可用符号 表示。如汉字“口”的第一笔与第三笔为 关系。(4)当笔画A的笔首与笔画B的笔身相接而其它部分互不连结时,则称笔画A与笔画B为首身单接关系,可用符号 表示。如汉字“女”的第二笔与第三笔为 关系,(5)当笔画A的笔身与笔画B的笔首相接而其它部分互不连结时,则称笔画A与笔画B为身首单接关系,可用符号 表示。如汉字“写”的第一笔与第二笔为 关系(注意因为短点笔画只有笔身而没有笔端,所以这两个笔画不能看成是 关系)。(6)当笔画A的笔尾与笔画B的笔身相接而其它部分互不连结时,则称笔画A与笔画B为尾身单接关系,可用符号 表示。如汉字“匕”的第一笔与第二笔为 关系。(7)当笔画A的笔身与笔画B的笔尾相接而其它部分互不连结时,则称笔画A与笔画B为身尾单接关系,可用符号 表示。如汉字“北”的第一笔与第二笔为 关系。(8)当笔画A的两个笔端与笔画B的两个笔端两两相接时,则称这两个笔画为笔端双接关系,可用符号 表示。如汉字“贯”的前二笔为 关系。(9)当笔画A与笔画B的笔身各有一个相接部时,则称这两个笔画为笔身双接关系,可用符号 表示。如汉字“互”的第二笔与第三笔为 关系。(10)当笔画A与笔画B相交且仅有一个连结部位时,则称这两个笔画为单一相交关系,可用符号 表示。如汉字“七”的两个笔画为 关系。(11)当笔画A与笔画B有两个连结部位,一个在笔端相接,另一个在笔身相交时,则称这两个笔画为相接相交关系,可用符号 表示。如汉字“母”的前二笔为 关系。(12)当笔画A与笔画B之间既没有相接部,也没有相交部时,则称这本文档来自技高网...

【技术保护点】
一种计算机汉字编码方法,其特征是任一汉字或词组都可以按以下基本模式进行编码:单字或词组的编码=汉字码段编码+字根码段编码+根首码段编码。

【技术特征摘要】
CN 2005-2-2 20051005224791.一种计算机汉字编码方法,其特征是任一汉字或词组都可以按以下基本模式进行编码单字或词组的编码=汉字码段编码+字根码段编码+根首码段编码2.一种计算机汉字编码的重码字词处理方法,其特征是当标准编码发生重码时,在输满标准编码后采取默认上屏栏与选择上屏栏相分离的重码字词处理方法。3.根据权利要求1所述的编码方法,其特征在于取汉字或字根读音的声母作为该汉字或字根的汉字码或字根码,但是,当汉字或字根读音的声母为zh、ch、sh时,用字母V、U、I替代;当汉字或字根读音为零声母时,取其第一个拼音字母作为该汉字或字根的汉字码或字根码。4.根据权利要求1所述的编码方法,其特征在于把汉字的字根定义为笔顺和先后笔关系都分别相同的汉字构件类别叫做汉字的字根。5.根据权利要求1所述的编码方法,其特征在于把字根分为引读音字根、跟读音字根和变读音字根三类,再分别定义各类字根取得读音的方式,然后根据其读音确定其字根码及在键盘中的键位,段码中文输入法的188个字根分配及键位如下A 爫 B 八 贝 白 巴 卜  疒 匕C 寸  艹  廾D 丶 丁 刀 大 E 二 儿 耳 阝 ‖ 冫 丷 F 非 丰 纟 G 广 革 干 工 古弓戈 宀 冖H 一 禾 黑 火 I 丨 山 石 十 士尸豕 ネJ 九 几 己 臼 钅 廴 K 冂   L 力 龙 鹿 林 了立 M 母 马 目 门 米皿木 N 鸟 乃 廿 女 O ...

【专利技术属性】
技术研发人员:李梧杰
申请(专利权)人:李梧杰
类型:发明
国别省市:45[中国|广西]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1