九笔形中文字词编码输入方法及其键盘。本发明专利技术将汉字分解为九种笔形,按单体、上下和左右结构拼形编码。每个字码长1~4位。字词兼容。词输入用首字全码加次尾字简码。词码长3~6位。键盘无改动,设10个极高频字及标拼音和注音符号。本方法笔形分解合理,编码规则简单直观,码位短,重码率低,适用于简繁体汉字编码,是一种优化的计算机中文高速输入方法。(*该技术在2008年保护过期,可自由使用*)
【技术实现步骤摘要】
本专利技术涉及一种小键盘中文字词编码输入方法及其键盘设计,属计算机汉字输入方法类。汉字输入是计算机处理中文信息的“瓶颈”阶段。由于汉字是象形方块文字,构件繁杂,同音字多,现有的各种编码输入方法难免顾失彼。汉字小键盘编码输入的优化目标是合理分解字元及安排键盘布局。使其编码规则简单易记,输入速度快,重码率和误码率都很低。现有的小键盘汉字编码输入方法归纳起来大致可以分为三类,即1.汉语拼音输入;2.字元拼形编码输入;3.拼音拼形组合码输入。全拼音输入的代表方案有邵喻的《STC软汉字系统》。拼音拼形组合码输入的代表方案有张林翔的“头腹尾数码和声韵母码组合式汉字编码输入方法”。这两种方案都要用到拼音。在目前汉语拼音不太普及的情况下有一定的局限性。而且由于汉字同音字多、重码率较高。字元拼形编码输入方法又可以分为字根拼形编码法和笔形拼形编码法两种。字根拼形编码输入的代表方案有钱学森的“汉字字形输入法”。这种方法将汉字分解为几十个或上百个字根,安排在键盘上,用字根拼形编码输入汉字。其优点是重码率低,缺点是字根太多,记忆困难。笔形拼形编码输入方案有李金凯的“多文种电脑输入方法”和王永民的“五笔形五笔划汉字编码方法”。李方案将汉字分解为10种笔形,单字码长6位。王方案将汉字分解为5种笔形,按“前四末一”笔划编码,单字码长5位。这种方案的优点是完全脱离了拼音,也不必记忆大量的字根,编码规则简单,缺点是李方案码位长,王方案笔形分解过于简化,而且编码规则均不尽合理,重码率较高,不能字词兼容。本专利技术在充分研究了笔形分解适度性的基础上,根据汉字方块结构表形特征区别规律,以及汉字大量是双字词的规律,提出了“九笔形中文字词编码输入方法及其键盘”的设计方法。本方法将汉字分解为基本笔形,特高频常用字和词组三个层次。包括单字输入法,词组输入法和键盘设计三个部份。单字和词组的输入方法可以自成体系,也可以组合优化,字词兼容。笔形分解和编码则可以概括为十分简单的口诀,以帮助记忆。1.笔形编码口诀横竖撇点折,一二三四五,串方八叉空,六七八九零2.编码规则口诀单体字前三末一,双体字各部首尾;词组首字取全码,次尾两字补简码。一、单字拼形编码输入方法1.将汉字分解为“横、竖、撇、点、折、串、方、八、叉”九种基本笔形,用“1~9”九个数字对应编码,用“O”表示空笔划。(附图说明图1)是笔形编码表。2.将汉字归纳为单体、上下和左右三种基本结构,分别规定编码规则。3.编码规则①每个字取1~4位不等长数字码。②优先取复笔形,复笔形被破坏时取简单笔形。同码异字用序数选择。③单体结构字按书写笔顺依序编码,最少一位码,最多取“首、次、三、尾”四笔四码。例如丰=6(串)士=91(叉、横)工=121(横、竖、横)电=2515(竖、折、横-折)④上下结构字按字头字底分别取其首尾笔划得到两个二位码再按书写顺序组合成四位字码。字头字底只有一笔时各自添“O”补足为二位码。例如道=8144(八、横-点、捺),会=8014(八、空-横、点)召=5370(折、撇-方、空),要=1151(横、横-折、横)⑤左右结构字按部首偏旁分别取其首尾笔划得到两个二位码再按书写顺序组合成四位字码。部首偏旁只有一笔时各自添“0”补足为二位码。例如组=5121(折、挑-竖、横),况=4075(点、空-方、折)碰=1781(横、方-八、横),件=3236(撇、竖-撇、串)二、词的编码输入方法词输入采用首字全码加次尾字简码为补码的方法,从而使字词兼容系统简单可行。方法一,词的拼形编码输入1.词输入取首字拼形数字全码加上尾字的首尾笔划简码构成词的3~6位不等长数字码。当首字少于四码时,输完首字码按一下小数点键(或除号键),再接着输尾字数码,一条词输完后按一下空格键。同码异词用序数选择。例如工人=121·80电话=251547电视机=2515951电子计算机=2515952丰收在望=6·41丰收=6·292.三字以上的多字词的另一种编码方法是取首字的数字全码加上次字的首笔划码,再加上尾字的尾笔划构成3~6位不等长数码。例如电机=251595电视机=251545电子计算机=251555方法二,词的形音组合码输入1.用首字拼形数字全码加上其余各字的第一个拼音字母码(或注意符号)构成词的形音组合码,同码异词用序数选择。例如工人=121R电视机=2515SJ电机=2515J电子计算机=2515ZJSJ三、键盘设计1.在键盘上第一排10个数字键上安排了10个极高频常用字即这、那、只、有、不、在、了、和、的、是。这些字既可以一键定字,也可以编码输入或组词输入。2.键盘右边10个数字键上标笔名和笔形,对应为横-1,竖-2,撇-3,点-4,折-5,串-6,方-7,八-8,叉-9,空-0。3.在英文字母键上标注音符号(图2)是键盘设计图。原键盘无改动,可用贴纸标示。与现有的各种汉字编码输入方法相比较,本专利技术所提出的编码方法具有笔形分解合理,编码规则简单直观,字词兼容,码位极短,输入速度快,重码率低,综合指标较好的优点。按国标一级汉字库3755个汉字编码,单字重码率低于4%。本专利技术所提出的汉字编码方法适用于简体和繁体汉字字和词的编码,可用于计算机等高速输入汉字,也可用于编写字典。权利要求1.一种九笔形中文字词编码输入方法及其键盘设计,包括笔形编码、高频字设置,单字编码输入,字词兼容编码输入和键盘设计几项内容舻缱蛹扑慊鹤中〖瘫嗦胧淙敕椒ɡ唷O钟械母髦直市伪嗦敕椒ū市畏纸獠痪『侠怼>前词樾幢仕骋佬虮嗦牍钩 ~6位数字码输入单个汉字,码位长,重码率较高,不能字词兼容。本专利技术的特征在于将汉字分解为九种基本笔形和空笔划,对应编码为横-1,竖-2、撇-3、点-4、折-5、串-6、方-7、八-8、叉-9、空笔-0;字输入单体结构字按书写笔顺依序编码构成1~4位不等长数字码。上下结构字和左右结构字按各部结构取首尾笔划构成4位等长数字码;字词兼容词编码输入以首字拼形数字全码加次字和尾字的拼形简码为补码构成3~6位不等长数字码;字词兼容词编码输入的另一种方法是以首字拼形数字全码加上其余各字的第一个拼音字母码构成形音组合词码;键盘上第一排数字键设置10个极高频常用字。对应键各为1-这、2-那、3-只、4-有、5-不、6-在、7-了、8-和、9-的、0-是。这10个字既可以一键定字,又可以编码输入;右边10个数字键上标笔形和笔名。对应为1-横(一)、2-竖(|)、3-撇(丿)、4-点(丶)5-折()、6-串(≠)、7-方(口)、8-八(人)9-叉(十)、0-空笔;在英文字母键上标注音符号。2.如权利1所述的九笔形中文字词编码输入方法,其特征在于单体结构字按书写笔顺笔划优先取复笔形依序编码,每个字最少一位,最多取“首、次、三、尾”四笔划四位数字码。3.如权利1所述的九笔形中文字词编码输入方法。其特征在于上下结构字按字头字底分别取首尾笔划编成两个二位数码,再按书写顺序组合成整字四位数字码,字头字底只有一笔时各自添“0”补足为二位码,每个字均为四位数字码。4.如权利1所述的九笔形中文字词编码输入方法,其特征在于左右结构字按部首偏旁分别取其首尾笔划编成两个二位数码,再按书写顺序组合成整字四位数字码,部首偏旁只有一笔时,各自添“0”补足为本文档来自技高网...
【技术保护点】
一种九笔形中文字词编码输入方法及其键盘设计,包括笔形编码、高频字设置,单字编码输入,字词兼容编码输入和键盘设计几项内容,属电子计算机汉字小键盘编码输入方法类。现有的各种笔形编码方法笔形分解不尽合理。均是按书写笔顺依序编码构成5~6位数字码输入单个汉字,码位长,重码率较高,不能字词兼容。本专利技术的特征在于:将汉字分解为九种基本笔形和空笔划,对应编码为:横-1,竖-2、撇-3、点-4、折-5、串-6、方-7、八-8、叉-9、空笔-0;字输入单体结构字按书写笔顺依序编码构成1~4位不等长数字码。上下结构字和左右结构字按各部结构取首尾笔划构成4位等长数字码;字词兼容词编码输入以首字拼形数字全码加次字和尾字的拼形简码为补码构成3~6位不等长数字码;字词兼容词编码输入的另一种方法是以首字拼形数字全码加上其余各字的第一个拼音字母码构成形音组合词码;键盘上第一排数字键设置10个极高频常用字。对应键各为:1-这、2-那、3-只、4-有、5-不、6-在、7-了、8-和、9-的、0-是。这10个字既可以一键定字,又可以编码输入;右边10个数字键上标笔形和笔名。对应为:1-横(一)、2-竖(丨)、3-撇(丿)、4-点(丶)5-折(*)、6-串(≠)、7-方(口)、8-八(人)9-叉(十)、0-空笔;在英文字母键上标注音符号。...
【技术特征摘要】
【专利技术属性】
技术研发人员:卓达宗,
申请(专利权)人:卓达宗,
类型:发明
国别省市:53[中国|云南]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。