当前位置: 首页 > 专利查询>李平专利>正文

一种将汉字部首词组化双声编码在数字键输入汉字的方法技术

技术编号:2821184 阅读:482 留言:0更新日期:2012-04-11 18:40
一种将汉字部首词组化双声编码在数字键输入汉字的方法,属汉字信息处理技术领域,它涉及将汉字部首词组化、汉字部件的拆分组合规则,以及部件和笔画在数字键盘上的安排等,其特征是:将汉字规范部首中的成字部件和一部分非成字部件词组化,取双声母编码;将笔画分为横(一)竖(丨)撇(丿)点(丶)折(乙)等五类。其中,捺(ㄟ)属于点类;将这五类笔画依据其有无其他笔画叉过,一分为二,又分出有叉笔的五类笔画,即叉横、叉竖、叉撇、叉点(叉捺)、叉折等五类,共十类笔画;用拼音的基本方法和十个笔画,可以输入所有汉字;输入键次少,一个单字或一个多字词组,最多六键完成;重码率很低,可以实现盲打输入。

【技术实现步骤摘要】

本专利技术属汉字信息处理

技术介绍
现有在数字键盘输入汉字的方法,有拼音输入,也有笔画输入。拼音输入的前提是要认识该汉字,不认识的汉字用拼音输入就有困难。笔画输入的可以不认识,但输入笔画多,速度慢。编码输入的方法少,且重码率普遍偏高(以王永民《五笔字型》的重码率为准)。编码输入要达到低于《五笔字型》的水平,很难。 本专利技术采用拼音输入的基本方法,拆分汉字为标准部件,将汉字部首双字词组化,双声拼音编码;加上直观的笔画编码,单字和词组混合输入,重码率比《五笔字型》低一半以上,可以实现盲打输入。
技术实现思路
本专利技术是一种将汉字部首词组化,结合笔画和部件,组合编码,在数字键的十个键位上输入汉字的方法。 现行在数字键上输入汉字的方法,普遍存在的问题是输入键次太多,输入速度太慢;不认识的汉字不能用拼音输入;只输入单字,不能输入词组;不能盲打输入等问题。 本专利技术要解决的问题是用拼音的基本方法可以输入所有汉字;输入键次少,一个单字或一个多字词组,最多六键完成;重码率很低,低于《五笔字型》;可以实现盲打输入。 本专利技术的几个基本概念 数字键盘将数字键盘的十个键位设计为符合汉语拼音认读习惯的声母键位,(见附图1)。符合汉语拼音认读习惯指将汉语拼音的声母依照汉语拼音方案的声母表,将声母顺次读为 b p m f;d t n l;g k h;j q x;zh ch sh r;z c s; 每组声母在数字键盘上纵向排列,各字母所在键位编码为 1 g j;2 b d;3 zh z;4 k q;5 p t;6 ch c r;7 h x;8 m n;9 sh s;0 f l; 特别安排的有y视为声母,在3号键;w视为声母,在4号键;将没有声母的字设计为零声母,零声母在5号键; 笔画指横(一)竖(丨)撇(丿)点(丶)折(乙)等五类。其中,捺( )属于点类。本专利技术将这五类笔画依据其有无其他笔画叉过,一分为二,又分出有叉笔的五类笔画,即叉横、叉竖、叉撇、叉点(叉捺)、叉折等五类。 在本说明书中,叉笔画的表示如下,虚线表示有叉笔叉过 笔画的编码是横1,竖2,撇3,点4,折5,叉横9,叉竖8,叉撇7,叉点6,叉折0 中撇有其他笔画与撇的中部相连特征的为“中撇”,中撇归入叉撇; 直点和直捺与上下左右的横或竖相邻的点或捺,为“直点、直捺”,直点、直捺归入叉点叉捺; 部件指《信息处理用GB13000.1字符集汉字部件规范》中所列,由笔画组成的具有组配汉字功能的构字单位。部件分为成字部件和非成字部件两种,成字部件中的成字以《国标GB-2310(80)》中的常用字为限; 超出常用字部分的成字归入非成字部件部分;本专利技术所使用的部件除部首中合成成字部件和特别说明的部件外,均为不可再拆分的基础部件; 部首指《现代汉语词典》中所列部首; 部首成字的词组化将部首中的下列成字全部两字词组化,并取两字的声母码或中心字的声母码; 取一码时取本字声码; 部首中合成成字部首单独使用,再分解时,拆分成基础部件使用; 部首中非成字的处理将部首中的下列非成字两字词组化,并取两字的声母码;取一码时取中心字; 笔画与基础部件合成常用字的,不再拆分,直接作为成字使用; 将不是部首的下列部件词组化处理,作为部首使用 癶=登头=登 部首中其他非常用字成字的处理取笔画码; 成字部首及非成字部首词组第一声码键位示意见附图2; 编码输入方法本专利技术单字和词组均六位编码; 单字是成字部件部首的取该字双声码,再依次取笔画的一、二、三、末笔画码,笔画不足的,补0;凡笔画不足的,均补0,下同; 单字是成字部件不是部首的取一声码,再依次取笔画的一、二、三、四、末笔画码; 都是部首或都不是部首的两部件单字每部件各取三码;是部首的前两码取双声码,第三码取末笔画码;不是部首是成字的,取一声码和首末笔画码;不是部首也不是成字的,取一、二、末笔画码; 一个是部首,一个不是部首的两部件单字是部首的取两码,不是部首的取四码,是成字部件的,先取声码,再取一、二、末笔画码;不是成字部件的,取一、二、三、末笔画码; 三部件单字每个部件取二码; 四部件单字一、四部件各取二码,二、三部件各取一码; 五部件单字一部件取二码,其他部件各取一码; 六部件及以上单字一部件取二码,二、三、四、末部件各取一码; 两字词每字取三码;两部件字,首部件取一码,尾部件取两码;多部件字一、二、三部件各取一码; 三字词每字取两码; 四字词首末字各取两码,二、三字各取一码; 五字词首字取两码,其他字各取一码; 六字及六字以上词首字取两码,二、三、四、末字各取一码; 附图说明 附图1是24个声母在10个键位上的设置键位图; 附图2是成字部首及非成字部首词组键位示意图; 具体实施例方式 下面结合实例具体说明; 数字键盘将数字键盘的十个键位设计为符合汉语拼音认读习惯的声母键位,(见附图1)。符合汉语拼音认读习惯指将汉语拼音的声母依照汉语拼音方案的声母表,将声母顺次读为 b p m f;d t n l;g k h;j q x;zh ch sh r;z c s; 每组声母在数字键盘上纵向排列,各字母所在键位编码为 1 g j;2 b d;3 zh z;4 k q;5 p t;6 ch c r;7 h x;8 m n;9 sh s;0 f l; 特别安排的有y视为声母,在3号键;w视为声母,在4号键;将没有声母的字设计为零声母,零声母在5号键; 笔画指横(一)竖(丨)撇(丿)点(丶)折(乙)等五类。其中,捺( )属于点类。本专利技术将这五类笔画依据其有无其他笔画叉过,一分为二,又分出有叉笔的五类笔画,即叉横、叉竖、叉撇、叉点(叉捺)、叉折等五类。如“王”的第一笔为横,第二笔为叉横,第三笔为叉竖。其余类推。 在本说明书中,叉笔画的表示如下,虚线表示有叉笔叉过 笔画的编码是横1,竖2,撇3,点4,折5,叉横9,叉竖8,叉撇7,叉点6,叉折0;横与叉横1、9相对,竖与叉竖2、8相对,等等,便于记忆,其余同; 中撇有其他笔画与撇的中部相连特征的为“中撇”,如“亻、勹、牛”等,中撇归入叉撇; 直点和直捺与上下左右的横或竖相邻的点或捺,为“直点、直捺”,如“亠”中的点,“卜”中的点,“其”中的点,“水”中的捺等,直点、直捺归入叉点叉捺; 部件指《信息处理用GB13000.1字符集汉字部件规范》中所列,由笔画组成的具有组配汉字功能的构字单位。部件分为成字部件和非成字部件两种,成字部件中的成字以《国标GB-2310(80)》中的常用字为限,201个成字部件如下 口一八木日曰人入土士月金十田文贝七又大止女言虫火山王玉心小立禾衣竹目几石寸车厂四广白工力皿米示门巾刀刁巳已己尸爪子耳卜羊儿牛习戈雨夕夫方食酉水二川干西斤臼丰见弓戊丁犬户革由长舟歹册而臣业未末自非毛巴且矛千中甫氏束里母手龙乙世皮黑亡瓦也丸不内父果本文档来自技高网...

【技术保护点】
一种将汉字部首词组化双声编码在数字键输入汉字的方法,属汉字信息处理技术领域,它涉及将汉字部首词组化、汉字部件的拆分组合规则,以及部件和笔画在数字键盘上的安排等,其特征是:将汉字规范部首中的成字部件和一部分非成字部件词组化,取双声母编码;将横(一)竖(丨)撇(丿)点(丶)折(乙)等五类笔画依据其有无其他笔画叉过,一分为二,又分出有叉笔的五类笔画,即叉横、叉竖、叉撇、叉点(叉捺)、叉折等五类,共十类笔画;用拼音的基本方法和十个笔画,即可输入所有汉字; 本专利技术的几个基本概念: 数字键盘:将数字键盘的十个键位设计为符合汉语拼音认读习惯的声母键位(见附图1);符合汉语拼音认读习惯指将汉语拼音的声母依照汉语拼音方案的声母表,将声母顺次读为: b p m f;d t n l;g k h;j q x;zh ch sh r;z c s; 每组声母在数字键盘上纵向排列,各字母所在键位编码为: 1 g j;2 b d;3 zh z;4 k q;5 p t;6 ch c r;7 h x;8 m n;9 sh s;0 f l; 特别安排的有:y视为声母,在3号键;w视为声母,在4号键;将没有声母的字设计为零声母,零声母在5号键; 笔画:指横(一)竖(丨)撇(丿)点(丶)折(乙)等五类;其中,捺(*)属于点类;本专利技术将这五类笔画依据其有无其他笔画叉过,一分为二,又分出有叉笔的五类笔画,即叉横、叉竖、叉撇、叉点(叉捺)、叉折等五类; 在本说明书中,叉笔画的表示如下,虚线表示有叉笔叉过: 十=叉横;十=叉竖;ㄨ=叉撇;ㄨ=叉捺、叉点;九=叉折; 笔画的编码是:横1,竖2,撇3,点4,折5,叉横9,叉竖8,叉撇7,叉点6,叉折0; 中撇:有其他笔画与撇的中部相连特征的为“中撇”,中撇归入叉撇; 直点和直捺:与上下左右的横或竖相邻的点或捺,为"直点、直捺",直点、直捺归入叉点叉捺; 部件:指《信息处理用GB13000.1字符集汉字部件规范》中所列,由笔画组成的具有组配汉字功能的构字单位;部件分为成字部件和非成字部件两种,成字部件中的成字以《国标GB-2310(80)》中的常用字为限; 超出常用字部分的成字归入非成字部件部分;本专利技术所使用的部件除部首中合成成字部件和特别说明的部件外,均为不可再拆分的基础部件; 部首:指《现代汉语词典》中所列部首; 部首成字的词组化:将部首中的成字全部两字词组化,并取两字的声母码或中心字的声母码; 取一码时取本字声码...

【技术特征摘要】

【专利技术属性】
技术研发人员:李平李想
申请(专利权)人:李平
类型:发明
国别省市:66[中国|海南]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1