当前位置: 首页 > 专利查询>黄振荣专利>正文

双笔类主副码字母型部首字典、声系字典汉字编码输入法及其键盘制造技术

技术编号:10620047 阅读:436 留言:0更新日期:2014-11-06 13:03
双笔类主副码字母型部首字典、声系字典汉字编码输入法,根据GF3001规范规定选取687个编码部件,归并成409个编码部件组,确定了31个高频编码部件,主要根据主形编码部件的读音或叫法名称的拼音首字母作为其字母型主码,其第1、2个笔画组合赋于一个字母为副码1,第3、第4个笔画名称的拼音首字母相应作为其字母型副码2、副码3,笔画不足的用字母V来表达,形成字母型编码资源,运用这些编码资源形成了双笔类主副码字母型部首字典汉字编码方法、双笔类主副码字母型部首字典汉字编码方法,能用于电子部首汉字字典、声系汉字字典的形成与检索,能分别把汉字依照部首、声符归并在一起,便于汉字的应用与掌握,效果良好。

【技术实现步骤摘要】
双笔类主副码字母型部首字典、声系字典汉字编码输入法及其键盘
本专利技术属于用于计算机或其他对汉字字符信息进行处理装置的汉字编码输入的方法及键盘。
技术介绍
已公开的汉字编码输入方法,还没有较好的简洁快捷的用于部首字典、声系字典的汉字输入和检索的汉字编码输入方法,还没有一种输入方法能把相同部首的字,相同声旁的字汇集在一起,便于使用者使用。专利技术目的本专利技术的目的是提出一种在对ZL03112606.5一类音形义汉字编码输入法进行改进的基础上的使使用者对方法的掌握更容易的双笔类主副码字母型部首字典、声系字典汉字编码输入法,编码部件的安排也更合理,字的重码率也控制得较低,字的输入也很流畅,大大方便对电子版部首字典、声系字典的形成与应用。
技术实现思路
一个汉字有几种拆分方案,则依次优先满足(1)取拆分成编码部件最少的那一种;(2)取拆分编码部件笔画多的在先的那一种,或者采用另一种方案,取拆分编码部件笔画少的在先的那一种;(3)取编码部件起笔画的笔画排序在前的那一种,确定一种拆分方案;除满足上述拆分要求外,本专利技术采用下述两种汉字拆分方案,方案之一,称之为部首拆分法:根据GF0011—2009《汉字部首表》规定以及在该规范以前的字典、词典规定的部首取汉字部首,采用GF0012—2009《GB13000.1字符集汉字部首归部规范》的汉字部首归部规则,①从汉字的左、上、外位置取部首,如果左和右、上和下、外和内都是部首,则只取左、上、外位置的部首;②如果汉字的左、上不是部首,右、下是部首,则取右、下位置的部首;半包围结构的字,如果外不是部首,内是部首,则取内;③如果汉字的左和右、上和下都不是部首,则按照先左后右、先上后下的顺序,从偏旁的位置取部首;④如果由上述位置取不到部首的左右结构、上下结构、包围结构的字或其他字,从起笔的位置取单笔部首;⑤如果在取部位置上少笔与多笔几个部首出现叠合时,则取多笔部首,不取少笔部首;根据上述规则取的部首,在把汉字分成首部与余部两个部分中,把上述的部首一律都作为首部,一般来说,汉字去掉首部剩余部分为余部,但是对于只能取单笔部首的单个的非部首的编码部件的汉字,为了保持编码部件的完整性,该汉字的这个编码部件的整个编码部件作为该汉字的余部,例如,“重”字是单个编码部件的汉字,“重”的部首是“丿”,“重”的余部是“重”,对于单个编码部件的汉字本身是部首的不再拆分;此方案中的汉字余部,还是依据汉字去掉首部后的笔画顺序对各编码部件取编码;方案之二,称之为声符拆分法,大部分汉字都是形声字,由声符与形符构成,声符也称为声旁,声符相同的汉字形成了字族,以字族汇集在一起形成的字典称为声系字典,形符也称为形旁,为此把汉字分成声符与形符两部分,以《广韵声系》为蓝本,以《广韵声系》确定的声符,作为汉字声符部分,汉字去掉声符部分剩余的部分就视为汉字的形符,如果《广韵声系》没有确定汉字声符的,而汉字能明确确定部首的,汉字去掉部首的剩余部分,就视为声符,这里的部首也就视为形符,汉字中有如下几个编码部件组合:构成汉字族,为此也定义为声符,汉字去掉这些编码部件组合的剩余部分就是形符,对于单个编码部件,不再拆分,整个编码部件视作声符,把汉字的声符作为拆分汉字的第一部分,汉字的形符作为拆分汉字的第二部分;本专利技术利用计算机的字母键盘手机等其他对汉字字符信息进行处理装置的软、硬字母键盘,进行编码输入汉字。具体的实现步骤如下:一、选定编码部件根据国家语委GF3001——1997《信息处理用GB13000.1字符集汉字部件规范》的要求,拆分汉字,确定参与编码的编码部件。选用GF3001——1997《信息处理用GB13000.1字符集汉字部件规范》的560个基础部件,选用GB0011——2009《汉字部首表》的201个主部首和100个附形部首,再选用含有560个基础部件中的若干非成字基础部件的汉字及汉字构件:卑、北、匆、曹、春、单、段、发、贯、亀、龜、庚、亥、壺、華、亦、与、堇、兼、可、婁、免、卯、南、囊、农、棄、牽、其、妻、前、乌、烏、勿、网、行、叚、羲、以、制,共计44个,为了便于记忆使常用的数字类汉字与字符都定为编码部件又选用了:一、百、六、○,扣除重复计算数,总计选用了687个部件作为本汉字编码法采用的基本编码单元,称之为编码部件,并依照编码部件的构字理据相同、或写法稍异、或有所省减、或置向不同的变体、或互为繁、简字的关联性,归并成409个编码部件组,组内的第一个编码部件称为主形编码部件,有的编码部件由多个基础部件组成,如:風,在编码时要把它整体看作一个编码基本单元-——编码部件。在不违反GF3001规范的前提下,在这687个编码部件基础上允许增、减百分之二十的编码部件选用量,只对重码率略有影响,但不改变该编码输入法的实质。二、确定高频编码部件及其主部位位置以及高频编码部件的字母型主码构成汉字的五六百个部件中有三十多个被称之为部首的部件构字能力特别强,据本人统计它们大约构成了全部汉字的百分之四十左右,在这三十多个部首中,本专利技术确定了其中的31个构字能力特别强的部首为高频编码部件,在本专利技术确定的687个编码部件中除去31个高频编码部件其余的编码部件称之为普通编码部件。为了降低重码率,在同一字母键位上只设置一个或一组互为繁、简字体的高频编码部件,同时还确定了其主部位的位置,主部位位置就是该高频编码部件在构成汉字中通常所处的位置,为了降低重码率,其中高频编码部件:山、扌、纟、糹、月、亻、木、艹、訁、讠,9个编码部件组的12个高频编码部件不是以它们的读音或部首名称的汉语拼音的首字母作为它们的主码,而是人为指定。确定的31个高频编码部件的形状、字母型主码、主部位位置如表一所示:表一:31个高频编码部件在字母键盘盘面的布置如图1所示。上述31个高频编码部件以及字母型主码的设定,其数量与字母型主码的设定可以在不超出百分之四十的范围内变动,只对重码率有影响,但不改变编码方法的实质。三、确定每个编码部件的双笔类主码、副码1、副码2、副码3,形成汉字编码方法的双笔类编码资源选定的687个编码部件归并成409个编码部件组,其组内的第一个编码部件称之为主形编码部件,组内的其他编码部件的主码都与主形编码部件的主码一样,主形编码部件都有一定的读音或叫法,除高频编码部件的主码已确定了以外,其他主形编码部件的主码一般都取其读音或叫法名称的拼音首个字母作为双笔类的字母型主码。为了降低重码率,一个改进的方案,称之为点折I法:主形编码部件的读音的拼音首个字母为Y的,而且主形编码部件的首笔是点(丶)、折(乛)的取I作为其字母型主码,首笔为横(一)、竖(丨)、撇(丿)的取Y作为其字母型主码;另一种方案,称之为点折Y法,主形编码部件的读音的拼音首个字母为Y的而主形编码部件的首笔是点(丶)、折(乛)的仍取Y作为其字母型主码,首笔为横(一)、竖(丨)、撇(丿)的取I作为其字母型主码;除此之外其他的普通编码部件的主形编码部件的主码仍取其读音或叫法的拼音首个字母作为双笔类的字母型主码。双笔类字母型副码1的取码方法:根据国家规范,汉字由横(一)、竖(丨)、撇(丿)、点(丶)折(乛)五种笔画组成,本专利技术依次用这五种笔画读音的汉语拼音的首个字母H、S、P、D、Z来表示每个单个笔画,单个本文档来自技高网...
双笔类主副码字母型部首字典、声系字典汉字编码输入法及其键盘

【技术保护点】
双笔类主副码字母型部首字典、声系字典汉字编码输入法,利用计算机通用软、硬字母键盘输入汉字,其特征在于: 一、选定编码部件 根据国家语委GF3001——1997《信息处理用GB13000.1字符集汉字部件规范》的要求,拆分汉字,确定参与编码的编码部件; 选用GF3001——1997《信息处理用GB13000.1字符集汉字部件规范》的560个基础部件,选用GB0011——2009《汉字部首表》的201个主部首和100个附形部首,再选用含有560个基础部件中的若干非成字基础部件的汉字及汉字构件:卑、北、匆、曹、春、单、段、发、贯、亀、龜、庚、亥、壺、華、亦、与、堇、兼、可、婁、免、卯、南、囊、农、棄、牽、其、妻、前、乌、鳥、勿、网、行、叚、羲、以、制,共计44个,为了便于记忆使常用的数字类汉字与字符都定为编码部件又选用了:一、百、六、○,扣除重复计算数,总计选用了687个部件作为本汉字编码法采用的基本编码单元,称之为编码部件,并依照编码部件的构字理据相同、或写法稍异、或有所省减、或置向不同的变体、或互为繁、简字等关联性,归并成409个编码部件组,组内的第一个编码部件称为主形编码部件,在不违反GF3001规范的前提下,在这687个编码部件基础上允许增、减百分之二十的编码部件选用量,只对重码率略有影响,但不改变该编码输入法的实质;二、确定高频编码部件及其主部位位置以及高频编码部件的字母主码 确定了其中的31个构字能力特别强的部首为高频编码部件,在确定的687个编码部件中除去31个高频编码部件其余的编码部件称之为普通编码部件; 为了降低重码率,在同一字母键位上只设置一个或一组互为繁、简字体的高频编码部件,同时还确定了其主部位的位置,主部位位置就是该高频编码部件在构成汉字中通常所处的位置,为了降低重码率,其中高频编码部件:山、扌、、纟、糹、月、亻、木、艹、訁、讠等9个编码部件组的12个高频编码部件不是以它们的读音或部首名称的汉语拼音的首字母作为它们的主码,而是人为指定;确定的31个高频编码部件的形状、字母型主码、主部位位置如下面所示:上述31个高频编码部件以及字母型主码的设定,其数量与字母型主码的设定可以在不超出百分之四十的范围内变动,只对重码率有影响,但不改变编码方法的实质; 三、确定每个编码部件的双笔类主码、副码1、副码2、副码3,形成汉字编码方法的双笔类编码资源 选定的687个编码部件归并成409个编码部件组,其组内的第一个编码部件称之为主形编码部件,组内的其他编码部件的主码都与主形编码部件的主码一样,主形编码部件都有一定的读音或叫法,除高频编码部件的主码已确定了以外,其他主形编码部件的主码一般都取其读音或叫法名称的拼音首个字母作为双笔类的字母型主码;为了降低重码率,采用点折I法:主形编码部件的读音的拼音首个字母为Y的,而且主形编码部件的首笔是点(丶)、折(乛)的取I作为其字母型主码,首笔为横(一)、竖(丨)、撇(丿)的取Y作为其字母型主码;双笔类字母型副码1的取码方法:根据国家规范,汉字由横(一)、竖(丨)、撇(丿)、点(丶)折(乛)五种笔画组成,本专利技术依次用这五种笔画读音的汉语拼音的首个字母H、S、P、D、Z来表示每个单个笔画,单个笔画的编码部件,就把它作为该编码部件的字母型副码1;对于由两个以上组成的编码部件,依次取其第一、第二个笔画的组合赋于一个字母,作为该编码部件的字母型副码1,安排在计算机的字母键盘上,笔画组合所对应的字母具体如下所示: 笔画组合 一乛 乛一 乛丿 一丿 丿丿 一丨 一一 对应字母 A B C D E F G 笔画组合 丨一 丶丿 丨丨 丨丿 丨丶 丨乛   对应字母 H I J K L M   笔画组合 丶丶 丶乛 丿乛 丿丨 一丶 丿一 丶丨 对应字母 O P Q R S T U 笔画组合 乛丨 丿丶 乛丶 丶一 乛乛     对应字母 V W X Y Z     双笔类字母型副码2、副码3的取码方法:对于由4个或4个以上笔画组成的编码部件依次取第3笔画、第4笔画的笔画的字母型码作为编码部件的字母型副码2、副码3;对于不足4个笔画构成的编码部件,缺失的笔画,确定都取字母V,来表达其字母型副码2、副码3;根据上述方法确定本专利技术的409个编码部件组的687个编码部件的字母型主码、副码1、副码2、副码3,依次排列,对于不足4个笔画构成的编码部件,缺失的笔画,确定都采用字母V补足的方案; 主形编码部件的读音的拼音首个字母为Y的,采用点折I法;表中双笔类主副码,为了看得醒目采用了大写字母,它与小写字母等效,在实际编码时,编码表采用小写字母;具体如下表所示: 四、双笔类主副码字母型部首字典、声系字典汉字编码输入法 对于编码部件的读音的首字母为Y的,采用点折I法,确定取其主码的方案,从而确定一种字母型编码资源;采用...

【技术特征摘要】
1.双笔类主副码字母型部首字典、声系字典汉字编码输入法,利用计算机通用软、硬字母键盘输入汉字,其特征在于:一、选定编码部件根据国家语委GF3001——1997《信息处理用GB13000.1字符集汉字部件规范》的要求,拆分汉字,确定参与编码的编码部件;选用GF3001——1997《信息处理用GB13000.1字符集汉字部件规范》的560个基础部件,选用GB0011——2009《汉字部首表》的201个主部首和100个附形部首,再选用含有560个基础部件中的若干非成字基础部件的汉字及汉字构件:卑、北、匆、曹、春、单、段、发、贯、亀、龜、庚、亥、壺、華、亦、与、、堇、兼、可、婁、免、卯、南、囊、农、棄、牽、其、妻、前、乌、烏、勿、网、行、叚、羲、以、制,共计44个,为了便于记忆使常用的数字类汉字与字符都定为编码部件又选用了:一、百、六、○,扣除重复计算数,总计选用了687个部件作为本汉字编码法采用的基本编码单元,称之为编码部件,并依照编码部件的构字理据相同、或写法稍异、或有所省减、或置向不同的变体、或互为繁、简字的关联性,归并成409个编码部件组,组内的第一个编码部件称为主形编码部件,在不违反GF3001规范的前提下,在这687个编码部件基础上允许增、减百分之二十的编码部件选用量,只对重码率略有影响,但不改变该编码输入法的实质;二、确定高频编码部件及其主部位位置以及高频编码部件的字母主码确定了其中的31个构字能力特别强的部首为高频编码部件,在确定的687个编码部件中除去31个高频编码部件其余的编码部件称之为普通编码部件;为了降低重码率,在同一字母键位上只设置一个或一组互为繁、简字体的高频编码部件,同时还确定了其主部位的位置,主部位位置就是该高频编码部件在构成汉字中通常所处的位置,为了降低重码率,其中高频编码部件:山、扌、纟、糹、月、亻、木、艹、訁、讠,9个编码部件组的12个高频编码部件不是以它们的读音或部首名称的汉语拼音的首字母作为它们的主码,而是人为指定;确定的31个高频编码部件的形状、字母型主码、主部位位置如下面所示:上述31个高频编码部件以及字母型主码的设定,其数量与字母型主码的设定可以在不超出百分之四十的范围内变动,只对重码率有影响,但不改变编码方法的实质;三、确定每个编码部件的双笔类主码、副码1、副码2、副码3,形成汉字编码方法的双笔类编码资源选定的687个编码部件归并成409个编码部件组,其组内的第一个编码部件称之为主形编码部件,组内的其他编码部件的主码都与主形编码部件的主码一样,主形编码部件都有一定的读音或叫法,除高频编码部件的主码已确定了以外,其他主形编码部件的主码一般都取其读音或叫法名称的拼音首个字母作为双笔类的字母型主码;为了降低重码率,采用点折I法:主形编码部件的读音的拼音首个字母为Y的,而且主形编码部件的首笔是点(丶)、折(乛)的取I作为其字母型主码,首笔为横(一)、竖(丨)、撇(丿)的取Y作为其字母型主码;双笔类字母型副码1的取码方法:根据国家规范,汉字由横(一)、竖(丨)、撇(丿)、点(丶)折(乛)五种笔画组成,依次用这五种笔画读音的汉语拼音的首个字母H、S、P、D、Z来表示每个单个笔画,单个笔画的编码部件,就把它作为该编码部件的字母型副码1;对于由两个以上组成的编码部件,依次取其第一、第二个笔画的组合赋于一个字母,作为该编码部件的字母型副码1,安排在计算机的字母键盘上,笔画组合所对应的字母具体如下所示:双笔类字母型副码2、副码3的取码方法:对于由4个或4个以上笔画组成的编码部件依次取第3笔画、第4笔画的笔画的字母型码作为编码部件的字母型副码2、副码3;对于不足4个笔画构成的编码部件,缺失的笔画,确定都取字母V,来表达其字母型副码2、副码3;根据上述方法确定的409个编码部件组的687个编码部件的字母型主码、副码1、副码2、副码3,依次排列,对于不足4个笔画构成的编码部件,缺失的笔画,确定都采用字母V补足的方案;主形编码部件的读音的拼音首个字母为Y的,采用点折I法;表中双笔类主副码,为了看得醒目采用了大写字母,它与小写字母等效,在实际编码时,编码表采用小写字母;具体如下表所示:四、双笔类主副码字母型部首字典、声系字典汉字编码输入法对于编码部件的读音的首字母为Y的,采用点折I法,确定取其主码的方案,从而确定一种字母型编码资源;采用取拆分编码部件笔画多的在先的那一种;在实施编码时,首先要确定具体的汉字拆分方案,双笔类主副码字母型部首字典汉字编码方法采用部首拆分法,双笔类主副码字母型声系字典汉字编码方法采用声符拆分法;双笔类主副码字母型部首字典、声系字典汉字编码输入法,由双笔类主副码字母型部首字典汉字编码方法与双笔类主副码字母型声系字典汉字编码方法组成,双笔类主副码字母型部首汉字编码方法取得的编码与双笔类主副码字母型声系字典汉字编码方法取得的编码,组合在同一张码表中;双笔类主副码字母型部首字典、声系字典汉字编码输入方法如下:(一)双笔类主副码字母型部首字典汉字编码方法A、采用双笔类主副码字母型编码资源,汉字拆分采用部首拆分法;B、对汉字的部首的首部编码部件取编码,采用三码法,即取该部首的编码部件的字母型主码、副码1、副码2;C、对汉字的余部的编码部件取编码,采用三码法,如果是单个编码部件的余部,则依次对该编码部件取3码;如果是二个编码部件的余部,采用首一法,则依次对第1个编码部件取1码、对第2个编码部件取2码,如果是由三个或三个以上的编码部件组成的余部,则依次取其第1、第2、第末个编码部件各1码;D、没有余部的笔画编码部件和部首编码部件,采用三码法,作部首的编码部件,取3码,即取该部首的编码部件的字母型主码、副码1、副码2;E、把汉字的首部与余部的编码依次组合在一起,成为整个汉字的编码;(二)双笔类主副码字母型声系字典汉字编码方法A、采用双笔类主副码字母型编码资源,汉字拆分采用声符拆分法;B、对声符取编码,采用四码法,对于单个编码部件的声符,则取该编码部件4码,对于由二个编码部件组成的声符,采用首二法,则依次取其第1、第2个编码部件各2码,对于三个编码部件组成的声符,采用首一法,则依次取第1、第2个编码部件各1码、第3个编码部件2码,对于由四个或四个以上编码部件组成的声符,则依次取其第1、第2、第3、第末个编码部件各1码;C、对形符取编码,采用二码法,形符是单个编码部件的取该编码部件2码,如果形符是多个编码部件组成的,则依次取其第1、第末个编码部件各1码;D、对于没有形符的声符取编码,采用四码法,对于单个编码部件的声符,则取该编码部件4码,对于由二个编码部件组成的声符,采用首二法,则依次取其第1、第2个编码部件各2码,对于三个编码部件组成的声符,采用首一法,则依次取第1、第2个编码部件各1码、第3个编码部件2码,对于由四个或四个以上编码部件组成的声符,则依次取其第1、第2、第3、第末个编码部件各1码;E、声符取的编码在前,形符取的编码在后,依次组成整个汉字的编码。2.根据权利要求1所述的双笔类主副码字母型部首字典、声系字典汉字编码输入法,其特征在于,在汉字拆分时,取拆分编码部件笔画少的在先的那一种。3.根据权利要求1所述的双笔类主副码字母型部首字典、声系字典汉字编码输入法,其特征在于,对于主形编码部件的读音的拼音首个字母为Y的,采用点折Y法,主形编码部件的读音的拼音首个字母为Y的而主形编码部件的首...

【专利技术属性】
技术研发人员:黄振荣
申请(专利权)人:黄振荣
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1