当前位置: 首页 > 专利查询>黄振荣专利>正文

组合式双拼类主副码汉字、词语编码输入法及其键盘制造技术

技术编号:12773529 阅读:71 留言:0更新日期:2016-01-27 17:16
组合式双拼类主副码汉字、词语编码输入方法,根据GF3001规范规定选取687个编码部件,归并成409个编码部件组,确定了31个高频编码部件,主要根据主形编码部件的读音或叫法名称的双拼字母确定其字母型主码、副码1、其第1、2个笔画名称的拼音首字母相应作为其字母型副码2、3,形成字母型编码资源,再根据国家规范转换成相应的数字型编码资源,再运用这些编码资源形成了字母型,数字型,拼音首字母、非拼音首字母的汉字、词语的编码输入法,组合应用,既能输入读得出音的字,又能输入读不出音的字,在对GB18030字库与三级词语库的编码输入时,其重码数大多不超过10个,应用效果良好。

【技术实现步骤摘要】

本专利技术属于用于计算机或其他对汉字字符信息进行处理装置的汉字、词语编码输入的方法及键盘。
技术介绍
已公开的汉字编码输入方法,对于参与编码的部件,一般只赋于一个字母的音码或形码,本人专利技术的ZL03112606.5的一类音形义汉字编码输入法,引入了音、形码与义类码形成了重码率低见字就能输入的较好的计算机汉字输入方法,取得了良好的效果。但是要求使用者要对四百多个编码部件组的义类码要了解记住掌握,有一定的难度,需要一定的时间。专利技术目的本专利技术的目的是提出对ZL03112606.5一类音形义汉字编码输入法进行改进的双拼类汉字、词语编码输入法,使使用者对方法的掌握更容易,编码部件的安排也更合理,重码率也控制得较低,字、词的输入也流畅。
技术实现思路
一个汉字有几种拆分方案,则依次优先满足(1)取拆分成编码部件最少的那一种;(2)取拆分编码部件笔画多的在先的那一种,或者采用另一种方案,取拆分编码部件笔画少的在先的那一种;(3)取编码部件起笔画的笔画排序在前的那一种,确定一种拆分方案;除满足上述拆分要求外,本专利技术有三种汉字拆分法,方案之一,称之为通用拆分法:两个以上编码部件构成的汉字,可以分成首部与余部两部分,规定,在上下结构或左右结构、包围类结构的汉字中,只要首个编码部件处于单独位置或者首个编码部件与末个编码部件都为单独的编码部件时,都确定首个编码部件作为汉字分成两个部分中的首部,汉字去掉该编码部件后剩余的编码部件就为余部,例如:“蒂”字“艹”为首部,“帝”为余部;“國”字“囗”为首部,“或”为余部;又规定,汉字的第1编码部件与一个或一个以上的编码部件处在一个层面,则末个编码部件为余部,汉字去掉余部的剩余的多个编码部件的组合,称作组合首部,例如:“愁”字,“秋”为组合首部;为了减少重码率,还可以把定义为组合部件,在汉字拆分中视作一个组合首部,例如“赢”字,为一个部分,视作组合首部,“贝”为另一部分,视为余部;向右上包围结构的字,例如以“辶”、“廴”为部首的汉字,其除去“辶”、“廴”以外的为一个部分,视为组合首部,“辶”、“廴”为另一部分,为单余部;方案之二,称之为部首拆分法:根据GF0011—2009《汉字部首表》规定以及在该规范以前的字典、词典规定的部首取汉字部首,采用GF0012—2009《GB13000.1字符集汉字部首归部规范》的汉字部首归部规则,①从汉字的左、上、外位置取部首,如果左和右、上和下、外和内都是部首,则只取左、上、外位置的部首;②如果汉字的左、上不是部首,右、下是部首。则取右、下位置的部首;半包围结构的字,如果外不是部首,内是部首,则取内;③如果汉字的左和右、上和下都不是部首,则按照先左后右、先上后下的顺序,从偏旁的位置取部首;④如果由上述位置取不到部首的左右结构、上下结构、包围结构的字或其他字,从起笔的位置取单笔部首;⑤如果在取部位置上少笔与多笔几个部首出现叠合时,则取多笔部首,不取少笔部首;根据上述规则取的部首,在把汉字分成首部与余部两个部分中一律都视为首部,一般来说,汉字去掉首部剩余部分为余部,但是对于只能取单笔部首的单个编码部件的非部首汉字,为了保持编码部件的完整性,该汉字的这个编码部件的整个编码部件作为该汉字的余部,例如,“重”字是单个编码部件的汉字,“重”的部首是“丿”,“重”的余部是“重”;对于单个编码部件的汉字本身是部首的不再拆分;此方案中的汉字余部,还是依据汉字去掉首部后的笔画顺序对各编码部件取码;方案之三,称之为声符拆分法,大部分汉字都是形声字,由声符与形符构成,声符也称为声旁,声符相同的汉字形成了字族,以字族汇集在一起形成的字典称为声系字典,形符也称为形旁,为此把汉字分成声符与形符两部分,以《广韵声系》为蓝本,以《广韵声系》确定的声符,作为汉字声符部分,汉字去掉声符部分剩余的部分就视为汉字的形符,如果《广韵声系》没有确定汉字声符的,而汉字能明确确定部首的,汉字去掉部首的剩余部分,就视为声符,这里的部首也就视为形符,汉字中有如下几个编码部件组合:构成汉字族,为此也定义为声符,汉字去掉这些编码部件组合的剩余部分就是形符,对于单个编码部件,不再拆分,整个编码部件视作声符,把汉字的声符作为拆分汉字的第一部分,汉字的形符作为拆分汉字的第二部分;本专利技术利用计算机的字母键盘、数字键盘或手机等其他对汉字字符信息进行处理装置的软、硬字母键盘、数字键盘,进行编码输入汉字、词语。具体的实现步骤如下:一、选定编码部件根据国家语委GF3001——1997《信息处理用GB13000.1字符集汉字部件规范》的要求,拆分汉字,确定参与编码的编码部件。选用GF3001——1997《信息处理用GB13000.1字符集汉字部件规范》的560个基础部件,选用GB0011——2009《汉字部首表》的201个主部首和100个附形部首,再选用含有560个基础部件中的若干非成字基础部件的汉字及汉字构件:卑、北、匆、曹、春、单、段、发、贯、亀、龜、庚、亥、壺、華、亦、、与、、堇、兼、可、婁、免、卯、南、囊、农、、棄、牽、其、妻、前、乌、烏、勿、网、行、叚、義、、以、制,共计44个,为了便于记忆使常用的数字类汉字与字符都定为编码部件又选用了:一、百、六、○,扣除重复计算数,总计选用了687个部件作为本汉字编码法采用的基本编码单元,称之为编码部件,并依照编码部件的构字理据相同、或写法稍异、或有所省减、或置向不同的变体、或互为繁、简字等关联性,归并成409个编码部件组,组内的第一个编码部件称为主形编码部件,有的编码部件由多个基础部件组成,如:風,在编码时要把它整体看作一个编码基本单元-——编码部件。在不违反GF3001规范的前提下,在这687个编码部件基础上允许增、减百分之二十的编码部件选用量,只对重码率略有影响,但不改变该编码输入法的实质。二、确定高频编码部件及其主部位位置以及高频编码部件的字母型主码构成汉字的五六百个部件中有三十多个被称之为部首的部件构字能力特别强,据本人统计它们大约构成了全部汉字的百分之四十左右,在这三十多个部首中,本专利技术确定了其中的31个构字能力特别强的部首为高频编码部件,在本专利技术确定的687个编码部件中除去31个高频编码部件其余的编码部件称之为普通编码部件。为了降低重码率,在同一字母键位上只设置一个或一组互为繁、简字体的高频编码部件,同时还确定了其主部位的位置,主部位位置就是该高频编码部件在构成汉字中通常所处的位置,为了降低重码率,其中高频编码部件:山、扌、、纟、糹、月、、亻、木、艹、訁、讠等9个编码部件组的12个高频编码部件不是以它们的读音或部首名称的汉语拼音的首字母作为它们的主码,而是人为指定。确定的31个高频编码部件的形状、字母型主码、主部位位置如表一所示:表一:31个高频编码部件在字母键盘盘面的布置如图1所示。上述31个高频编码部件以及字母型主码的设定,其数量与字母型主码的设定可以在不超出百分之四十的范围内变动,只对重码率有影响,但不改变编码方法的实质。三、确定每个编码部件的双拼类主码、副码1、副码2、副码3,形成汉字编码方法的双拼类编码资本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/CN105278697.html" title="组合式双拼类主副码汉字、词语编码输入法及其键盘原文来自X技术">组合式双拼类主副码汉字、词语编码输入法及其键盘</a>

【技术保护点】
组合式双拼类主副码汉字、词语编码输入法,利用计算机通用软、硬字母键盘或者手机、计算机的软、硬数字键盘,输入汉字、词语,其特征在于一、选定编码部件根据国家语委GF3001——1997《信息处理用GB13000.1字符集汉字部件规范》的要求,拆分汉字,确定参与编码的编码部件;选用GF3001——1997《信息处理用GB13000.1字符集汉字部件规范》的560个基础部件,选用GB0011——2009《汉字部首表》的201个主部首和100个附形部首,再选用含有560个基础部件中的若干非成字基础部件的汉字及汉字构件:卑、北、匆、曹、春、单、段、发、贯、亀、龜、庚、亥、壺、華、亦、、与、、堇、兼、可、婁、免、卯、南、囊、农、、棄、牽、其、妻、前、乌、鳥、勿、网、行、叚、羲、、以、制,共计44个,为了便于记忆使常用的数字类汉字与字符都定为编码部件又选用了:一、百、六、○,扣除重复计算数,总计选用了687个部件作为本汉字编码法采用的基本编码单元,称之为编码部件,并依照编码部件的构字理据相同、或写法稍异、或有所省减、或置向不同的变体、或互为繁、简字等关联性,归并成409个编码部件组,组内的第一个编码部件称为主形编码部件,有的编码部件由多个基础部件组成,如:風,在编码时要把它整体看作一个编码基本单元‑——编码部件。在不违反GF3001规范的前提下,在这687个编码部件基础上允许增、减百分之二十的编码部件选用量,只对重码率略有影响,但不改变该编码输入法的实质;二、确定高频编码部件及其主部位位置以及高频编码部件的字母型主码构成汉字的五六百个部件中有三十多个被称之为部首的部件构字能力特别强,据本人统计它们大约构成了全部汉字的百分之四十左右,在这三十多个部首中,本专利技术确定了其中的31个构字能力特别强的部首为高频编码部件,在本专利技术确定的687个编码部件中除去31个高频编码部件其余的编码部件称之为普通编码部件;为了降低重码率,在同一字母键位上只设置一个或一组互为繁、简字体的高频编码部件,同时还确定了其主部位的位置,主部位位置就是该高频编码部件在构成汉字中通常所处的位置,为了降低重码率,其中高频编码部件:山、扌、、纟、糹、月、、亻、木、艹、訁、讠等9个编码部件组的12个高频编码部件不是以它们的读音或部首名称的汉语拼音的首字母作为它们的主码,而是人为指定。确定的31个高频编码部件的形状、字母型主码、主部位位置如下面所示:上述31个高频编码部件以及字母型主码的设定,其数量与字母型主码的设定可以在不超出百分之四十的范围内变动,只对重码率有影响,但不改变编码方法的实质;二、确定每个编码部件的双拼类主码、副码1、副码2、副码3,形成汉字编码方法的双拼类编码资源已公知的汉语双拼方案很多,适用于本专利技术的双拼方案,要求在“;”分号键上和“′”单引号键上不安排表达任何声母或韵母之用,已公知的汉语双拼方案只要进行一定改变,满足上述条件都可成为本专利技术采用的双拼方案;本专利技术提出了A、B两大类汉语双拼方案。双拼A方案各个韵母定义在计算机及其他汉字字符信息处理装置的字母键位如下面所示:双拼A方案韵母定义在字母键位对照表采用双拼A1方案,韵母设置定义如《双拼A方案韵母定义在字母键位对照表》,声母Zh、Ch、Sh分别设置定义在Z、C、S字母键位上,其他声母分别设置在汉语拼音字母相一致的字母键位上,在汉语拼音中除有声母的和Y、W元音准声母以外的零声母汉字音节双拼表达如下:o=oo,a=oa,e=oe,eng=og,ng=on,ai=ai,ao=ao,an=an,ang=ag,ei=oz,en=en,er=er;选定的687个编码部件归并成409个编码部件组,其组内的第一个编码部件称之为主形编码部件,组内的其他编码部件的主码都与主形编码部件的主码一样,主形编码部件都有一定的读音或叫法,除高频编码部件的主码已确定了以外,其他主形编码部件的主码一般都取其读音或叫法名称的双拼中的拼音首个字母作为双拼类的字母型主码;为了降低重码率,采用点折I法:主形编码部件的读音的双拼的拼音首个字母为Y的,而且主形编码部件的首笔是点(丶)、折(乛)的取I作为其字母型主码,首笔为横(一)、竖(丨)、撇(丿)的取Y作为其字母型主码;普通编码部件与高频编码部件拼音类字母型副码1的确定:在确定的双拼方案中,取主形编码部件读音或名称的双拼的第2个字母作编码部件双拼类字母型副码1,同一编码部件组的各编码部件的字母型副码1与主形编码部件的完全相同;普通编码部件与高频编码部件的双拼类字母型副码2、副码3的确定:根据国家规范,汉字由横(一)、竖(丨)、撇(丿)、点(丶)折(乛)五种笔画组成,本专利技术依次用这五种笔画读音的汉语拼音的首个字母H、S、P、D、Z来表示;每个编码部件依次取首笔画、第2笔画的笔画的字母型码作为编码部件的字母型副...

【技术特征摘要】
1.组合式双拼类主副码汉字、词语编码输入法,利用计算机通用软、硬
字母键盘或者手机、计算机的软、硬数字键盘,输入汉字、词语,其特征在于
一、选定编码部件
根据国家语委GF3001——1997《信息处理用GB13000.1字符集汉字部件规范》
的要求,拆分汉字,确定参与编码的编码部件;
选用GF3001——1997《信息处理用GB13000.1字符集汉字部件规范》的560
个基础部件,选用GB0011——2009《汉字部首表》的201个主部首和100个附
形部首,再选用含有560个基础部件中的若干非成字基础部件的汉字及汉字构
件:卑、北、匆、曹、春、单、段、发、贯、亀、龜、庚、亥、壺、華、亦、
、与、、堇、兼、可、婁、免、卯、南、囊、农、、棄、牽、其、妻、
前、乌、鳥、勿、网、行、叚、羲、、以、制,共计44个,为了便于记忆使
常用的数字类汉字与字符都定为编码部件又选用了:一、百、六、○,扣除重
复计算数,总计选用了687个部件作为本汉字编码法采用的基本编码单元,称
之为编码部件,并依照编码部件的构字理据相同、或写法稍异、或有所省减、
或置向不同的变体、或互为繁、简字等关联性,归并成409个编码部件组,组
内的第一个编码部件称为主形编码部件,有的编码部件由多个基础部件组成,
如:風,在编码时要把它整体看作一个编码基本单元-——编码部件。在不违反
GF3001规范的前提下,在这687个编码部件基础上允许增、减百分之二十的编
码部件选用量,只对重码率略有影响,但不改变该编码输入法的实质;
二、确定高频编码部件及其主部位位置以及高频编码部件的字母型主码
构成汉字的五六百个部件中有三十多个被称之为部首的部件构字能力特别
强,据本人统计它们大约构成了全部汉字的百分之四十左右,在这三十多个部
首中,本发明确定了其中的31个构字能力特别强的部首为高频编码部件,在本
发明确定的687个编码部件中除去31个高频编码部件其余的编码部件称之为普
通编码部件;
为了降低重码率,在同一字母键位上只设置一个或一组互为繁、简字体的高
频编码部件,同时还确定了其主部位的位置,主部位位置就是该高频编码部件
在构成汉字中通常所处的位置,为了降低重码率,其中高频编码部件:山、扌、
、纟、糹、月、、亻、木、艹、訁、讠等9个编码部件组的12个高频编码
部件不是以它们的读音或部首名称的汉语拼音的首字母作为它们的主码,而是
人为指定。确定的31个高频编码部件的形状、字母型主码、主部位位置如下面
所示:
上述31个高频编码部件以及字母型主码的设定,其数量与字母型主码的设
定可以在不超出百分之四十的范围内变动,只对重码率有影响,但不改变编码
方法的实质;
二、确定每个编码部件的双拼类主码、副码1、副码2、副码3,形成汉字
编码方法的双拼类编码资源
已公知的汉语双拼方案很多,适用于本发明的双拼方案,要求在“;”分号
键上和“′”单引号键上不安排表达任何声母或韵母之用,已公知的汉语双拼方
案只要进行一定改变,满足上述条件都可成为本发明采用的双拼方案;
本发明提出了A、B两大类汉语双拼方案。双拼A方案各个韵母定义在计算机及
其他汉字字符信息处理装置的字母键位如下面所示:
双拼A方案韵母定义在字母键位对照表
采用双拼A1方案,韵母设置定义如《双拼A方案韵母定义在字母键位对照
表》,声母Zh、Ch、Sh分别设置定义在Z、C、S字母键位上,其他声母分别设
置在汉语拼音字母相一致的字母键位上,在汉语拼音中除有声母的和Y、W元音
准声母以外的零声母汉字音节双拼表达如下:o=oo,a=oa,e=oe,eng=og,ng=on,
ai=ai,ao=ao,an=an,ang=ag,ei=oz,en=en,er=er;
选定的687个编码部件归并成409个编码部件组,其组内的第一个编码部
件称之为主形编码部件,组内的其他编码部件的主码都与主形编码部件的主码
一样,主形编码部件都有一定的读音或叫法,除高频编码部件的主码已确定了
以外,其他主形编码部件的主码一般都取其读音或叫法名称的双拼中的拼音首

\t个字母作为双拼类的字母型主码;为了降低重码率,采用点折I法:主形编码部
件的读音的双拼的拼音首个字母为Y的,而且主形编码部件的首笔是点(丶)、
折(乛)的取I作为其字母型主码,首笔为横(一)、竖(丨)、撇(丿)的取Y
作为其字母型主码;
普通编码部件与高频编码部件拼音类字母型副码1的确定:在确定的双拼
方案中,取主形编码部件读音或名称的双拼的第2个字母作编码部件双拼类字
母型副码1,同一编码部件组的各编码部件的字母型副码1与主形编码部件的完
全相同;
普通编码部件与高频编码部件的双拼类字母型副码2、副码3的确定:根据
国家规范,汉字由横(一)、竖(丨)、撇(丿)、点(丶)折(乛)五种笔画组
成,本发明依次用这五种笔画读音的汉语拼音的首个字母H、S、P、D、Z来表
示;每个编码部件依次取首笔画、第2笔画的笔画的字母型码作为编码部件的
字母型副码2、字母型副码3;对于不足2个笔画构成的编码部件,缺失的第2
个笔画的,确定都取字母V;
根据上述方法确定本发明的409个编码部件组的687个编码部件的字母型
主码、第1、第2、第3笔画码,双拼方案采用A1方案,对于不足2个笔画构
成的编码部件,确定都采用字母V补足的方案;主形编码部件的读音的拼音首
个字母为Y的,采用点折I法,表四中双拼类字母型主副码,为了看得醒目采用
了大写字母,它与小写字母等效,在实际编码时,编码表采用小写字母;根据
上述方法确定本发明的409个编码部件组的687个编码部件的字母型主码、第1、
第2、第3笔画码,如下面所示:
四、转换取得各编码部件双拼类数字型主码、副码1、副码2、副码3码,形成
双拼类数字型编码资源
根据国家标准GB/T18031—2000《信息技术数字键盘汉字输入通用要求》,对
编码部件拼音类字母型的副码2、副码3涉及到五类笔画的,都以该标准的“汉
字笔画的键位设定”的规定转换成数字码,而不是以笔画名称的汉语拼音首字
母转换成相应的数字码,除上述情况以外,编码部件的各类字母型主码、副码1
以及拼音首字母等的其他字母,以该标准的“10键位汉语拼音字母键位设定”
和“8键位汉语拼音字母键位设定”的规定的字母与数字的对应关系,分别依次
转换成10键位法拼音类数字型主码、副码1、副码2、副码3与8键位拼音类
数字型主码、副码1、副码2、副码3以及拼音首字母的数字码;对于高频编码
部件,在上述转换所得的各类数字型主、副代码的基础上,略作调整使各高频
编码部件的各类数字型主码、副码1的数字组合,在同一类型中相互间都不相
同,具体方案如表八所示;上述转换方案称之为字母笔画不同式转换方案;“汉
字笔画的键位设定”如下面所示:
“10键位汉语拼音字母键位设定”如下面所示;
“8键位汉语拼音字母键位设定”如下面所示:
“字母笔画不同式转换方案”的高频编码部件的双拼类数字型主码、副码1、副
码2、副码3,用数字键盘的相应的数字键依次表达,31个高频编码部件方案的
高频编码部件双拼类数字型主副码,具体方案如下面所示:
五、组合式拼音类主副码汉字、词语编码输入法
在汉字拆分时,除双拼类主副码字母型部首汉字编码方法采用部首拆分法,

\t双拼类主副码字母型声系汉字编码方法采用声符拆分法外,其他各种汉字、词
语编码方法都采用通用拆分法,取拆分编码部件采用笔画多的在先的那一种;
字母型转换成数字型,采用字母笔画不同式转换方案;采用“8键位汉语拼音字
母键位设定”规定的字母与数字的对应关系,由字母型码转换成数字型码;
组合式双拼类主副码汉字、词语编码输入法由组合式双拼类主副码字母型
汉字、词语编码输入法和组合式双拼类主副码数字型汉字、词语编码输入法两
部分组成,把两部分编码设置在不同码表上切换调用;
第一部分组合式双拼类主副码字母型汉字、词语编码输入法
利用双拼类字母型编码资源,形成组合式双拼类主副码字母型汉字、词语
编码输入法包含有:①双拼类拼音首字母主副码字母型汉字编码方法;②双拼
类双拼加编码部件主副码字母型汉字编码方法;③双拼类非拼音首字母主副码
字母型汉字编码方法④双拼类主副码字母型部首汉字编码方法⑤双拼类主副码
字母型声系汉字编码方法;⑥双拼类拼音首字母主副码字母型词语编码方法;
⑦双拼类非拼音首字母主副码词语编码方法;针对常用汉字、常用词语和
GB18030的27000多汉字字符集等的大字符集的汉字的编码输入,进行组合编
码输入操作:对常用汉字、词语采用双拼类拼音首字母字母型汉字编码方法、
双拼类拼音首字母字母型词语编码方法编码,对于GB18030的27000多汉字采
用双拼类非拼音首字母主副码字母型汉字编码方法,取得编码;双拼类拼音首
字母主副码字母型汉字编码方法、双拼类拼音首字母主副码字母型词语编码方
法与双拼类非拼音首字母字母型汉字编码方法取得的编码,组合在同一张码表;
双拼类字母型汉字、词语的编码方法如下:
在以下的叙述中,规定:对一个编码部件取1码,即取其字母型主码,取2码,
即依次取其字母型主码、副码1,取3码,即依次取其字母型主码、副码1、副
码2;取4码,即依次取其字母型主码、副码1、副码2、副码3;
(一)双拼类拼音首字母主副码字母型汉字编码方法
A、码长不定,确定采用双拼类字母型编码资源;
B、单个编码部件的汉字的编码:如果该汉字的拼音首字母与该编码部件的字母
型主码相同:对于是高频编码部件的,则依次取该编码部件的字母型主码、副
码1;对于是普通编码部件的,采用四码法,依次取该编码部件的字母型主码、
副码1、副码2、副码3;如果该汉字的拼音首字母与该编码部件的字母型主码
不相同的,又是高频编码部件的,采用替代三码法,则依次取该汉字的拼音首
字母、该高频编码部件的副码1、副码2;如果该汉字的拼音首字母与该编码部
件的字母型主码不相同的,又是普通编码部件的,而且字母型主码不是i的,采
用取代四码法,依次取该汉字的拼音首字母、该编码部件的字母型副码1、副码
2、副码3;如果该汉字的拼音首字母为y而编码部件的字母型主码为i的,采
用替代四码法,则依次取该汉字的拼音首字母、该编码部件的字母型副码1、副
码2、副码3;
C、2个或2个以上编码部件组成的汉字,汉字可以分成首部与余部两部分;
D、对于由2个或2个以上的编码部件组成的汉字,分如下二个部分依次确定其
字母型编码:
第1部分,取根据汉字的汉语拼音的首字母作为第1部分的字母型编码;
第2部分,以下述方法取汉字的首部和余部的编码:
对于由2个的编码部件组成的汉字字母型编码方法:如果首部是一个处于主部
位的高频编码部件的,采用三码法,则依次对首部那个编码部件取1码,对余
部那个编码部件取2码;如果首部件编码部件是普通编码部件的,采用一二法,
则依次对首部那个编码部件取1码,对余部那个编码部件取2码;
对于由3个或3个以上的编码部件组成的汉字:如果是单首部汉字,又如果首
部是一个处于主部位的高频编码部件的,则依次取第1、第2、第末个编码部件
各1码;如果是单首部汉字,又如果首部是一个普通编码部件,采用首一法,
则依次取第1、第2、第末个编码部件各1码,如果其首部为组合首部的汉字,
则该组合首部取2码,采用首末法,依次对组合首部的第1、第末个编码部件各
取1码,其余部为单个编码部件,取1码;
把上述第1、第2两部分取的字母型编码,依次组合成整个汉字的编码;
E、编码时,采用英文小写字母;
(二)双拼类非拼音首字母主副码字母型汉字编码方法
A、码长不定,采用双拼类字母型编码资源;
B、单个编码部件的汉字:如果该编码部件是高频编码部件的,则依次取其字母
型主码、字母型副码1;如果是普通编码部件的:采用四码法,则依次取其字母
型主码、副码1、副码2、副码3;
C、由2个或2个以上编码部件组成的汉字:可以分成首部与余部两部分;
D、对于由2个的编码部件组成的汉字字母型编码方法:如果首部是一个处于主
部位的高频编码部件的,采用三码法,则依次对首部那个编码部件取1码,对
余部那个编码部件取2码;如果首部件编码部件是普通编码部件的,采用二二
法,则依次对首部那个编码部件取2码,对余部那个编码部件取2码;
E、对于由3个编码部件组成的汉字:,如果首部是一个单首部,又是一个处于
主部位的高频编码部件的,采用末二法,则依次对首部的那个高频编码部件取1
码、余码的第1编码部件取1码、余部的第2编码部件取2码;如果首部是一
个单首部,又是一个普通编码部件的,采用首二法,则依次对首部的那个编码
部件取2码,余部的第1、第2编码部件各取1码;如果首部是组合首部,则依
次对组合首部的第1、第2个编码部件各取1码,余部的那个编码部件取2码;
F、对于由4个或4个以上的编码部件组成的汉字:如果首部是个单首部的,又
是处于主部位的高频编码部件的,则依次取首部的那个编码部件1码、余部的
第1、第2、第末个编码部件各1码;如果首部是一个单首部,又是一个普通编
码部件的,采用首二法,则依次对汉字的首部那个编码部件取2码、余部的第1、
第末个编码部件各取1码;如果首部是组合首部,对于组合首部取码方案,采
用组合首部首、次、末取码法,即依次对组合首部的第1、第2、第末个编码部
件各取1码,汉字的余部那个部件取1码;
把上述汉字各编码部件取的编码,以编码部件在汉字组成中的先后为序,依次
组成整个汉字的编码;
G、编码时,采用英文小写字母;
(三)双拼类拼音首字母主副码字母型汉语词语编码方法
A、采用双拼类字母型编码资源,依据双拼类拼音首字母汉字编码方法取得的汉
字编码,取词语的编码;词语编码的最长码长设定为6;
B、对于由2个汉字组成的词语,采用二二法,依次对第1个汉字、第2个汉字
各取2码;
C、对于由3个汉字组成的词语,采用一一二法,则依次取第1个汉字1码、第
2个汉字1码、第3个汉字2码;
D、对于由4个汉字组成的词语,采用四码法,则依次取第1、第2、第3、第4
个汉字的各取1码;
E、对于由5个汉字组成的词语,采用五码法,则依次取第1、第2、第3、第4、
第5个汉字各1码;
F、对于由6个或6个以上汉字组成的词语,顺六法,依次取词语的第1、第2、
第3、第4、第5、第6个汉字各1码;
G、编码时,采用英文小写字母;、
(四)双拼类非拼音首字母主副码字母型汉语词语编码方法
利用确定的双拼类非拼音首字母主副码字母型汉字编码输入法对每个汉字
的编码,实施对汉语词语的非拼音首字母编码;词语编码的最长码长设定为6;
对一个汉字取2码:如果是由二个或二个以上编码部件组成的汉字,采用首次
法,即依次取该汉字的第1、第2个编码部件的字母型主码;
A、对于由2个汉字组成的词语编码,采用二三法,即依次取该词语的第1个汉
字2码、第2个汉字3码;
B、对于由3个汉字组成的词语编码:采用末二法,即依次取该词语的第1、第
2个汉字各1码、第3个汉字2码;
C、对于由4个汉字组成的词语编码,采用四码法,即依次取该词语的第1、第
2、第3、第4个汉字各1码;
D、对于由5个汉字组成的词语编码,依次取该词语的第1、第2、第3、第4、
第5个汉字各1码;
E、对于由6个或6个以上汉字组成的词语编码,采用顺六法,依次取该词语的
第1、第2、第3、第4、第5、第6个汉字各取1码;
F、编码时,采用英文小写字母;
第二部分:组合式双拼类主副码数字型汉字、词语编码输入法
利用双拼类数字型编码资源实施组合式双拼类主副码数字型汉字、词语编
码输入;码长不定,最大码长设定为6;
采用双拼类数字型编码资源的组合式双拼类主副码数字型汉字、词语编码
输入法包含有:①双拼类基于拼音首字母主副码数字型汉字编码方法;②双拼
类基于双拼的主副码数字型汉字编码方法;③双拼类基于拼音首字母主副码数
字型词语编码方法;④双拼类基于非拼音首字母主副码数字型汉字编码方法;
⑤双拼类基于非拼音首字母主副码数字型词语编码方法,针对GB2312的6763
个常用汉字、常用词语(或汉语大词语集)和GB18030的27000多个汉字字符
集等的大字符集的汉字的编码输入,采用如下组合编码输入操作:对常用汉字

\t与常用词语库采用双拼类基于拼音首字母数字型汉字、词语编码输入法,对于
GB2312的全部汉字乃至GB18030-2000的汉字集采用双拼类基于非拼音首字母
主副码数字型汉字编码方法取得的编码,组织在同一张码表;...

【专利技术属性】
技术研发人员:黄振荣
申请(专利权)人:黄振荣
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1