当前位置: 首页 > 专利查询>黄振荣专利>正文

组合式音形义汉字编码输入法制造技术

技术编号:2866542 阅读:540 留言:0更新日期:2012-04-11 18:40
组合式音形义汉字编码输入法,根据GF3001规范选取702个编码部件,归成404个编码部件组,并归纳成25个义类,主要根据拼音首字母,赋予部件字母型代码、义类码,并根据GB/T18031-2000把字母码转换成数字码,利用字母型和数字型编码资源提出了组合式字母型汉字编码输入法、组合式数字型汉字编码输入法等两类汉字编码输入法,输入法采用拼音首字母与非拼音首字母两类编码方法组合而成,适应以词输入为主的趋势,又解决了读不准音的汉字的输入,平均码长、重码字词键选率能达到国家标准规范的要求,重码率也处于先进水平。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术属于用于计算机或其他对汉字字符信息进行处理装置的汉字编码输入方法。
技术介绍
本专利技术是对本申请人在此前提出的申请号为03112606.5专利技术专利技术申请案的一个实施方案。专利技术目的本专利技术的目的是提出实施03112606.5号专利申请案的一类更适用于以词语输入为主的汉字编码输入的具体实施方案。
技术实现思路
本专利技术的计算机使用的组合式音形义汉字编码输入法,利用计算机通过字母键盘或者手机、计算机的数字键盘,输入汉字或词语,具体的实现步骤如下一、根据主形编码部件的含义归并设定25类编码部件字母型义类码,具体如下所示 二、设定编码部件字母型代码、编码部件字母型义类码根据GF3001规范要求,选取编码部件。选定的编码部件根据义相同或形相近等明显关联性,归并成编码部件组,并从每个编码部件组中选定一个主形编码部件作代表,每个编码部件赋予与其编码部件组的主形编码部件完成相同的编码部件字母型代码和编码部件字母型义类码。为了更好适用于以词语输入为主的现代汉语文字的计算机或其他对汉字字符信息进行处理、存储、传输、显现、输入和输出装置的汉字输入,本专利技术对编码部件的设置和编码部件的字母型代码和字母型义类码的设置等又进行了一些新的设定。对于不是以汉语拼音首字母作编码部件字母型代码的有构词能力的成字编码部件,都再增设一个以其汉语拼音首字母作代码的编码部件字母型代码;还把一些非拼音首字母的成字编码部件的字母型全码改成拼音首字母的编码部件字母型全码;还对部分非成字编码部件以其与另一个编码部件组成的一个汉字增设为该编码部件组的主形编码部件;还调整、增加了一些编码部件;还对一些有两种字义和两种读音的编码部件增加了只作表达其成字编码部件的拼音首字母编码部件字母型全码,具体有“一”字母型全码为“YN”;“月”字母型全码为“YO”;“孑”字母型全码为“JC”;“行”字母型全码为“HF”。本汉字编码输入法设定的404个编码部件组中702个编码部件的部件形状、部件字母型代码、部件字母型义类码对照列于对照表《404个编码部件组、702个编码部件的编码部件字母型代码、编码部件字母型义类码对照表)》。为了叙述方便,把那些具有两种编码部件字母型代码的一类编码部件称之为双代码编码部件,只有一种编码部件字母型代码的一类编码部件称之为单代码编码部件;又把双代码编码部件中把以拼音首字母作编码部件字母型代码的编码部件的代码,称之为双代码编码部件拼音首字母字母型代码,简称首音字母型代码;把以非拼音首字母作编码部件字母型代码的编码部件的代码,称之为双代码编码部件非拼音首字母字母型代码,简称非首音字母型代码。那些单代码编码部件中除一些没有独立构词能力的编码部件以外,都是以拼音首字母作编码部件代码。在编码部件的设定方面,当然还可以再增加一些或再减少一些编码部件,这只对编码输入法的重码率、重码字词键选率等技术指标产生一些影响,但对整个汉字编码输入法不构成根本性影响。根据《对照表》的每个编码部件的字母型代码,把它分配设置在计算机通用字母键盘相应的字母键位上;同样根据上述《对照表》的每个编码部件的字母型义类码,把它分配设置在计算机通用键盘的相应的字母键上。这样,每个字母键位上,设置了具有相同字母型代码的编码部件集合和具有相同字母型义类码的另一个编码部件集合,这字母键的字母也就成为这些编码部件的字母型代码,同样也成为那些编码部件的字母型义类码。三、设定27个含有构字能力特别强的主形编码部件的组为高频编码部件组,确定其组内的各个高频编码部件共计35个,高频编码部件在汉字结构中的主部位位置,具体见附图1《27个高频编码部件组的部件组号、高频编码部件的部件序号、基础部件表号、高频编码部件、部件字母型代码、部件字母型义类码、取码提示及其主部件位置对照表》。四、设定字母码、编码部件字母型代码、字母型义类码转换成数字码、数字型代码、数字型义类码的方式,以及设定编码部件数字型全码为了在计算机数字键盘或者手机数字键上实现组合式音形义数字型汉字编码输入,把字母码及每个编码部件字母型代码、字母型义类码,根据GB/T18031-2000《信息技术数字键盘汉字输入通用要求》以如下两种方式转换成数字码及相应的数字型代码、数字型义类码第一种转换法,10键位法以1个数字码替换相应的几个字母码,具体为以1替换a、b、c;以2替换d、e、f;以3替换g、h、i;以4替换j、k;以5替换l、m;以6替换n、p;以7替换o、q、r;以8替换s、t、u;以9替换w、x;以0替换y、z。从而得到编码部件相应的数字型代码、数字型义类码以及拼音首字母的字母码转换成的数字码。对于双代码编码部件,只采用双代码编码部件拼音首字母字母型代码及其编码部件义类码转换成相应的数字型代码、数字型义类码;为了降低重码率,对于“广”、“女”、“石”三个编码部件组的编码部件不以上述方式转换,而定义其编码部件数字型代码加上数字型义类码分别为33、66、74;对于五类汉字笔画也不以上述方式转换,而定义为“一”横类笔画数字型代码为1;“丨”竖类笔画数字型代码为2;“丿”撇类笔画数字型代码为3;“丶”点类笔画数字型代码为4;“乛”折类笔画数字型代码为5;所有笔画类数字型义类码都为7。第二种转换法,8键位法以1个数字码替换相应的几个字母码,具体为以2替换a、b、c;以3替换d、e、f;以4替换g、h、i;以5替换j、k、l;以6替换m、n、o;以7替换p、q、r、s;以8替换t、u;以9替换w、x、y、z;从而得到编码部件相应的数字型代码、数字型义类码;对于双代码编码部件,只采用双代码编码部件拼音首字母字母型代码、字母型义类码转换成相应的数字型代码、数字型义类码;为了降低重码率,定义“言”、“广”、“月”、“石”、“木”、“心”编码部件组,其数字型代码加上数字型义类码分别为46、44、96、74、89、94。对于五类汉字笔画,也不以上述方式转换,而定义为“一”横类笔画数字型代码为1;“丨”竖类笔画数字型代码为2;“丿”撇类笔画数字型代码为3;“丶”点类笔画数字型代码为4;“乛”折类笔画数字型代码为5;所有笔画类数字型义类码都为6。为了降低重码率,每个编码部件的数字型全码定义为编码部件数字型代码+编码部件数字型义类码+编码部件的首笔画或者末笔画的部件数字型代码。由于所取笔画前后位置不同,每个编码部件能得到两类数字型全码,一种称为首笔画数字型全码,另一种称为末笔画数字型全码,相应能设计成两类数字型汉字编码输入法。为了便于叙述,规定对某编码部件取3码,就是依次取其数字型全码;取2码,就是依次取其数字型代码和数字型义类码;取1码,就是取其数字型代码。对于高频编码部件首笔画数字型全码如附图2《27个高频编码部件的部件组号、高频编码部件的部件序号、基础部件表号、高频编码部件、部件字母型代码、部件字母型义类码、10键位首笔数字型全码、8键位首笔数字型全码,取码提示及其主部件位置对照表》中所示。五、组合式音形义汉字编码输入法利用上述方法形成的字母型汉字编码资源可以实现组合式音形义汉字的字母型编码输入,利用上述方法形成的数字型汉字编码资源可以实现组合式音形义汉字的数字型编码输入。组合式音形义汉字编码输入法由组合式音形义字母型汉字编码输入法和组合式本文档来自技高网...

【技术保护点】
一种组合式音形义汉字编码输入法,利用计算机通用字母键盘或者手机、计算机的数字键盘,输入汉字、词语,其特征在于:一、根据主形编码部件的含义归并设定了25类义类并赋一个字母作义类码,编码部件的25类编码部件义类名称、字母型义类码如下所示:***二、选定的编码部件根据义相同或形相近等明显关联性,归并成404个编码部件组,并从每个编码部件组中选定一个主形编码部件作代表,每个编码部件赋予与其编码部件组的主形编码部件完全相同的编码部件字母型代码和编码部件字母型义类码,404个编码部件组中702个编码部件的部件形状、部件字母型代码、部件字母型义类码对照列于下面:***三、设定27个构字能力特别强的主形编码部件组,确定其组内的各个高频编码部件,共计35个,高频编码部件以及其在汉字结构中的主部位的位置,对照列于下面:***四、利用上述字母型汉字编码资源形成组合式音形义字母型汉字编码输入法,其编码方法可由拼音首字母音形义字母型汉字编码方法和非拼音首字母音形义字母型汉字编码方法中各任选一种组合而成;两种汉字编码方法和词语编码方法如下所述:(一)拼音首字母音形义字母型汉字编码方法可以是4码法拼音首字母混合式a式音形义首部余部字母型汉字编码方法,实现编码的具体方法如下所述:码长设定为4;成字编码部件的编码:对于双代码编码部件,依次取双代码编码部件拼音首字母字母型代码、字母型义类码,即双代码编码部件拼音首字母字母型全码;对于单代码编码部件,依次取其编码部件字母型代码、字母型义类码,即单代码编码部件字母型全码;对于2个或者2个以上编码部件组成的汉字,取编码时,涉及到双代码编码部件取码时,采用双代码编码部件非拼音首字母字母型代码、字母型义类码;首编码部件为高频编码部件的合体汉字其取码技术方案为:对于由2个编码部件组成的汉字,先取该汉字汉语拼音首字母、再依次取第1编码部件字母型代码、第2编码部件字母型代码、第2编码部件字母型义类码;对于由3个或3个以上编码部件组成的汉字,先取该汉字汉语拼音首字母、再依次取第1编码部件、第2编码部件、末编码部件的字母型代码;对于首编码部件为非高频编码件的由2个或者2个以上编码部件组成的汉字,先取该汉字汉语拼音首字母,再依次取首编码部件字母型代码、首编码部件字母型义类码、末编码部件的字母型代码,其公式表示:汉字拼音首字母+首部件字母型代码+首部件字母型义类码+末部件字母型代码(二)非拼音首字母音形义字母型汉字编码方...

【技术特征摘要】

【专利技术属性】
技术研发人员:黄振荣
申请(专利权)人:黄振荣
类型:发明
国别省市:32[中国|江苏]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1