当前位置: 首页 > 专利查询>林述文专利>正文

一种用于计算机的汉字部件分类编码输入方法技术

技术编号:2885682 阅读:440 留言:0更新日期:2012-04-11 18:40
本发明专利技术系计算机用汉字键盘输入编码系统,特点是:将组件分类为字组件、常用非字组件、一般非字组件、基本组件、复合组件和子组件;字组件的代码与字的读音相关,常用非字组件的代码与组件名称或称谓相关,一般非字组件按类取代码;对各码位拆取组件类型作出具体限定,以形成多种风格特点的取码方案,并使同一方案下拆分取码具有唯一确定性。本发明专利技术重码少,易掌握,普通人员和专业录入人员均可使用。(*该技术在2019年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种计算机用汉字输入编码系统,特别是一种涉及与汉字的字形结构相关的汉字键盘输入编码系统。现有的凡涉及与汉字的字形结构相关的汉字键盘输入编码系统,在标准西文键盘上实现汉字输入,若要使重码较少,均必定使编码组件(组字结构有字根或部件等不同称谓,本专利技术称其为组件)达到相当数量,从而造成记住组件及组件代码相当不容易,而且,虽然使用的组件多,但也只是选取了组字组件的一部分,甚至是少部分,造成拆分困难和拆分不规范;选用少量组件的普及型输入编码系统,不仅重码多,而且拆分困难和拆分不规范的问题更加突出。本专利技术为了克服现有编码系统的上述缺点,提出一种编码系统,其组件集可以选得足够大,所选组件甚至于比《信息处理用GB13000.1字符集汉字部件规范》(以下简称《汉字部件规范》)中的基础部件还多,并且组件的选用和拆分都符合《汉字部件规范》,但是组件及代码的记忆量却很小,实现的编码方案多样而灵活,重码少,易于掌握,普通人员和专业录入人员均可使用。本专利技术的特点是把众多的组件进行适当地分类,并给以适当的代码规定,组件拆分规定和取码规定,具体规定是①将组字组件区分为字组件、常用非字组件、一般非字组件、基本组件、复合组件和子组件几种类型,组件本身为一个字的组件为字组件,而且规定凡是字均可以作组件,常用非字组件大多为常用现代汉语字典中的非字部首,一般非字组件按其结构或笔划特征归成类别,复合组件与基本组件是从组件的可分性出发来区分的,不可进一步拆分的组件为基本组件,可拆分的组件为复合组件,按《汉字部件规范》确定可分性,构成复合组件的次一级组件成分称为子组件。②组件代码规定字组件的代码与字的读音相关,常用非字组件的代码与组件名称或称谓相关,一般非字组件按类取代码。③组件拆分取码规定以拆分出的组件的代码组成字的编码,凡可拆分的字均应进行拆分取码,按组件书写顺序进行拆分,交重不拆,并对各取码位拆取组件的类型作出具体地限定,以形成多种风格特点的取码方案,并使同一方案下拆分取码具有唯一确定性。④组件少、码位不足时可以取补充码。⑤可以字词结合取码。有了以上规定①和②,便于识别众多的组件和记住组件代码。这是因为第一、字组件用不着专门记忆,只要在使用拆分规则对字进行拆时可以自然明白,至于字组件的代码,如取单代码,可以取拼音第一字母为代码;如取双代码,可取其双拼为代码,甚至可以取全拼为代码,这要视具体所选编码方案而定,每个使用者可灵活选用。第二、由于常用非字组件大多是字典中所选非字部首,人们熟悉它们,又由于原则上代码与其名称或称谓相关,易于一一记识它们。第三、一般非字组件虽然众多,但记住了量不大的常用非字组件,剩下的非字组件就属于这一大类了,再加上我们按其结构或笔划特征进行分类,再按类取码,我们只要记住划类规定和少数类码就掌握了众多的一般非字组件,例如我们规定凡起笔为“撇”(“丿”)的一般非字组件归为一类,并以“p”为代码,那么只要见到 等会自然掌握它们,哪怕你事先并不知道有 ,在按规则取码时,遇到“段、卑、姊”等字时,自然从直觉上就可以看出 为组件,且又不是字组件,自然就是非字组件,又因为在常用非字组件中没有选它们,所以很容易地辨认出它们是一般非字组件,其第一笔为撇笔,其代码也确定了。以撇笔为起笔的组件有几十个,我们事先并不用一一记住它们,和上面举例情况一样,在对字的拆分时可以很容易地识别它们。其他类别的一般非字组件也是同样地易于识别。根据①和③关于复合组件、基本组件和子组件的规定及组件拆分规定结合起来,不同的组件拆分规定形成不同风格特点的编码方案,在同一风格的编码方案下可以保证拆分取码的唯一性,同时可在编码过程中掌握字组件。举例加以说明我们事先选定在各方案中 等为常用非字组件,考查“确”和“葆”两字,两字中有 等常用非字组件,有“石、角、用、保、呆、口、木”等字组件,“角、用、保、呆”是复合组件, 等是基本组件。如不确定具体拆分规则,则对上述两字的拆分就不确定,对于“确”字,可拆分为“石、角”, 等几种部件组合,“葆”字也有多种拆分法,正是有这种多样的拆分法,可以形成多种风格特点的方案。按照第③条,对各取码位所取组件类型作出不同规定,就可得到不同风格特点的编码方案,在同一方案下,拆分是唯一的,编码也就是唯一的。我们试举出三种规定,也即有三种可供选择的方案。第一个方案按一般采用较多的取大优先的原则,“确”和“葆”只能分别拆分为“石、角”和“ 保”。第二个方案规定只能取基本组件,“确”和“葆”只能分别拆为“石、 第三个方案规定第二码位组件只取基本组件,其他码位组件取大优先,“确”和“葆”只能分别拆分为“石、 、用”和“ 呆”。根据规定④,可以减少重码。有些字由于组件少,也由于有的取码方案,如第一种和第二种方案,容易导致取码组件少,码位不足,特别按上述第一方案很多字只能取足二码,这时要取补充码。在具体使用时,为了减少重码,可以有针对性地规定取补充码的规则。例如规定从取过码的组件中寻求结构特征作为补取补充码的依据,例如对于第三方案,“确”字经拆分成的组件中,有复合组件“用”,它由“冂”及 组成,可以 的代码作为“用”的辅助特征码之一,并取其作为补充码,“葆”字经拆分成的组件中,有复合组件“呆”,可做上述类似处理。还可做出取补充码的其它规定。根据⑤可以提高编码效率和输入效率。我们可以看到,只要拆分取码规则定了,具体到每个字,拆分是唯一确定的,因此,很自然地,字组件、常用非字组件和一般非字组件都是确定的。可以通过不同的拆分规则限定,产生不同的编码方案,以上举出的三种限定,可产生三套方案,实际上还可以有别的限定。可按使用者的需要灵活使用。根据上述规定及举例说明,显示本编码系统有如下优点第一,编码系统的组件选用和拆分合理,且符合《汉字部件规范》规定。按照上述举例的第二方案,所使用的组件刚好只是《汉字部件规范》中的基础部件;按照方案一和方案三,除使用《汉字部件规范》中的基础部件之外,还要使用一些基础部件以外的字部件,《汉字部件规范》允许将基础部件组合成字作为部件使用,《汉字部件规范》允许使用的这种字部件就是本编码系统的复合组件,即本编码系统符合“基础部件可以组合的规则”;拆分规则符合《汉字部件规范》“交重不拆”的原则和“基础部件不再拆分的规则”,本专利技术在拆分规则中明确了“交重不拆”,同时在各实施方案中,在具体拆分时坚持与《汉字部件规范》中“基础部件不再拆分的规则”一致,这理所说的基本组件对应于《汉字部件规范》中的基础部件。如上述“确”字,一般容易把其中的“石”作为 两个组件,但本专利技术按《汉字部件规范》将其作为一个基础部件,上述方案二中规定只取基本组件,我们便未将“石”拆分为 和“口”。第二,记忆量小,易于掌握。所要记忆的是常用非字组件及其代码(本系统只选用了不到100个非字组件)、简单的拆分规则、一般非字组件的类别特征及其代码(本系统只选几个类),巧妙地实现了大组件集记忆量小;记住了上述内容,再加上能认识一定数量的字,具有一定拼音知识,就可以顺利使用本编码系统。第三,本系统重码低,其重码低到可以供专业人员实现盲打。因此其使用效果是专业级的,而其易用性却不亚于现行的主要以易用为目的的普及型编码系统。第四,实现方案多样而灵活,使得该编码系本文档来自技高网...

【技术保护点】
一种涉及与汉字的字形结构相关的汉字输入编码系统,特别是一种涉及与汉字的字形结构相关的汉字键盘输入编码系统,其特征在于:①将组字组件(本专利技术将组字结构称为组件)区分为字组件、常用非字组件、一般非字组件、基本组件、复合组件和子组件几种类型。组件本身是一个字的组件称为字组件,而且规定凡是字均可以作组件,常用非字组件大多为常用现代汉语字典中的非字部首,一般非字组件按其结构或笔划特征归成类别,根据组件的可分性来区分复合组件与基本组件,不可进一步拆分的组件称为基本组件,可拆分的组件称为复合组件,按《信息处理用GB13000.1字符集汉字部件规范》(以下简称《汉字部件规范》)确定可分性,构成复合组件的次一级组件成分称为子组件。②组件代码规定:字组件的代码与字的读音相关,常用非字组件的代码与组件名称或称谓相关,一般非字组件按类取代码。③组件拆分取码规定:以拆分出的组件的代码组成字的编码,凡可拆分的字均应进行拆分取码,按组件书写顺序进行拆分,交重不拆,并对各码位拆取组件的类型作出具体限定,以形成多种风格特点特点的编码方案,并使同一方案下拆分取码具有唯一确定性。④组件少、码位不足时可以取补充码。⑤可以字词结合取码。...

【技术特征摘要】

【专利技术属性】
技术研发人员:林述文
申请(专利权)人:林述文
类型:发明
国别省市:85[中国|重庆]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1