当前位置: 首页 > 专利查询>曾建明专利>正文

自然两笔输入法制造技术

技术编号:2880134 阅读:264 留言:0更新日期:2012-04-11 18:40
自然两笔输入法是一种适用于GB13000.1字符集和无分流字形的纯笔画输入法。其键盘输入码为26,单字的最大输入码长为四:【字首两笔】【字尾两笔】【次部首两笔】【三部首两笔】。本输入法提出以字段为汉字的最小单元,并在此基础上将汉字部件规则化,从而划分汉字首部,次部和三部…;并对缺部字进行处理。为减少单字和词组的重码数,还对繁体字进行单独处理措施和非专用名词的两字词组优先的原则。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】
(一)输入法简介1999.10国家语言文字工作委员会正式发布GB13000.1字符集(含20902汉字)以来,大量增加了计算机能提供的汉字数。但是,对当前较流行的汉字输入法而言,即使给新增汉字补编输入码,也限制不了重码字数的剧增,使单字和词组的翻页现象更加严重。例如,全拼输入法中的“ji”和“xian”码,其单字翻页数分别达38和25次。自然两笔输入法是一种适合GB13000.1字符集和无分流字形的纯笔画输入法。其键盘输入码为26,单字最大码长为四字首两笔字尾两笔次部首两笔三部首两笔。此外,对符号、繁体字和词组的处理还另有措施。本输入法中使用的汉字,其笔形、笔顺和GB13000.1字符集保持一致。(二)汉字字形的构成和笔画的分类汉字的字形是一种有若干数量和形状的笔画(笔形)结合体。由于每一汉字的字形都具有下述共性笔画总数、规范的笔画顺序(笔顺)、笔画的相对位置和笔画间的互相交、相接和相离状况。因此,可以从这些共性中,找出其简明特征作为汉字的基本输入信息,在此基础上,建立汉字键盘输入码。(1)汉字基本笔画分类汉字的笔画约30余种,常用八种笔形为横、提、竖、撇、捺、点、折、钩。本输入法再将其合为五类基本笔画 (2)笔画的两笔组合用笔顺序号相邻的两笔作为汉字的基本信息,可提供25种特征作为汉字基本输入单元。即 必须指出,两笔组合的必要条件是按规范笔顺的序号。此外,还需确定“两笔”在汉字中的位置,本法中定位为字首两笔、字尾两笔、次部首两笔、三部首两笔。“次部、三部”是什么?它涉及部件的规则化问题。(三)汉字部件的规则化长时期以来,偏旁、部首、字根……用作汉字单元,以及最近推出的规范化部件都对汉字的信息化起着巨大的推动作用。然而,由于这些部件的规则不十分明确,给操作者带来极大不便。因此,在规范部件基础上进行规则化为实用部件的方法,值得一试。(1)汉字的字段根据汉字笔画之间的相交、相接和相离的特性,可以将大多数汉字按笔画顺序依序截取成若干字段。使汉字不仅是笔画(最小单位)的组合,而且也是若干最小单元即字段的组合。汉字字段(可简称段)为若干序号连续的笔画间通过相交、相接而连在一起的组合体;序号连续的笔画依序分段的必要条件为①构成字段的笔画序号不得间断。②各字段相互之间完全相离。很明显,两序号间断的笔画相接或相交时,序号在其间的笔画,无论多少是否相离,它们必须此两笔共一字段。例如“可”字中的“口”,只能与“丁”字合为一段成为单段字。汉字各字段的截取过程为先选定首笔,再按序号顺序(不得间断)逐笔选择笔画,若该笔画与已选定笔画直接或间接相交、接,则该笔画被选定;若该笔画及其后继的所有笔画均与已选定的所有笔画相离,则已选定的笔画为″首段″。然后,从首段的后继首笔开始,按成段条件依序截取次段,……。直至末段为止。有两点值得注意①单一笔画可以成一字段。如“江”字含四段,“铜”字含五段。②某些汉字,其首尾两笔之间存在直接或间接地相交、接时,该汉字称为单段字。如目革国车噩甚……。(2)首部及次部可以作为汉字基本单元的字段,其字形远不能与规范的部件等同,但在一定条件下,若干序号连续的字段可以组成接近于它的实用部件。其规则如下①不少于两笔的任一字段。不允许单笔段独立成部件,它必须与下一段组部件,如,二、元、忄、旧、彳、主、文、方、火、讠、户、衤…。某些不少于两笔的部件与其后的单笔段又处于其下部或右上方,且共同的下部不在有笔画时,它们可作为准首部处理。如,鱼、马、纟、饣、鸟、亘、犬、咸…等。②序号连续、位置紧邻或对称、不超过四笔且笔画数与段数相同的笔画组合。例如,川、习、小、灬、心、门、氵以及“雨”字中的末四笔、赤、东、办、亦…的末两笔等。但“洋”、“闷”及类似结构的汉字,不得以字首四笔为部件。又如,汉字“头”、“学”…等的首两笔以及汉字“受”、“买”、“豸”…等的首三笔,可作为首部。部件的序号在不破坏字段序号和笔顺的原则下,依次分为首部、次部、三部、…。(四)键盘输入码元汉字集的基本单元仅是汉字的信息单元,它必须在转化为与之对应的健盘码元后,才能输入汉字。按一般贯例,键盘上的26个小写字母常用作计算机的输入码元,由于两笔组合构成的基本单元将占用其中的25个键盘码元,另一个作“辅助”元使用。为了减少对键盘码的记忆量,可以将汉字集的基本单元有规则地分布于键盘上,首先,将“两笔”中的首笔进行分区(五区),次笔在各区中分别进行分位(五位)。其次,将横区、竖区、撇区、点区、折区按键盘结构自下而上和先自左至右然后自右至左依次排列,如附图一(箭头指向下一区)。每区中的五位按横、竖、撇、点、折的顺序自左至右依位排列。其中,撇区四位的第五位“撇折”在其下行的右端。全部键盘码元分布如附图二。(五)汉字的输入过程GB13000.1汉字集中包含三种汉字,(1)GB2312全部汉字,(2)扩展字,(3)繁体字。显然,它们的使用频度,其差别悬殊。为实现高频先见的原则,除繁体字另作处理外,GB2132汉字集按频度排序且均先于扩展字(任意排序)。(1)单字的输入本输入法中,由于一个汉字的最大码长为四和一个码元不应低于两笔。不可避免地会出现某些码元不足但需添补措施的汉字,它们是①单笔字在其后补一横笔而按两笔字处理。②单部字仅具一个实部的汉字。如,国、丰、咸、区、氵、小……等。补笔单笔字和单部字能提供的码长均为二(即字首两笔和字尾两笔),在需要时,可以使用“辅助”作为第三码和第四码。③两部字仅含两个实部的汉字。如,贝、诛、矿……等,它们一般能提供的码长为三(即字首两笔、字尾两笔和次部首两笔),必要时,可使用“辅助”作为第四码。④多部字不低于三部的汉字,如,铁、策…等,它完全具备四码的条件。⑤繁体字已被简化的非规范字,据不完全统计,它们在GB13000.1字集中的字数不会少于6000。留之?重码剧增;弃之?可惜。本输入法将其单独处理,使14000余规范字的重码问题合理解决。其要点为在输入繁体字的“字首两笔”和“辅助”之后,开始提供首批繁体字。需要强调的是由于繁体字中某些部件的特点,本输入法使用下列十种不分流的繁体首部及其首码釒l言y糹t魚m飠l馬c鳥(烏)j貝g門g風m。从而保证最大翻页量不超过一。⑥常用符鉴于计算机中的符号难于使用笔画编码,故采用按功能特点进行分类,以下是常用符号分类及对应的首码和次码表 各种单字和常用符的输入码如下表 注第四码之后,若仍有重码字,可翻页。(2)词组的输入实践证明,词组输入不仅比单字快而且更易于掌握。但由于GB13000.1字符集的使用,使单字码和词组码的重码问题更加严重。因此,除单字中的繁体字另作处理外,也需要处理一批词组。一般说来,任何词组均可由联想方式或编码方式输入,前者在选定某一汉字的情况下,提示栏提供以该字为首字的词组;后者则是在输入词组编码后,提示栏提供其重码的词组。两者相比,编码方式可减少判断搜索次数,但共同的缺点是词组的使用者不了解选定者的方案,有可能使输入落空。因此,尽可能地让使用者了解通用词组的可靠性是必要的,在此基础上让使用者自编个性词组。①联想输入本输入法设置专用的两字联想词组。词组内容限定为非专有名词的通用两字词组和我国各省及省会名、少数大城市名的两字词组。其词组为一万余条,且有优先措施。这不仅减本文档来自技高网...

【技术保护点】
一种适用于GB13000.1汉字集的两笔输入法,其特征:(1) 键盘的基本输入码元25位,均由汉字中序号相邻的两笔画组成,无任何分流字形。(2) 汉字输入码最大码长为四,输入顺序依次为:【字首两笔】【字尾两笔】【次部首两笔】【三部首 两笔】。(3) 一个辅助输入码元依次在下述情况中使用:①用作部分常用符号的首码。②用作繁体字的次码。③必要时,用作单部字的第三、第四码和两部字的第四码。

【技术特征摘要】

【专利技术属性】
技术研发人员:曾里岗郭洪禹清泉曾晓辉曾建明曾建航王靖枫董鸿珠
申请(专利权)人:曾建明
类型:发明
国别省市:41[中国|河南]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1