当前位置: 首页 > 专利查询>敬永权专利>正文

计算机键码形音兼表拆取字元汉字输入法(XY型码)制造技术

技术编号:2890147 阅读:223 留言:0更新日期:2012-04-11 18:40
本发明专利技术属于计算机文字处理和汉字输入法研究领域,现有的拆取字元输入法(型码)难学难记,需要进一步发展,XY型码按照字型编码,选用的字元贴近汉字,简化了拆分和取码规则,消化了拆分难点,符合汉字使用习惯,通过键码表形或表音使每个字元都得到简捷有依托的表达,具有容易学会,不易忘记,不依赖汉字读音,重码少的特点,适用于不能熟练使用汉语拼音或使用汉字范围较广的用户。字元的选择考虑了向繁简通用过渡。(*该技术在2017年保护过期,可自由使用*)

【技术实现步骤摘要】
专利说明计算机键码形音兼表拆取字元汉字输入法 所属
计算机文字处理技术/汉字编码法研究 计算机汉字编码输入法的现状 计算机汉字输入法是汉字与计算机的接口点,是汉字信息处理的起点,是汉字走向世界的扭带,而将汉字编码后用通用键盘输入是汉字输入的主要方法*,经过国内外专家学者几十年的努力,现在已有多种汉字编码输入法被数百万人所采用,其研究和推广使用的成绩是巨大的,首先,拼音编码法通过开发计算机软件实现了以字带词以词选字等方法,还出现了以词汇输入为主,采用词组简码,具有自动记忆新词,高频词条先见等智能处理功能的软件,使输入速度明显提高。拼音编码法已经发展到比较成熟的阶段,适合于以日常用字为使用范围,对汉语摒音掌握较好的用户,对于使用汉字范围较广,或不能熟练使用汉语拼音的用户,需要采用按照汉字字型编码输入的拆取字元法(拼型法,型码),其中五笔字型,全息码,表型码,郑码,仓颉字母等方法都有了较好的推广使用成绩**。但是,现有的拆取字元法难学难记,人们在使用的同时又希望有更好的方法出现***,在国内计算机应用逐渐普及和国外使用汉字人数不断增加的形势下,拆取字元汉字输入法应该有新的发展。 例如不少拆取字元法完全依靠读音表示字元。然而有的字元不成字,也没有约定俗成的名字,无法读音,如彐,亠,ㄨ,,;有的有了名字如秃宝盖冖,同框冂,两点水冫;若违背习惯设定,靠中介字的读音来表达,必定导致学习困难,而且无法读音又使非成字字元的选用受到限制。 五笔字型法在字元筛选,字元表达,拆分方法和重码识别等方面都作了大量工作,重码字少,具有很多优点,在字元的表达上,此法将25个字母键(z除外)分成5区,每区5位,每个键由区号和位号获得两位数代号,如R属三区二位,代号32。而汉字的笔划归纳为横竖撇点折五种,以数字1--5表示。每个字元在键盘上的位置按排,理论上是使字元的第一笔笔划号与区号对应,第二笔笔划号与位号对应,例如王-11(G),白-32(R),这比完全是无理按排的仓颉字母,首尾码等前进了一步。在拆分方法上,能连不交的原则有效地避开了天与夫,开与井等字的重码。此法提出的由未笔笔划代号和字型代号组成的交叉识别码多达15个,其两位数码又能与区位号相应,有效地减少了重码。 然而五笔字型的难学难记,正在于笔划代号与区位号对应的体系及识别码上。且不说第二笔划号与位号不符者甚多,既使相符,要在实际应用中找出一个字元的第一笔第二笔,用其代号去与区位号对应,这种多次转折的联系也比依形或随音的直接表达要慢得多。至于要做到字元代号与指法相联系,更要经过长期的训练,非专职人员很难胜任。实际上学习五笔字型主要依靠背诵55条口诀来寻找字元的位置,这是难学易忘的根本原因。另外编制识别码要达到熟练也要较长的过程,并且在辨认字型上2型的,看,见,么,等字与3型的包,君,乏等字难以区分,只有靠记忆。在拆分方法上,“兼顾直观”这条原则不具操作性,整个拆分方法达不到唯一性的要求,因此必须记住单体字的拆分结果。其中有些拆分结果与笔顺不符,如出(凵山),幽(幺幺山),酉(西一),戒(戈廾)等,也只有靠记忆。 表形码根据字元的形状用键码直接表达字元,如以O表示口,以W表示纟,以Z表示乙,并用1-5五个数字表示分散笔划如二,氵,立等,使有些字的拆分简捷快速,很具有吸引力。如凶-ㄨ凵-XU,可-丁口-TO,示-二小-23。但此法在拆分方法上要求交叉笔不拆,按汉字“自然分割沟”拆分,因此很多大的笔划组合和笔划较多的汉字,不论组字能力强弱都必须取为字元,如事聿里夷曳吏柬曳册爽等,使字元数量大大增加,达到350个以上。为了表达这些字元,该法将其分为单笔划,多笔划和组合字元三个层次,多笔划字元分为5型45类,每类由一个键码表示。如字架型通挡对立类上通下挡字架包括15个字元,由Y表示;直式多交叉型包括25个字元,由F表示 中丰韦申聿串事扌 肀, 镸. 实际上在表形码中键码表示的不是字元的形状,而是靠语言描述的一个类别的结构特征,很多字元与键码之间并不能引起形状上的联想,如由 与Y,事 与F。表形码的拆分规则很多,如干开王正西五等字上面的横笔不拆,但是再天更歹无于等字上面的横笔要拆;东字下的两点要拆而乐字下的两点不拆。要把汉字分成很多类,记住各种规定才能分清。由于字元多导致重码率高,重码字多,有的多达十个以上,为了区别,对两码字和三码字增加汉语拼音声母作为编码,导致了对读音的依赖。 折取字元法在词组输入方面多采取字词同编的方法,既可提高输入速度,又能减少重码字的挑选。实际上音码中的各种词组处理技术也可以用于型码。但词组和汉字不同,它是搜集不全的。以收有56000条目的1979年版“现代汉语词典”为例,有“工龄”没有“教龄”,有“越发”没有“更加”,收进了“岔气”无法收入“上气”和“下气”(口语“上气不接下气”)。“介绍”一词在鲁迅著作里变成“绍介”,自然难以收入。现在常用的一些词编这本词典时还都未见大趋势,大气候,公关,接轨,共识,炒股,走穴,优化,打的,老外,老爸,面霜,面膜,空嫂,军嫂,下岗,直销,飞牒,光牒,女强人,一刀切,游乐园,方方面面,生猛海鲜,客座(教授),安居(工程),菜兰子(工程)------,来自方言的“拎不清”,“动真格的”,“搞定”等等更是收不胜收。至于考虑到姓名地名,古文典藉,港台和海外华人使用汉语的不同,靠增加词组更是无能为力。因此拆取字元法的发展首先还要把基点放在字上,解决好单个汉字的编码问题。 * 手写输入,语音输入等方法不能代替编码输入法。请参看“汉字编 码不是误区”一文,载“文汇报”1996.7.24第10版 ** 属于拼型法的还有一类笔形法,如四角号码法,首尾码,唯物码, 英文字母方位码,双笔划笔形码等。这类方法取码不易而码位多, 有的笔型不贴近汉字,未显出优势,不赘述仅举笔型一例  ㄥ ( )( )(亠)十ㄨ *** 请参看“计算机应用教程”,上海市计算机应用能力考核办公室编 4.本专利技术的目标 根据计算机应用普及化的发展趋势和十几亿使用汉字的人语音不同而文字相同的实标情况,本专利技术的目标是开发一种符合汉字使用习惯,按照汉字字型而不依赖各个汉字读音,不需要长时间学习训练,学会后不易忘记,重码少,使用方便的汉字编码输入法。第一步输入国标GB-2312(80)全部汉字和最常用的词组,确立键码形音兼表体系;进一步发展为输入更多汉字繁简通用字词合用的汉字输入法。5.专利技术的内容 拆取字元法从汉字到编码的过程可用下图表示 XY型码的技术特点在解决这五个问题中体现出来,其内容如下<1>按照贴近汉字,利于表达,减少数量,减少重码,减少拆分难点的原则选择出一组字元,并考虑与繁体字的衔接*A.与字典部首相同的字元 在新华字典的部首中,使用率高便于表达的成字部首和非成字部首共130余个被按照原来形态选为字元,本文档来自技高网...

【技术保护点】
本专利技术属于计算机文字处理和汉字输入法研究领域,现有的汉字输入法或依赖汉字读音,或复杂难学,难记易忘,不能满足普及计算机应用的需要。XY型码具有按照汉字字型编码,不依赖汉字读音,符合汉字使用习惯,不用长时间学习训练,学会后不易忘记,重码少等优点,适用于使用汉字范围广或不能熟练使用汉语拼音的用户。本专利技术的这些优点由以下技术特点所形成:筛选出的字元组贴近汉字,数量少,减少了拆分难点,易于记忆和拆分;。

【技术特征摘要】

【专利技术属性】
技术研发人员:敬永权
申请(专利权)人:敬永权
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1