当前位置: 首页 > 专利查询>廖高专利>正文

交根优先连根截分二键断码汉字输入法制造技术

技术编号:2891862 阅读:289 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种计算机汉字录入的纯形码方案。本方案优先选用交叉笔画字根和成字字根,将汉字分为“上下结构”和“其它结构”两类,用空格和0二个断码键简单地加以区分,大大简化了字型识别,减轻了拆字难度和拆字多重性。本方案字根布置规律性强,左右手负担均匀,国标GB2312字库全部汉字无重码,在同一个功能键下,字、词、西文、区位码、纯中文符号录入兼为一体,使用方便,学习简单,易于记忆,打字速度快。(*该技术在2014年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术属于计算机汉字编码及输入法领域。计算机汉字录入工作是汉字信息处理的重要组成部分。汉字作为一种象形文字,有着与拼音文字截然不同的特点,这一点在汉字的计算机录入问题上表现的尤为突出。在目前为数众多的计算机汉字录入纯形码、纯音码、音形码三大类方案中,纯形码以其最快的录入速度占据着重要的地位。但汉字纯形编码中的拆字多重性和字型识别复杂性一直未能得到满意的解决,增加了纯形编码方案的使用难度。本专利技术的目的是克服现有汉字纯形编码技术中的以上缺点,从全新的角度来审视汉字,着眼于汉字的直观形象,优先选用交叉笔画结构,对笔画连接的字根采取截的方法,并且只要求区别两种字型结构,用二个断码键简单地加以区分,从而大大减轻了拆字难度和拆字多重性。其键盘布置规律性强,GB 2312国标字库全部汉字无重码,字、词、西文、中文符号、区位码录入兼为一体,使用方便,学习简单,记忆容易,打字速度快。为称呼方便,本专利技术在实际应用中简称为“交优截二汉字输入法”。一.汉字的笔画及结构1.汉字的笔画汉字是一种象形表意文字,汉字的楷书有八种基本笔画点、横、竖、提(挑)、撇、捺、钩、折。八种基本笔画通过不同的组合方式,组成了数万个方方正正的汉字大家族。一般认为汉字具有三级构字单位(1).笔画__即点、横、竖、提(挑)、撇、捺、钩、折。(2).元件(小偏旁)__多笔组成的独体结构。如“音”字中的“立”和“日”。(3).部件(大偏旁)__两个以上元件构成的合体结构。如“韶”字中的“音”和“召”。虽然在书写汉字时,一次只写下汉字的一笔基本笔画。很显然,一堆孤立的笔画将不成其为汉字。汉字的笔画必须通过相离、相接、相交的组合方式,首先构成汉字的元件、偏旁和部首,然后构成汉字。两个汉字的区别不仅在于笔画的种类、数量,还在于笔画的组合方式。例如“六”-“文”,“元”-“无”,“夫”-“天”,“于”-“亍”,“大”-“丈”,“未”-“示”,“井”-“开”-“亓”等,相同数量和相同形状的笔画,由于是否相交的区别,构成了不同的汉字。在上例中“乂”区别于“八”,“乂”区别于“人”,“兀”区别于“尢”,“于”区别于“亍”,“”区别于“亍”,“廾”区别于“丌”交叉结构在汉字中起着重要作用!抓住汉字的交叉结构,尽量提取汉字中的交叉结构,优先采用汉字中的交叉结构,是本专利技术的要点。2.汉字的结构对于汉字的结构方式,有各种不同的概括法。有概括为的,有概括为的,不一而足。根据传统的分法,一般分为如下四种基本结构(1).左右结构。如“朋”,“优”,“汉”,“输”。(2).上下结构。如“多”,“交”,“文”,“字”。(3).内外结构。如“四”,“国”,“图”,“固”。(4).交叉结构。如“十”,“未”,“事”,“夷”。3.本专利技术的汉字结构区分本专利技术为了达到“既无重码又取码简单”的目的,只要求区分两种结构(1).上下结构在本专利技术中,凡是从上至下提取字元取码,各字元间不构成全包围或交叉的字,一律视为上下结构。有如下三种情况①.传统的上下结构字。如“多”,“吕”,“昌”,“交”,“邑”等。②.从上至下“拆”取字元取码,且不构成全包围的字。如“庙”,“旬”,“勺”,“画”,“载”等。③.从上至下“截”取字元取码,字元间不存在交叉或包围的字。如“串”,“丈”,“吏”,“甲”,“电”,“申”是本专利技术特定的上下结构。(2).其它结构除上条规定之外的其它结构。包括传统的左右结构、内外结构、以及除上面第③条之外的交叉结构。本专利技术正是根据以上原理,按照汉字的直观形象,在适当选取传统常用偏旁和部首的基础上,补充提取和截取了一些基本汉字笔型结构,设计构造了本方案的构字元素(简称为“字元”或“字根”,以下混合使用二术语)集合和取码规则。二.字元及键盘布置1.字元组成本专利技术的字元可分为四部分(1).基本笔画;即等。(2).常用传统偏旁;如等。(3).成字结构偏旁;如等。(4).本专利技术补充提取和截取的基本汉字笔型结构。如等等。其中,成字偏旁按其单字的结构取码。2.键盘字元总图本专利技术的键盘字元总图见附图说明图1所示。本专利技术的键盘安排,以无重码和注重规律为基本出发点,将字元按照形状相近和相似进行了最大限度的分类和归并;考虑到各键的击键频率,按照人机工程学的原理,安排在30个键位上。规律性强,记忆方便,打字速度快。这些字元包含全部的组字结构,不需要变形联想,取码直观方便。三.单字取码规则本专利技术的主要取码规则为“交根优先,成字优先,连根截分,上下0断”。说明性规则有(1).从上到下,从左到右,从外到内,先中间后两边。(2).取元争大(尽量取大),兼顾习惯。(3).取码一二三末,不足四码加“断码”(空格键或0键)。(4).“字根字”拆更小,一二三元末归“根”(即所在键)。(5).“0键字”一键“0”断码,“高频字”一键“空”(空格)断码。1.主要规则说明(1).“交根优先,成字优先”“交根优先”,“成字优先”,是本专利技术中的两个主要取码规则,二者相辅相成。使用这两条规则,大大减少了拆字难度和取码多重性。“交根优先”,就是当汉字中的笔画交叉构成字元时,“优先”将该结构作为字元,不沦其位置先后。例如(以下方括号; “开”字取为;“朱”字取为; “文”分解为;“无”分解为; “龙”字取为;“尤”字取为; “干”分解为;“于”分解为; “子”字取为;“羊”字取为; “承”分解为。“或”分解为; “我”字取为;“夹”字取为; “柬”分解为;“成字优先”,是指汉字结构中“可以独立成为单字的字元结构”要优先作为一码,不论其位于何处(“一”字例外)。如“会”{人云}; “金”;“主”; “全”;“盖”;“术”;“犬”;“重”;“太”; “夷”;“墙”;“来”。本专利技术通过优先采用汉字中的交叉笔画结构,大大减少了拆字的多重性。本方案的字元集包含了大多数的“横—竖”、“横—竖钩”、“横—撇”以及“横—折”的交叉结构,只有小部分“框—竖”、“框—撇”和“竖—折”等相交的结构需进行拆分。需拆分的如“夷”分解为; “君”分解为;“事”分解为; “韦”分解为;“兼”分解为;“书”分解为;“典”分解为; “乐”分解为;“练”分解为;“东”分解为。对上下结构的字元,交笔字元的取码位置为其中最先书写笔画的位置。如“鹿”; “截”;“载”;“栽”。对其它结构的字,交笔字元按其在总体中的位置,根据“从上到下,从左到右,从外到内,先中间后两边”的规则取码。如“成”; “建”;“减”; “戳”。(2).“连根截分”通常,人们常把“重”字的组成分解为,把“果”字分解为,把“里”字分解为。本专利技术认可和适应了人们的这种认识,将其拓展为一种减轻拆字难度的有效手段。“当三笔以上相交形成两个(或两个以上)相连的交笔字元时,宁可将其截分为两个(或两个以上,按尽量取大的原则)的字元,而不将其拆开”。例如“串”分解为; “甲”分解为;“申”分解为; “电”分解为;“丈”分解为; “史”分解为;“本”分解为; “吏”分解为;“更”分解为;“拽”分解为;“甫”分解为; “曹”分解为。由于每个汉字见字识码,大大减轻了取码难度。(3).“上下0断”当一个汉字取元不足四码时,需补一个“断码键”标志该字结束。本专利技术使用两个“断码本文档来自技高网...

【技术保护点】
一种交根优先连根截分二键断码汉字编码输入法,其特征在于:1)将汉字按从上到下、从左到右、从外到内、先中间后两边的次序进行分解,顺序取其第一字元、第二字元、第三字元和末字元四码作为汉字的编码时,若汉字中含有交叉笔画结构,优先考虑将该结构作 为字元处理;若汉字中含有成字的笔画结构,优先考虑将该结构作为字元处理;2)将汉字的结构区分为两种结构类型,a)上下结构:取码字元为从上至下排列,各字元间不构成全包围或交叉情形的字;b)其它结构:除上下结构以外的字型结构;3)若汉字取 码不足四码时,用“0”作为上下结构字的断码键,用“空格”作为其它结构字的断码键。

【技术特征摘要】

【专利技术属性】
技术研发人员:廖高
申请(专利权)人:廖高
类型:发明
国别省市:51[中国|四川]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1