当前位置: 首页 > 专利查询>侯朋太专利>正文

码元用笔划集合数表示法及用途制造技术

技术编号:2877581 阅读:253 留言:0更新日期:2012-04-11 18:40
码元用笔划集合数表示法及用途,属于汉字编码技术领域。是一种汉字编码的码元用数字表示的方法。把单字分解成单笔划后a:把同种笔划集合在一起,用总数表示码元;b:用1、2、3、4、5依次代表横、竖、撇、捺、折,按笔顺两笔结合一组,分别用组内笔划的代表数字相加形成码元。可用此法对汉字编码,又可结合字母作区别码,用区别码对汉字和二字词的编码只有3码,简单直观明确易用。用于电脑输入和检索。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】一种汉字编码的码元用数字表示的方法和这种方法的用途,本专利技术的名称是码元用笔划集合数表示法及用途,以下简称积笔法。本文中凡下边加横线连在一起的字表示这几个字合起来为一个词以下同。本专利技术属电子计算机应用软件的设计
,更确切的说,属于汉字编码方法用其应用的
汉字(含由汉字组成的词和短语)的编码是指用字母或数字及其它符号排列成一串,形成不同地序列,各个既定的序列分别表示对应的汉字。这一串序列,本文叫做汉字对应的外码,构成外码的字母、数字、符号(每个位置上只有一个)本文叫做外码的码元(本文简称码元)。目前的汉字编码,基本上为两类。第一类,用字母和非数字符号作码元,即码元中不含有数字符,如五笔字型输入法、智能ABC输入法,(参阅资料是中国版本图书馆CIP数据核字2000第49640号《电脑随身宝典》/舒月编著--珠海珠海出版社2000.10)。第二类编码方法是用数字作码元。如区位码输入法(参阅资料同上),及手机上常采用的笔划输入法,即把单个汉字分成横(含提)、竖、撇、捺(含点)、折(一切带转折的和带转弯的单笔划),再依次用1、2、3、4、5代表。在第一类编码方法中,虽各有各的优点,但是,就电脑键盘输入而言,键符包括数字键,而上述方法中没有使用数字作码元,仅用数字作重码字的序号。这样,没有充分利用键盘符,结果在制定某种编码方案时,用来表示码元的键符相对较少,码元符号数相对不足。这就造成编码时重码字多。为了尽量减少重码字,只有多设定规则或者增加外码的可达长度(即编码时部分字的外码较长,例如五笔字型编码多的达4位,智能ABC可达5位)。这样在编码应用于电脑输入时就减慢输入速度。而在第二类编码中,如区位输入法虽使用数字且无重码,但要把数千汉字分别一一规定成不同的区位码,难学难记;而笔划输入法使用的码元只有五个数字,码元符号太少,形成外码时某些汉字的外码太长(多达六位等)、而且重码字更多,特别是某个字的偏旁笔划多时输入速度更慢,(如对“露”的编码输入就慢)。再者,目前的汉字检索如查字等,当按字形查字时,通常用偏旁部首法进行很难快捷,需要用较好的方法代替。本专利技术的目的如下如果对上述编码方法进行改进,在编码时,可以采用尽量多的数字,(即阿拉伯数字的1、2、3、4、5、6、7、8、9、0,和小数点.合起来共11个,以下同)作码元,设计用不同的单个数字表示不同的码元,然后再利用数字码元编码。以此作码元,码元的数目就比笔划输入法中码元数目多,这样在编码时,就可以形成较多的序列编码,就可以减少重码字。而且纯数字外码整理后可以制成汉字检索表。而且进一步,码元选用数字加字母和其它符号。以此作码元,码元的数目就更多,这样编码时,就可以形成较多的序列时以利于减少重码字。把这些方法综合起来,可以制定一个综合的电脑中文输入方案。据此就可以用一种总的构思形成不同的应用,构思出一个总原理,多应用、多用途、多功效的专利技术方案,这便是本专利技术的目的。本专利技术是这样实现的。一般对汉字编码有按字形和按字音两种。在按字音编码时可以采用双拼法,(见《电脑随身宝典》第二、3节),即用该字的声母和韵母各取一个字母后组成两码外码。但是这样对同音字过多的重码无法区别。为了区别同音字,进一步可以在双拼形成的两码后边加一个不同的表符对同音字进行区别。这样,单字的外码表示为声母码+韵母码+区别码,本文把加在双拼后边区别同音字的表符叫区别码。而在按字形编码中,把单个汉字按横、竖、撇、捺、折共五种单笔划拆分,然后,a、不用下边b的方法,b、用下边方法,即用1、2、3、4、5共5个数字分别依次代表横、竖、撇、捺、折,且按书写顺序对拆分后的单笔划每两个笔划结合为一组,若余下一个单笔划无法与其它笔划结合(包括这个单笔划后边是特殊规定整体不折分的“卄”与“口”等特殊构件或这个单笔划在该字最后一笔,)该单笔划也为一组。在此基础上,本专利技术的特征是将拆分后的单笔划按以下两种方法集合起来用数字表示。a在a种情况下(即仅在把某个单字拆分为五种单笔划后,紧接着)把这个单字的同种笔划集合在一起,集合后形成的结果用数字表示,作为这种笔划的对应码元,但“集合后形成的结果用数字表示”的含义包括以下内容1、集合后没有某种笔划用“0”或“.”之一表示(如“木”字中没有折笔划,就用“0”或“.”之一表示)2、如果某种笔划的总数超过一个既定的数字(超过4、或超过5、或超过6、或7、或8、或9、或10)都按这个既定的数字表示。3、不超过既定数字的,仍用同种笔划的实际数表示。总之,用以上方法,可以将任何汉字,形成五种码元,这种把单字同种笔划集合起来用数字表示码元的方法本文简称“和集法”。本专利技术还可以是,根据a所述的方法,其特征在于单字用和集法形成5种码元后按横、竖、撇、捺、折顺序排列起来,形成的序列就是该单字的外码。当然横、竖、撇、捺、折,前后顺序可以互换位置,但无论哪种设定是等效的,一种编码方案只能有一种设定。用这样的方法可以把任何汉字都编成5码外码。这样的外码,可应于电脑、手机中文输入及整理后用于汉字检索。b、在b种情况下(即单笔划用1、2、3、4、5代表横、竖、撇、捺、折和每两笔划分一组余下单笔划也算一组),接着把已划分为组的组内单笔划代表数字相加,用加法的结果的数字表示这组的对应码元。这句话的意思详述如下把单字中已划分为组的,组内单笔划用它们的代表数字加起来,用加起来的运算结果的数(不超过10,最多是10)表示码元,但不足10个仍用原数,如果加起来是10,(如“幼”中第一级笔划折与折,5+5=10)可用“0”或“.”之一表示,即幼的第一组笔划对应码元是“0”或“.”。但只能选用二者之一。但如果组内只有一笔,则可以就用这个单笔划的代表数字表示码元,或者另外规定如下将这个单笔划的代表数字再加上这个数字,用这个结果表示码元;或者将这个数乘以2,用乘以2的结果表示码元或者都加上5(或4、或3、或2、或1)将这个数的结果表示码元,须提出的是在某一种编码方案中单笔划只能择用上述方法之一种表示法统一运作,其是无论选择那一种方法是等效的。如单字“大”,第一组笔划是横和撇,可横的代表数字1和撇的代表数字3,1+3为4,4就是第一组笔划的码元,第二组笔划只有一笔捺,捺的代表数字是4,可以把4作为第二组笔划的码元,也可以把第二组的码元表示为4+4为8,也可以把第二组的码元表示为4×2=8,也可以把第二组的码元表示为4+5=9等,但只能选择一个,以选择前者的方法为佳,即“大”字的第二组笔划的对应码元是4为佳。本专利技术还可以是所有的单个汉字都可分成以下两种情况甲、该字结构中不含“卄”与“口”的任一个或全部(如玉、汉、元);乙、该字含有“卄”与“口”的其中一个或全部。(如芩、叶、哎)具此,本专利技术的特征还可以是根据b所述的方法在拆分单字时,遇到该字结构中含有“卄”或“口”时,“卄”和“口”都不折分,视为一个整体,也作为一组笔划集合,用“1”代表“卄”作对应码元,用“.”代表“口”作为码元,或用“.”代表卄,用“1”代表“口”,但某一种编码方案只能选前者或后者之一种表示法,不能混淆。而且还要注意,“卄”的含义是单字中形状是卄(如草字头)的构件,只能与其它笔划相邻而不能相交,如甘中卄不算含“艹”;口的含义是汉字中的小“口”本文档来自技高网...

【技术保护点】
一种汉字编码的码元用数字表示的方法,在编码时,把单字用双拼法形成声、韵两码再加区别码;也可以把单字折分成横、竖、撇、捺、折单笔划,然后a:不用b法,b:用下边方法即用1、2、3、4、5分别依次代表横、竖、撇、捺、折再按书写顺序每两笔划为一组余下的单笔划无法与其它单笔划相加时也为一组;本专利技术的特征是,把拆分后的单笔划,按以下两种方法集合起来形成码元:a、在a种情况下把一个单字中相同种的笔划集合起形成码元,按一定的规则用数字表示集合起来的总数;b、在b种情况下,把已分成组的组 内笔划的代表数字相加起来作为这组的码元,但规定组内两笔划都是折,则用数字“0”或“.”之一表示对应码元。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:侯朋太
申请(专利权)人:侯朋太
类型:发明
国别省市:41[中国|河南]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1