当前位置: 首页 > 专利查询>王小宁专利>正文

包容五笔字型的五码词为主字为辅复合码计算机输入编码制造技术

技术编号:2892282 阅读:421 留言:0更新日期:2012-04-11 18:40
中文都是以词为主、字为辅。而五笔字型是单字输入。本发明专利技术是借助五笔字型编码规则并加以创新的一种以词为主、字为辅的计算机输入编码。本发明专利技术标准码长为五码,简码为二至四码,收入近十万个常用词和全部国标汉字,重码少,输入速度比五笔字型快得多,编码规则简单,不需特别记忆。熟悉五笔字型的人半小时可掌握,一周可记熟数万个常用词的编码。本发明专利技术推广容易,必将成为替代五笔字型的,在国内外使用面最广的计算机输入编码。(*该技术在2013年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术是一种计算机输入中文编码方法。国内外计算机输入中文编码方法很多,其中达到使用推广程度的只有十几种。在这些编码方法中,王永民专利技术的五笔字型编码方法一花独秀,为百万计算机用户所采用,覆盖率达到国内外中文计算机输入的90%以上。这种编码方法有很多优点,如以字体折分为码,易被接受,规则简单,构成合理,记忆量少,输入速度快等,但它也有严重缺点,就是实行单字输入,不符合中文构成以词为主,字为辅的自然状态。中文的构成,两字和两字以上组成的词占70%左右,单字仅占30%左右。计算机输入采用单字输入,必然造成平均每字击键数较多的严重缺陷。如果能采用以词为主,字为辅的输入方式,无疑输入速度将明显提高。有一种说法认为中文字有限,词无限,因此实现以词为主输入是不可能的。这种说法是片面的。汉字可以组成很多的词,每天都有新词出现,但是每天也都有旧词成为生僻词而死亡。在实际语言文字的应用中常用词是有限的,而且也是相对稳定的,常用词只有一万个左右。《现代汉语词典》收词相当多,也只有五万多个,《辞海》收入大量人名、地名、事件名等,也不过收词八万多个。有人对中文的用词情况进行过大量的统计和分析,发现不到一万个常用词和三、四千常用字出现的累计频率占到了中文的97%以上。这说明实行以词为主,字为辅和词字复合码计算机输入是完全可行的。人能不能记住几万个词的编码?人的脑力潜力非常大。一个人可以认识和记忆几十万种事物,因此,几万个词的编码字,只要常用,是可以记住的。特别是本专利技术词的编码与五笔字型的编码相近似,规则又很简单,只要能记住五笔字型三、四千常用字的编码,记住本专利技术几万个词的编码是很容易的。本专利技术的目的是为了提供一种即具有五笔字型全部优点,又能实现词码与字码合一,以词输入为主,以字输入为辅的,规则简单,不需特别记忆,输入速度比五笔字型快得多,易于被使用者接受和推广的新型中文计算机输入编码方法。本专利技术的目的是这样实现的它采用五笔字型的字根,字型、笔划和汉字编码规则和方法的大部分。在编码中包含全部五笔字型汉字编码。它没有采用五笔字型的词汇编码及“Z”键作为万能学习键和标准单位码长为四码的规则。本专利技术标准单位码长为五码。计算机输入时,如遇到输入字码或词码简码,其编码不足五码,要在其后加打空格键。例如,输入“命”字编码为“WGKB”不足五码,要加打空格键。输入词“我们”,词码简码为“QZ”不足五码,要加打空格键。本专利技术的关键是词码如何构成,要使它不与字码相混,又非常易记,为此本专利技术规定,词码编码由两部分组成,前部为词首字全码,后部为词后字部分编码,同时又规定,字母“Z”键或其他予留键,在一般情况下,出现在词码编码一、二、三位时为词首字全码定义码。本专利技术为了缩短常用词的编码长度,减少词码的重码率,充分安排词码简码,利用编码空间,规定了作为词首字的25个一级特码字和75个二级特码字。这是本专利技术的又一高明之处。一级特码字的选择原则为除了五笔字型的一级简码字以外,作为词首字组词,在中文出现频率最高,其五笔字型字的编码的首码又分别属于除“Z”以外的25个字母的25个字。这25个字为A革、B出、C对、D大、E胜、F起、G下、H战、I没、J时、K只、L因、M山、N已、O火、P实、Q多、R看、S可、T看、U前、V那、W他、X结、Y文。二级特码字的选择原则为除了五笔字型一、二级简码字和一级特码字以外,作为词首字组词,在中文中出现频率最高,每三个字为一组,其五笔字型字的编码大多数首码,少数二码或三码或四码又分别属于除“Z”以外的25个字母的75个字。例如“A”为“劳”、“其”、“花”三个字,“B”为“阶”、“孩”、“随”三个字。本专利技术的词码的词首字全码有三种(一)五码字型的字全码即为词首字全码。例如“命”字的词首字全码为“WHKB”“十”字的词首字全码为“FGH”。(二)为五笔字型一、二级简码字编码之后加词首字全码定义码构成词首字全码。例如一级简码字“我”的字简码编码为“Q”,其词首字全码为“QZ”。二级简码字“产”字的简码编码为“UT”,其词首字全码为“UTZ”。(三)由本专利技术规定的一、二级特码字的编码加词首字全码定义码构成。具体规则为在一级特码字编码前加一个词首字全码定义码构成词首字全码,例如“革”字一级特码字编码为“A”,其词首字全码为“ZA”。“出”字一级特码字编码为“B”其词首字全码为“ZB”。二级特码字共75个字,分成25个字一队的三队。每个队的25个字都分属于25字母,或者说每个字母都代表3个字,例如“A”为“劳”、“其”、“花”三个字。“劳”在一队,“其”在二队,“花”在三队,一队二级特码字编码之后加两个词首字全码定义码构成词首字全码,例如“劳”字的词首字全码为“ZZA”。二队二级特码字编码前后各加一个词首字全码定义码构成词首字全码,例如“其”字的词首字全码为“ZAZ”。三队二级简码字编码后加两个词首字码定义码构成词首字全码。例如“花”字的词首字全码为“AZZ”。词码的标准单位码长为五码,词首字全码的码长为二至四码,相应的词后字部分编码的码长为三至一码。对词后字部分编码的规则为采用五笔字型字全码编码,而不采用五笔字型简码和本专利技术规定的特码字编码。例如“自我”一词的词码词首字全码为“ZT”,词后字部分编码有三码。“我”字的一级简码为“Q”,不采用,采用“我”字的全码“TRNT”的前三码,“自我”一词的词码为“ZTTRN”。词后字部分编码为三码时,如是二字词,则三码分别是词二字的首码、二码、三码。如是三字词,则三码分别为词二字的首码、二码、词三字的首码。如是四字词或四字以上词,则三码分别为词二字首码,词三字首码,词四字或词未字首码。为二码时,如是二字词,则二码分别为词二字首码,二码。如是三字词或三字词以上词,则二码分别为词二字首码,词三字或词末字首码。为一码时,无论是几字词,词后字部分编码均为词末字首码。这些规则与五笔字型词汇编码规则相近,因此不再举例。本专利技术规定了词码简码。一级词码简码为25个词首字为五笔字型一级简码字和25个词首字为本专利技术规定的一级特码字组成的词码简码。输入时,在其词首字全码后加打空格键即可。例如“我们”的词码全码为“QZWUN”,一级词码简码为词首字全码“QZ”加打空格键。又和“因为”一词的全码为“ZLYLY”,一级词码简码为词首字全码“ZL”加打空格键。一共有50个最常见的词被规定为一级词码简码,输入时只击键三次,平均每字1.5键。二级词码简码为词首字是五百多个五笔字型二级简码字和75个本专利技术规定的二级特码字组成的词码简码。输入时,在其词首字全码后加打空格键即可。例如“东西”一词的词码全码为“AIZSG”,二级词码简码为词首字全码“AIZ”加打空格键。又如“月亮”一词的词码全码为“EZZYK”,二级词码简码为词首字全码“EZZ”加打空格键。还有一种二级词码简码是由词首字为一级简码字和一级特码字的词首字全码后加某个字母组成。例如“因此”一词的词码全码为“ZLHXN”,“ZL”是词首字“因”的词首字全码,后加字母“H”,组成“ZLH”为“因此”一词的词码简码。输入时也要加打空格键。二级词码简码理论上有大约近二千字之多。二级词码简码击键数四次,平均每字两次。本专利技术还依据上述方法规定了三万个三级词码简码。另外,本文档来自技高网...

【技术保护点】
包容五笔字型的五码词为主字为辅复合码是一种计算机输入编码,它采用五笔字型的字根、字型、笔划和大部分汉字编码规则及方法,对五笔字型的汉字编码全包容,其特征在于它的标准单位编码码长为五码,词码由词首字全码加上词后字部分编码组成,字母“Z”键或其他予留键为词首字全码定义码和组词提示码,规定了作为词首字的25个一级特码字和75个二级特码字以及词码简码。

【技术特征摘要】

【专利技术属性】
技术研发人员:王小宁
申请(专利权)人:王小宁
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1