当前位置: 首页 > 专利查询>郭嗣书专利>正文

一种“字字码”计算机汉字输入方法技术

技术编号:2890467 阅读:208 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种通过读入器将声波转换为电信号输入的汉字编码方法,主要特征是:将汉字按结构分解,直读“字中字”,以末笔笔划作读入信号,即所谓“字字码”本发明专利技术的编码方法具有输入快,同音字出现的机率少,重码率低的特点,是一种全新的汉字编码方法。(*该技术在2016年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种汉字输入编码方法。现行汉字编码方法有王永民的五笔字型法,由键盘输入。不使用键盘输入的汉字“读入法”,以读整个汉字为基础,国标字共有6716字,要认识所有国标字难度较大,而且同音字多,重码率高,难以应用。本专利技术的目的在于根据汉字“字中含字”的特点,将汉字按结构分解,然后直读“字中字”进行输入的汉字编码方法,即所谓“字字码”。本专利技术的技术方案是将汉字按结构分解,直读“字中字”,以末笔笔划作读入信号。如“育”可分解读成“云”“月”,末笔笔划“一”读作“横”为读入信号。又如“研”可分解读成“石”“开”,末笔笔划“丨”读作“竖”为读入信号。本专利技术将所读的“字中字”称为“读字”,因全部“读字”只有729个读音,故需认识的汉字量少,同音字出现的机率少,故重码率低;而且,由于以末笔作录入信号,不另设专门的输入信号,直观、易学,可做到“见字识码”。下面结合实施例对本专利技术作详细的说明。将汉字进行结构分解,按“大字优先”的原则分成两个或两个以上“读字”。如“拿”分为“合、手”,而不是分为“人、一、口、手”。若原字不只含两个“读字”,可分成三个或更多的“读字”,如“原”分为“厂、白、小”。在左、中、右结构的字中,若左中、中右均能构成字,取“中右”结构字,如“濉”分为“氵、睢”,而不是“泪、隹”。在上、中、下结构的字中,若上中、中下均能构成字,以“中下”结构字为准,如“查”分为“木、旦”,不是“杳、一”。读字以国标“一级字、二级字”中的字为准。原字中若除“读字”外还有其它非字结构按下述三种情况读入a、属偏旁、部首的,一般读偏旁、部首的第一音,如“冫”为“两点水”读“两”。b、一部分结构读与其相似的“读字”或偏旁、部首的读音。如“彡”读“川”。c、大部分非字结构读原字音,如“”在“半”中读“半”,在“泽”中读“泽”。本专利技术以末笔笔划作读入信号,不设专门的输入信号。同一笔划在字、二字词、三字及其以上词中以不同的读音作读入信号。如“一”(横)读音如下在字中读heng2,2表示读第二声,如“日”读成“ri4 heng2”;在二字词中读“heng3”,3表示读第三声,如“红日”读“si1 ri4 heng3” 在三字及其以上词中读“heng4”,4表示读第四声,如“星期日”读“ri4 yue4 heng4”。所谓的读入信号分为普通码读入;快速码读入;数字读入;外文符号读入;标点符号读入;计算机命令读入;字符读入。分别叙述如下1、普通码(1)、字①、一读字笔划连接不能分成两个读字的字(如“子”)及带点又不能分成一点和一个读字的字(如“成”)为“一读字”。带点字以“点”读入,如“我”读“wo3 dian3”即读入,不带点字以末笔读入,如“日”读“ri4heng2”即读入。②、二读字含两个读字(如“明”)或一个读字和一个非字结构的字(如“反”)为二读字,读二声,以原字的末笔读入。以“心、之(辶)、页、鸟”为第二读字时,取第一读字(或非字结构)的末笔读入。例字 一读音 二读音 读入信号明ri4 yue4 heng2反fan3you4 na4息zi4 xin1 heng2边li4 zhi1 pie3颀jin1ye4 shu4鸡you4niao3na4以“巾”、“目”为第一读字的字,读三声,不读二声,具体见后。③、三读字含有三个或更多读字(或结构)的字读三声,三声为第一读字和末尾两读字,以原字末笔作读入信号。以“巾”、“目”为第一读字而只含两个读字(或结构)的字读三声,第二读字(或结构)重复读一声。例字 一读音二读音三读音读入信号赢wang2(亡) bei4(贝) fan2(凡) dian3帧jin1(巾) zhen1(贞) zhen1(贞) na4④、异位字结构相同、读字位置不同的字称异位字,一般含两个读字(或结构)。上下结构者读二声,其它结构读三声。例字 一读音 二读音 三读音 读入信号景ri4 jing1 / dian3晾ri4 jing1 jing1 dian3⑤、重码字本法共对6716个汉字进行编码,含国标一级字、二级字中全部汉字。(国标一级字、二级字共6724个字,内有9个非字字符。九个非字字符中,“彳”已列入本编码中,故为6716字。)按本法,重码字235个、重码率3.499%。重码字主要为非常用字,如“圪、垲”。重码字可用“选字”方法输入。(2)、二字词读二声,以第一字末笔读入。当第二字含两个读字且第二读字为“心、之、页、鸟”时,读法是一声为第一字的第一读字,二声为第二字第一读字。其它情况(包括第二字含三个或更多读字的字)读第二字最末一个读字。例字 一读音二读音读入信号容忍 bao3(宀) ren4(刃)heng3民众 min2(民) cong2(从) gou2上例中,“gou2”为“民”的末笔读入信号。二字词中,如果原字为“一读字”(如“民”),直读原字音,不分解。(3)、三字及以上词读二声,末字末笔读入。三字词读第一字的第一读字,第二字末尾读字;四字及以上词读第一字的第一读字,第三字末尾读字。例 字 一读音二读音读入信号预见性 yu2(予) er2(儿)heng4列宁主义 dai3(歹) wang2(王) ha32、快速码读一声。(1)、字读第一读字,以原字末笔读入。快速码中的字包含了普通码中的“一读字”,“一读字”仍读原字音。一读字中的带点字以“点”读入,如“寸”读“cun4 dian3”。(2)、二字词、三字及三字以上词二字词和三字及三字以上词均读第一字的第一读字,均以最后一字的末笔作为读入信号。若第一字为“一读字”,则读原字音。如“历史”读“chang3na1”;“智勇双全”读“zhi1 heng4”。3、数字读入汉字小写数字“一、二、三……”已列入字的编码中,均读一声。大写数字“壹、贰、参……”列入上述字编码中,分解读入。阿拉伯数字前冠以“阿”,再读数“0、1、…99”,如“53”读“阿53”。罗马数字前冠以“罗”,再读数“I、II、……X”,如“VII”读“罗VII”。4、外文符号读入依次读“外文名称、大(或小,即大小写)、字母顺序号”,如“E”读“英大5”。日文读“日平(片)”及顺序号便可。5、标点符号读入该符号名称后加“标”字,如“。”为句号,读“ju4(句)、hao4(号)、biao1(标)”即可。6、计算机命令读入前冠以“令”,再读各种指令,如“开机”,读“ling3(令)、kai1(开)、ji1(机)”即可。7、字符读入各种框图符号、专用字符读框图名和字符名,如“起终框”、“□”,读“qi3 zhong1 kuang1”即可。为了正确运用本专利技术的编码方法,下面结合输入硬件作进一步说明1、与键盘并用(见附附图说明图1)读入器(如麦克风)将声波转换为电信号输入到译码器,单音存储器中存储全部读字及其读音、代码,译码器将读入器传来的信号与单音存储器的信号比较,找出相同读音的“读字”,将这个“读字”的代码经I/O输入到中央处理器CPU中。主储存器中存有各个汉字所对应的“读字”的代码,当CPU接到译码器的读入信号后,将累计收到的、构成一个汉字编码的各读字的代码,与主储存器中各汉字的读字的代码比较,找出对应编码的汉字,并本文档来自技高网...

【技术保护点】
一种汉字编码方法,通过读入器将声波转换为电信号输入的汉字编码方法,其特征在于:将汉字按结构分解,直读“字中字”,以末笔笔划作读入信号。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:郭嗣书
申请(专利权)人:郭嗣书
类型:发明
国别省市:43[中国|湖南]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1