当前位置: 首页 > 专利查询>李晓陵专利>正文

全息自然码中文输入系统技术方案

技术编号:2892148 阅读:463 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种全息自然码中文输入方法及相关键盘装置,该输入方法用全息自然码对一单字(词)编码。编码由基码和选码构成,基码是指包含该字(词)的有意义的字(词)组合而成的语言体的代码,即为该语言体的前N个单字按汉语拼音方式所注发音的首音代码的组合,选码是该字(词)在语音体代码中的顺序。相关的键盘装置是计算机用西文键盘,汉语拼音首音字母与英文26个字母键一一对应。(*该技术在2014年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种语音文字(特别适用于中文汉字及类似中文汉字的其它象形文字)的全息自然码中文输入方法以及相应的键盘装置。目前,各种非拼音语言文字的编码方法尤以汉字最具代表性。其编码方法国内外不下于几百种,但基本形式不外乎抽象数字码(如电报码)、形码(如五笔字型码)和音码(如拼音码)及其组合,其编码的对象主要都是针对某一单字、词的音、形、序来进行的,都没有从语言的本原上来考虑。这类编码通常存在掌握较困难、对使用者要求较高以致难以普及以及与计算机西文键盘的直接结合性较差等缺陷。而且这类编码无法区分同形不同义的字或同音不同义(不同形)的字。本专利技术的目的是提出一种将文字编码恢复到语音本原上的、采用个体信息以产生文字编码的全息自然码的编码方法,并确定一套码元与现行计算机西文键盘直接结合。它不但可以解决上述问题,还具有很多其它的优越性。本专利技术的内容是全息自然码中文输入方法及相关键盘装置,其输入方法是用全息自然码对一字(词)编码。该全息自然码由基码和选码构成,基码是指包含该字(词)的有意义的字(词)组合而成的语言体的代码,即为该语言体的前N(N可以是1、2、3、4、…)个单字按汉语拼音方式所注发音的首音代码的组合,选码是指该字(词)在语言体代码中的顺序;相关键盘装置是计算机用西文键盘。根据现行汉语拼音方案,汉语拼音的首音字母可以归结为27个码元a、b、c、d、e、f、g、h、j、k、l、m、n、o、p、q、r、s、t、w、x、y、z、ch、sh、zh、V其中V用来拼写外来语、少数民族语言和方言,其与键盘字符的对应关系如下拼音码元键盘字符拼音码元键盘字符aApPbBqQcCrRdDsSeEtTfFwWgGxXhHyYjJzZkKCHIlLSHUmMV、ZHVnNoO附图说明图1是本专利技术所用的键盘装置。图2是本专利技术所用的硬件示意图。图3是本专利技术的中文输入操作过程示意图。下面结合附图,详细介绍本专利技术的内容。Ⅰ单字输入情形一、编码构造基码+选码或选码+基码1、基码语言体的代码语言体包含所要输入的字(词)的有意义的字(词)组合或语句。例如如要输入“乎”,可选语言体“之乎者也”,输入“朝”,可选语言体“朝不保夕”也可选语言体“改朝换代”。2、选码所要输入的字(词)在相应的语言体中所处的位置顺序代码。二、码的选择及相应的键盘装置1、基码的选择取语言体的前N个单字按所属语言的注音方式(或其它公认的注音方式)所注发音的首音代码的组合。其中N可以是1或2或3或4,……。对汉语普通话按汉语拼音注音而言,可取语言体前N个字的汉语拼音首音字母之组合作为该语言体的代码。对用汉语拼音注音的文字(也可以是方言发音),均可取其语言体的前N个字的汉语拼音首音字母之组合作为该语言体的代码。此时,注意汉语拼音的ch取I;sh取U;V、zh均只取V。这样,基码的码元有27个,分别为a、b、c、d、e、f、g、h、j、k、l、m、n、o、p、q、r、s、t、w、x、y、z、ch、sh、zh、V其中V用来拼写外来语、少数民族语言和方言。2、选码的选择最好按被包含的字(词)在该语言体中的字(词)顺序以顺序阿拉伯数字来表示,也可采用顺序字母或其它顺序符号来表示。当确定选码为一位阿拉伯数字时①规定0到9各数字与语言体中各位置及其排列组合之关系,以对应选出处于该位置或按其排列组合后的字(词)。②例如规定0选全部语言体1选第一个位置上的字2选第二个位置上的字..3、相应的键盘配置及其对应关系①相应的键盘装置上应至少有分别代表26个英文字母的26个键位和分别代表10个阿拉伯数字0、1、2……9的10个键位。如附图1所示的现行计算机西文键盘就满足此要求。②规定基码码元(汉语拼音首音字母,共27个)与26个英文字母键的对应关系。③规定选码码元(阿拉伯数字0、1、2、……9,共10个)与阿拉伯数字键一一对应关系。4、码元的集合分类及其作用①规定26个英文字母构成一个字符集-英文字母集②规定10个阿拉伯数字构成一个字符集-阿拉伯数字集。③规定上述的两个字符集为不相同且可被识别的独立字符集。④基码码元,按前述归结到26个英文字母键上。即基码码元由相应的英文字母集表示。⑤选码码元,按前述归结到10个数字键上,即选码码元由相应的阿拉伯数字集表示。⑥在编码构造为“基码+选码”时,规定当输入第一个英文字母时即作为一个相应字(词)的输入编码的第一个码元之标识。继续输入直至输入最后一个阿拉伯数字时,作为该字(词)的输入编码的最后一个码元之标识。例如连续输入的字符可为ABCD3EFGH2IJKL4MNOP1QRST34UVWX1等等,其中第一个英文字母为一个字的编码开始,最后一个阿拉伯数字为一个字的编码结束。三、相关讨论(以前述具体条件为例)1、码空间容量①基码容量CNB=26NN=1时,C1B=261=26N=2时,C2B=262=676N=3时,C3B=263=17576N=4时,C4B=264=456976N取4的容量CB=C1B+C2B+C3B+C4B=475254②选码容量CC=10③N取4的总容量C=CB·CC=475254×10=4752540④实际容量估计考虑到语言体多选4字,基码空间的实际被占率约50%,以及平均每字有约10个码,则实际容量C为C≈10万所以,N一般取到4已足够,而对常用字,N取到3即可。2、码长L=LB+LCN=1时,L=1+1=2N=2时,L=2+1=3N=3时,L=3+1=4N=4时,L=4+1=5四、编码举例以中文普通话、汉语拼音注音、N取4为条件。1、例1对“朝”的编码①取语言体“朝不保夕”,相应的基码为ZBBX,选码为1,所以“朝”的编码为ZBBX1相应地“不”为ZBBX2“保”为ZBBX3“夕”为ZBBX4“朝不保夕”为ZBBX0(其中ZBBX为基码,0代表整个语言体输入)②也可取语言体为“改朝换代”,相应的基码为GCHD,选码为2,所以“朝”的编码为GCHD2,相应地“改”为GCHD1“换”为GCHD3“代”为GCHD4整个语言体编码为“改朝换代”为GCHDO2、例2对“乎”进行编码对那些无法组成有语言含意的字词(句)的字(词),可以组成对编码有意义的语言体。例如“乎”的语言体可以取为“之乎者也”,按前述编码条件,其编码就为ZHZY2。3、对那些专用的,或不同于一般字(词)构造法的非常用字(词),可另外单列入一个语言体集合,并增加一个类码前置于“基码+选码”之前,即类码+基码+选码。类码的选择应使其所用字符既不在英文字母集内,也不在阿拉伯数字集内。相应地,在输入键盘配置上,设置相应的键位。当连续输入具有相同类码的编码时,除第一个之外,此后的每个字(词)的类码可以省略。即类码可以设置成状态标志码。非常用字举例“贳”(shì)是较少用到的字(词),其含义为“出赁”,“出借”;“赊欠”;“宽纵”等。根据其含义之一,可选“语言体”为“宽纵贳”,相应地编码为KZS3,对于非常用字的编码N取3已足够。类码设为F1(可设置于现行计算机键盘上的特别功能键。其它类可以设为F2,F3……)则“贳”置于F1类,相应地“类码+基码+选码”为F1KZS3此处F1是一个字符,不是两个字符。Ⅱ、字(词)组合输入的情形1、选码串若干个选码的连续输入,即选码串本文档来自技高网...

【技术保护点】
一种全息自然码中文输入方法及相关键盘装置,其特征在于所述的输入方法是用全息自然码对一字(词)编码,所述的全息自然码由基码和选码构成,基码是指包含该字(词)的有意义的字(词)组合而成的语言体的代码,即为该语言体的前N个单字按汉语拼音方式所注发音的首音代码的组合,其中N是1、2、3、4、…,选码是指该字(词)在相应的语言体中所处的位置顺序代码;所述的相关键盘装置是计算机用标准西文键盘,汉语拼音的首音字母归结为27个码元:a、b、c、d、e、f、g、h、j、k、l、m、n、 o、p、q、r、s、t、w、x、y、Z、ch、sh、zh、V其中V用来拼写外来语、少数民族语言和方言,其与键盘字符的对应关系如下:拼音码元 键盘字符 拼音码元 键盘字符a A p Pb B q Qc C r Rd D s Se E t Tf F w Wg G x Xh H y Yj J z Zk K CH Il L SH Um M V、ZH Vn No O。

【技术特征摘要】

【专利技术属性】
技术研发人员:李晓陵
申请(专利权)人:李晓陵
类型:发明
国别省市:32[中国|江苏]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1