当前位置: 首页 > 专利查询>李晓望专利>正文

自然语言信息计算机键盘输入方法技术

技术编号:2893197 阅读:233 留言:0更新日期:2012-04-11 18:40
自然语文信息计算机键盘G-Kb输入方法属语文信息计算机处理系统,其特征是统一以S-Kb为基础来定义各种自然语言键盘和编码,且编码时是根据该语种在形、音、义及使用习惯方面与S-Kb所具有的自然联系以及语种本身在形、音、义方面的内部联系;同时针对不同语种的特点配建相应的知识库;键入过程得到知识库支持。(*该技术在2009年保护过期,可自由使用*)

【技术实现步骤摘要】
属自然语言信息计算机处理系统。自然语言信息计算机输入有语音识别、文字识别、书写板、键盘等形式。其中键盘输入是一种比较普及的方式。已有的键盘输入法,是以字符键入为直接目的。所键入的语言组块,实际上是字符串。为了提高键入速度,常常追求以最少的键数获得所需要的字符。这样一来,特别是对于图形复杂的字符来说,会产生如下问题1、键入过程与语言使用习惯不同,不便于机外处理。2、键入信息不当,不便于利用知识库作机内后继处理。近年来,计算机特别是个人微机的硬件条件有了很大改善,为知识工程的发展提供了条件。本专利技术的任务是提供一种得到知识库支持的具有统一键盘定义与编码方法的通用型自然语言信息计算机键盘输入法,简称G-kb输入法,同时提供一种适用该方法的键盘布局方案。本专利技术的特点是1、统一以英文26个字母与数字符0~9。即以S-kb为基础来定义世界各种自然语言的键盘,并实施编码。2、编码时,所处理的语言文字系统是根据该语种在形、音、义及使用习惯方面与S-kb之间所具有的自然联系以及该语种本身在形、音、义方面所具有的内部联系。3、针对不同语种的特点配建相应的具有教学功能的以辞书、词法为核心,并参考语言学、文字学、词汇学的知识库。键入过程与语言使用习惯相一致。在人工键入时,提供便于建设知识库的初始信息。4、键入过程得到知识库支持,且在知识库支持下,采用以下方法,提高速度、效率与质量<1>音码与形码键盘互相自由切换。<2>机外码的字码、词码或词组码相结合,字码、词码、词组码分别取字符构件、字母组合、字码或词码的首位或首几位。<3>击键次数尽可能少,尽可能定长。所产生的重码由屏幕提示,供人工选择或者机内消除重码。<4>实现自动校对,加标记,用于语言组块层次生成切分即B-Hg切分。采用本专利技术的G-kb输入方法,能够利用计算机键盘建立起适合发展知识库需要的,便于人机合作的自然语言与软件的接口。语言学知识告诉我们,人类的文字最早都是图形式的象形文字,以后发展成为两支,一支以方块汉字为代表,保持图形状态;另一支发展为拼音文字。其中以腓尼基字母最早,以后再以腓尼基字母为基础,派生出许多种现代字母,由于语音学的发展,人类的语言,不管有无文字,都能统一使用国际音标来描写口语,国际音标所采用的字符是以当前世界上应用最广泛的拉丁字母为基础设计的,而许多国家的文字都有以国际音标为背景的拉丁化拼音方案。这就为本专利技术的G-kb输入法提供了条件。现代实际使用的语言,按严式统计有二千种左右。世界上95%以上的人,所讲的语言不到一百种,使用最集中的有十种,许多语言无文字,而各种文字符号中最主要的有四种(1)方块汉字,(2)拉丁字母,(3)斯拉夫字母,(4)阿拉伯字母。本专利技术将通过几个典型实例,进一步说明G-kb的具体内容和实施方法1、没有文字的语言没有文字的语言,可根据国际音标符号对该语言的描写或者设计适当的拉丁化拼音方案来定义键盘,建立知识库和实施编码。这样定义的键盘和编码很容易与拉丁字母的键盘定义和编码建立联系,也很容易与语音识别输入方式建立接口。原则上讲,所有语言都可以采用此方法处理,对于文字符复杂的语言采用拉丁化拼音作为主要输入方法,也不失为一种适用的方法,例如中文。2、使用拉丁字母的语言拉丁字母在当今世界上应用最广泛,计算机一开始就借用了英文打字键盘,G-kb以S-kb为基础是对历史发展的承认。英文以外使用拉丁字母的语种与S-kb相比,字符有所增减,所增加的字符,多数是利用S-kb的字符经过变形、合成、加标记等方法得到的,完全新造的字母不多。因此,对这类语言来说,以S-kb为基础,实现该语种的键盘输入是不太困难的,具体方法如下<1>被定义的语种字母,如果与S-kb相同,就取原键位,如果不同,就取与S-kb在形或音方面有相近特征的键位定义。<2>键盘定义发生重码以后,可根据词典规定、使用习惯、语种内部在形或音方面所具有的联系来进行编码。重码的字母由机外或机内选择。<3>知识库设计应该包括字母固定组合、音节、词素、词形、词长、词域、标记规则、分类、属性、构词规则、短语规则等内容。<4>为了加快输入速度可采用得到知识库支持的字母组合或者词组输入方法,词组码取词的首位或首几位。字母组合或词组的位数等允许用户根据使用确定,最好是定长。<5>实现机器校对、去重码、加标记等功能,以及B-Hg切分。例1、法语键盘、知识库和编码F-kbF-kb与S-kb不同的字母可分为a、e、i、o、u、c六类,取S-kb的对应键位定义,每个键位所代表的具有 、 、^、¨标号的字母编码为1、2、3、4。c类和o类的字母 和 分别为2.重码由人工机外或机内选择,知识库参照词典、词法等建设。例如,把S-kb的E键定义为e、1、è、2、é、3、ê、4、 共五个字母,然后按屏幕显示人工选择或机内选择。其余类推,熟习后可盲打。F-kb的具体表示形式为F-kb=S-kb+a 1.à 2. 3. 4.e 1.è 2.é 3.ê 4. i 1. 2. 3. 4. o 1. 2. 3. 4.u 1.ù 2. 3. 4.üc 1. 2. 3. 4.3、使用斯拉夫字母的语言例2、俄语键盘、知识库和编码R-kb斯拉夫字母也是一种使用很广的字母,其中具有代表性的是俄语,不难发现,R-kb与S-kb之间在形或音方面有着紧密的联系以及R-kb在形与音方面的内部联系,因此,定义俄语键盘与编码时,完全可以采用例1的方法来定义和编码,键定义允许个别调整或附加。其中重音元音的编码为1,Ⅲ和Ⅱ的编码为2,其余为3,Я、Ъ,Ь还可用附加键定义,其表示形式为R-kb=AaBbCcDdEeFfGgHhАаВвСсБбЕеФфДдHн1.á1.é2.3.ЁёIiJjKkLlMmNnOoPpЗзЫыКкЛлМмПпОоРр 2.3.bQqRrSsTtUuVvWwГгЧчШшТтИиЮюЖж 2.2.Щщ2.Цц2.3.Яя3.3.Йй3.ъXxYyZzХхУуЗзЯяЪь 对于在苏联销售的键盘可采用两种办法(1)俄文字母可刻在键帽左上方,而S-kb字母刻在右下方,字形也小些。(2)也可先以俄文标准键盘定义S-kb,然后定义其它语种。如果其它国家和地区也有自己的标准键盘,也可采取此办法处理,如有必要可换戴键帽。4、使用方块汉字的语言例3、汉语键盘、知识库与编码C-kb汉语有拉丁化的拼音方案,因此,也可采用例1的方法处理,然后由机器转换为方块汉字。汉字也可转换为拼音。其中ê和ü的编码为音调标号 的键定义为1、2、3、4、5;声调标号用作汉字结束号,自动加到字母上;分音符由规则决定,规则取自拼音方案,为了实现教学功能,便于开发语言教学软件,键入过程与读法一致,同音汉字由人工选择或机内选择,为了减少击键次数,固定的辅音字母组合zh,ch,sh还可用I、U、V或附加键定义,ng可用附加键定义,B-Hg切分参考正词法。其汉语拼音键盘的表示形式为C-kb1=S-kb+e 0.ê+1. 本文档来自技高网...

【技术保护点】
一种自然语言信息计算机键盘输入方法即G-kb输入法,其特征在于:1)统一以英文二十六个字母与数字符0到9,即以S-kb为基础来定义各种自然语言的键盘,并实施编码;2)编码时,所处理的语言文字系统是根据该语种在形、音、义及使用习惯方面 与S-kb之间所具有的自然联系以及该语种本身在形、音、义方面所具有的内部联系;3)针对不同语种的特点配建相应的具有教学功能的以辞书,词法为核心,并参考语音学、文字学、词汇学的知识库,键入过程与语言使用习惯相一致,在人工键入时,提供便于建 设知识库的初始信息;4)键入过程得到知识库支持,且在知识库支持下,采用以下方法,提高速度、效率和质量;a)音码与形码键盘互相自由切换;b)机外码的字码、词码或词组码相结合,字码、词码、词组码分别取字符构件,字母组合、字码或词码的 首位或首几位;c)击键次数尽可能少,尽可能定长,所产生的重码由屏幕提示,供人工选择或者机内消除重码;d)实现自动校对、加标记,用于语言组块层次生成切分即B-Hg切分。

【技术特征摘要】

【专利技术属性】
技术研发人员:李晓望
申请(专利权)人:李晓望
类型:发明
国别省市:32[中国|江苏]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1