去多义性语音输入系统和方法技术方案

技术编号:3560708 阅读:231 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种在简化键盘中使用基于拼音或基于笔画的输入法输入汉字字符的系统和方法。通过将通常的索引引入象形文字字符,该系统允许在不同类型的输入法如基于拼音的输入法和基于笔画的输入法中共享该象形文字字符。系统将该输入序列与输入法特定索引如语音或笔画索引相匹配。然后将这些输入法特定索引转换成象形文字字符的索引,然后使用该象形文字字符的索引检索象形文字字符。

【技术实现步骤摘要】

本专利技术一般地涉及一种中文输入技术。更加具体地,本专利技术涉及一种用于去多义性语音输入并输入汉字字符和短语的系统和方法。
技术介绍
多年以来,键盘大小已经成为努力设计和制造小型便携式计算机的一个主要的尺寸限制因素,因为如果使用了标准打字机尺寸的操作键,便携式计算机就必须至少与键盘一样大。尽管已经在便携式计算机上使用了各种小型键盘,但是已经发现小型键盘太小,以致于普通用户不能够容易地或者快速地操作。将全尺寸的键盘结合到便携式计算机中又阻碍了真正便携使用计算机。如果不将计算机放置在一个大体上平的工作表面,就不能够操作大多数便携式计算机并允许使用双手进行打字。当站立或移动时,用户不能方便地使用便携式计算机。在称为个人数字助理(PDA)或者掌中电脑的最新一代的小型便携式计算机中,制造商们已经试图将手写识别软件结合到该设备中来处理这个问题。用户可以直接在触敏平板或屏幕上书写来输入文本。然后由识别软件将这种手写文本转换成数字数据。遗憾的是,除了用印刷或者钢笔书写通常慢于打字之外,手写识别软件的准确性和速度远没有达到令人满意的程度。就汉语来说,由于其具有大量的复杂字符,这个问题变得尤其困难。使问题更糟糕的是,现在的需要文本输入的手持式信息处理设备变得更小了。在双向呼叫、移动电话和其它便携式无线技术中的新发展需要一种小型且便携的双向通讯系统,尤其是需要既可以发送和又可以接收电子邮件(“e-mail”)的系统。拼音输入法是最普遍使用的基于拼音的汉字字符输入法中的一种,1958年中华人民共和国给汉语提出了声音形成音节的官方系统。它是对5000年传统的汉语书写系统的补充。在许多不同的方面都使用了拼音。例如语言学习者使用拼音作为发音工具;在索引系统中使用拼音;以及使用拼音来将汉字字符输入到计算机中。拼音系统采用了标准的拉丁字母表,并将传统的汉语中的汉语音节分解为声母、韵母(收尾发音)和声调。人们发现在大多数语言中汉语具有协调一致的语音。例如, b、p、m、f、d、t、n、l、g、k、h和英语非常相近。其它的声母发音,例如卷舌音zh、ch、sh、和r,上腭音j、q和x以及齿音z、c、s与英语或者拉丁发音不同。表1列出了根据拼音系统所有的声母发音。表1.首字母发音 韵母和声母相连形成一个对应于汉字字符(zi字)的拼音音节。一个汉字短语(ci词)通常由两个或多个汉字字符组成。表2列出了根据拼音系统所有的韵母发音,表3给出了一些说明声母和韵母组合的实例。表2.韵母(收尾)发音 表3.将声母和韵母(收尾)放在一起 每个拼音发音都具有汉语的五个声调中的一个(四个声调和一个“无声”声调)。声调对于单词的意思是重要的。具有这些声调的原因可能是汉语具有非常少的可能音节—大约400个—而英语具有大约1200个。由于这个原因,汉语可能具有比大多数其它语言更多的同音词,即具有相同发音但表示不同意思的词。显然地声调有助于使相对少数量的音节加倍,由此减轻了上述问题,但没有完全解决上述问题。在英语中没有声调相同的概念。在英语中,语句声调变化的不正确会导致语句难以理解。但是在汉语中,一个单词的声调变化不正确会完全改变它的意思。例如,因此“Da”可以表示几个字符,如在第一声调(da1)的搭表示“将某物搁置起来”,在第二声调(da2)的答表示“回答”,在第三声调(da3)的打表示“击打”,以及在第四声调(da4)的大表示“大的”。每个音节之后的数字表示声调。这些声调还可以使用诸如的标记dā dá dǎ dà表示。表4表示对音节“da”的五个声调的说明。表4.五个声调 为了使用拼音系统输入汉字字符,用户可以选择对应于字符的拼音拼写的英文字母。例如,在标准的QWERTY键盘上,当用户想使用拼音“ni”得到汉字字符时,他需要先按压“N键”,然后按压“I”键。按压“N键”和“I”键之后,显示出与拼音拼写“NI”相关联的一列汉字字符。然后,用户从列表中选择需要的字符。因此这种方法称为基本的拼音输入法。在简化键盘系统中,如图1所示出的键盘,每个键都与多个拉丁字母表中的字母相关联,这些字母对应于如表1和2所示的每个拼音音节。这样就需要一种去多义性方法来确定正确的对应于输入键击序列的拼音拼写。在International Society for Augmentative and Alternative Communication中发表的由John L.Arnott和Muhammad Y.Javad(下文称为Arnott)撰写的文章“ProbabilisticCharacter Disambiguation for Reduced Keyboards Using Small Text Samples”中总结了许多提出的方法,这些方法用于确定正确的对应于多义性键击序列的字符序列。Arnott注意到大多数去多义性方法使用了已知的相关语言中的字符序列统计表来解决在给定范围中的字符多义性。也就是说,现有的去多义性系统统计上地分析了多义性键击组合,这是由用户输入这些组合来确定键击的适当译码。Arnott还注意到有一些去多义性系统试图使用单词级去多义性从简化键盘解码文本。在收到表示单词收尾的无多义性字符之后,通过将收到的总的键击序列与字典中的可能匹配相比较,单词级去多义性对全部单词进行处理。Arnott指出了单词级去多义性的几个缺点。例如,由于在识别不寻常单词中的限制单词级去多义性常常不能正确地解码单词,并且不能解码在字典中没有包括的单词。由于这种解码限制,单词级去多义性不能以一个字符一次键击的效率给出没有错误的无约束的英语文本的解码。因此Arnott关注字符级去多义性而不是单词级去多义性,并且他还指出字符级去多义性看起来是最有前途的去多义性技术。此外在名称为Principles of Computer Speech的教科书中公开了另一种提出的方法,这本书是I.EI.Witten创作的并在1982年由Academic Press发表(下文称为Witten)。Witten论述了一种用于减少使用电话触垫输入的文本的多义性的系统。Witten认识到当将键击序列与字典比较时,对于在24,500个单词的英语字典中大约92%的单词不会产生多义性。然而当产生多义性时,Witten注意到这些多义性必须由提供多义性给用户并要求用户在一列多义性输入中进行选择的系统进行交互式分析。因此用户必须在每个单词的结尾回答系统的预测。这种回答降低了系统的效率,并增加了需要的键击次数以输入给定的文本片段。对多义性键击序列去多义性仍然是一个复杂的问题。正如在上面论述的出版物中所记录的,现有的使需要的键击次数最少化以输入文本片段的解决方案不能够达到可以在便携式计算机中使用所要求的效率。因此期望提出一种去多义性系统,它能在一个简单且容易理解的用户界面中解决输入键击的多义性,同时使需要的总键击次数最少化。五笔输入法是另一种最常用的输入汉字字符的方法。五笔是基于形状的输入法,它根据的是字符的结构或形状而不是发音。五笔输入法的主要思想是通过组合字根来形成字符。五笔输入法将大约200个偏旁部首或者字根分配给五个部分,这五部分对应于在汉语书写系统中字符笔画的五种类本文档来自技高网...

【技术保护点】
一种方法,用于对用户输入的多义性输入序列进行多义性消除并产生中文文本输出,所述方法包括以下步骤:将一个输入序列输入给用户输入设备;其中所述用户输入设备包括多个输入装置,每个输入装置与多个语音字符相关联,每当由所述用户输入设备 选择一个输入时产生一个输入序列,由于多个语音字符与所述输入相关联,因此所述产生的输入序列具有多义性文字解释,由多个输入序列和一组其拼写对应于输入序列的语音序列组成并与每个输入序列相关联的数据,以及一个包含多个语音序列和一组对应于语音序列的象形文字字符序列并与每个语音序列相关联的数据库;比较输入序列和所述语音序列数据库,并寻找匹配的语音条目;视需要显示一个或者多个匹配的语音条目;将所述语音条目与所述象形文字数据库匹配;以及视需要显示一个或者多个匹 配的象形文字字符。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:吴建超赖皇瑜何炼皮姆凡默尔斯黄劲钟张路
申请(专利权)人:美国在线服务公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1