当前位置: 首页 > 专利查询>微软公司专利>正文

用于无多义性地输入和变换布莱叶盲字的方法和系统技术方案

技术编号:2990119 阅读:163 留言:0更新日期:2012-04-11 18:40
一种方法和系统,用于输入布莱叶盲字并且把布莱叶盲字变换成诸如汉字的每个字需要多个字节的字表达。该系统既提供布莱叶盲字码的输入装置又提供消除多字节字表达下的文本多义性的装置,该系统还存储文本以供以后由看得见的人和看不见的人使用。(*该技术在2017年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术一般地涉及数据处理系统,并更具体地涉及用于从布莱叶盲字(Braille)输入设备无多义性的输入多字节字的方法和系统。部分地由于难以使用计算机进行诸如文字处理等工作,盲人或视力受损的人很难溶入到劳动大军中。为了把视力受损的人纳入到劳动大军中,已经开发了接收布莱叶盲字输入、将输入存入计算机和把输入输出给用户的常规系统。附图说明图1A描述一种这样的把布莱叶盲字输入到计算机中的常规系统100。布莱叶盲字系统100包括一个带有视频显示器104和布莱叶盲字I/O部件106的计算机102。布莱叶盲字I/O部件106负责通过输入键108-119把布莱叶盲字输入到计算机,并负责通过输出阵列120把布莱叶盲字输出给用户。如图1B中所示,每个布莱叶盲字130单元是用具有六个预定位置132-142的布莱叶盲字组元(Braillecell)表达的。通过在预定位置132-142处是否存在凸点利用各布莱叶盲字组元传递信息。例如,当在纸介质上传递布莱叶盲字时,纸背面上的冲压使纸在一个或多个预定位置132-142上隆起。预定位置132-142处有隆起以及没有隆起向读者传递着含义。按下输入键108-118使计算机102接收要在对应位置132-142构造一凸起位置的信息。输入键112、110、108、114、116和118分别对应于预定位置132、134、138、140和142。输入键119是一个空格键,它用于表示各预定位置都不凸起。从而,通过利用键108-118,视力受限的用户可以对计算机输入信息。输出阵列120包括20个输出单元(例如122),其中每个输出单元可以输出一个布莱叶盲字组元。如图1C中所示,每个输出单元(例如122)包括六个孔152-162,它们对应于布莱叶盲字组元130的预定位置132-142,通过它们系统可以提供能由人的触觉感觉到的凸起。图1D描述输出单元122的左剖视图,并且还示出带有凸起的孔124、128以及不带凸起的孔126。以这种方式,布莱叶盲字系统100可以通过输出阵列120输出多达20个的布莱叶盲字单元(布莱叶盲字组元)。为了从视频显示器104读信息,用户使用输出阵列120并使用箭头键122-128。箭头键122-128操纵视频显示器104上的参考光标。参考光标突出视频显示器104上要输出到输出阵列120上的信息。例如,若参考光标位于文档的顶部,用户可按箭头键126把光标下移到某行上,从而通过触摸输出阵列120用户可读一行信息。类似地,按箭头键124可向右移动参考光标,按箭头键128可向左移动参考光标,而按箭头键122可向上移动参考光标。通过使用布莱叶盲字系统100,视力受限的用户可以把布莱叶盲字信息存储到计算机102中和从计算机中读布莱叶盲字信息。当在英语环境下使用布莱叶盲字系统100时,由于各个布莱叶盲字组元确切地对应于英语中的一个字母,用户可以准确地指出英语表达。这样,用户可以一次输入一个字母,并且可以一次输出一个字母。然而,当在多字节语言下使用时,这种布莱叶盲字系统就不那么有用了。“多字节语言”是这样的语言,即在其中为了唯一地确定该语言中的各个字需要多于一个的字节。换言之,这种语言中存在多于28(或256)个字。多字节语言中的字被称为多字节字。基于汉字的中文、日文和朝鲜文这样的多字节语言大约具有40,000个字。在基于汉字的语言中,语法元素称为“汉字”。术语“语法元素”指的是某给定自然语言中可组成说话中的一部分的单位。例如,英语中的语法元素是单词。就此而论,每个汉字是类似于英文中的词的高级语言符号。即,自然语言趋于具有三种等级的语言元素。最低等级取决于被使用的专用字母表并且和口语中的声音相关。例如,英语中第一级和最低等级语言元素由字母构成。第三等级的语言元素是最高的等级并且包含那些传递完整创意表达的语言元素。在英语中,第三等级由句子构成。第二等级的语言元素是用于术语“语法元素”称呼的语言元素。该第二等级是中间级的语言元素,并且在英语中该中间等级由词组成。在中文中,第二等级包括汉字。由于在基于汉字的语言中大约存在40,000个汉字,而一个布莱叶盲字组元只能唯一地定义26(或64)个字,已经专利技术出各种周知的系统,这些系统把各个布莱叶盲字组元变换多字节语言的语音。然后通常组合三个语音以辨别某个指定的字,尽管这样的辨别并不准确。由于许多不同的字声音类似但含义不同,不能准确地辨别指定的字。例如,下述中文字声音都是“wong”,从而是用相同的布莱叶盲字输入标识的,然而每个字具有不同的含义黄王皇蝗徨由于多字节语言中许多字声音相似,在利用布莱叶盲字输入和输出多字节字时,固有地存在多义性问题。图2描述一种周知的语音变换方案,用于把布莱叶盲字变换成广东方言下的中文语音。该语音变换方案把所有的语音归纳成三类辅音、元声和声调。一些布莱叶盲字组元被定义成指示具体的辅音,表202中描述其中的一部分。表202指出一种具体的布莱叶盲字表达,例如“”,其对应于某特定的辅音,例如“Fay中的F”,并且指示计算机中存储的具体表达(例如“F”)。在该例子中,当用户通过布莱叶盲字I/O部件输入“”时,他指的是“Fay中的F”。布莱叶盲字I/O部件把该输入发送到计算机,在其中按F字符存储它,以指示具体的布莱叶盲字输入及其代表的语音。利用该系统时,某些声音在计算机中所具有的表达,不和该声音对应。例如,尽管布莱叶盲字输入“”的声音是“Gay中的G”,但在计算机中的表达是“K”。表204包含某些元音的示例语音变换关系,表中描述和该特定声音对应的布莱叶盲字输入以及其在计算机中的表达。例如,布莱叶盲字输入“”对应于“sight中的ig”元音并且其在计算机中用“%”表达。类似地,表206描述各种声调的语音变换关系。这些声调中的一个是缺省声调,它是用不存在布莱叶组元规定的。另一种声调是升调,该声调类似于说话者希望提出问题时所使用的声调。在采用把布莱叶盲字变换成广东方言语音的语音变换方案下,用户通常利用三个布莱叶盲字组元规定某特定汉字一个用于辅音、一个用于元音以及一个用于声调。在一些情况下,用户可省略用来指示需要缺省声调的布莱叶盲字声调组元。当采用带有上述语音变换方案的布莱叶盲字系统100时,用户把布莱叶盲字输入计算机,该计算机存储语音表达(例如w;’,它是声音象“wong”的各个字的语音的计算机表示)但不存储实际的多字节字。用其语音表达存储数据妨碍了这样的数据被不理解这些隐秘符号的有视力用户使用,对于把视力受损的人溶入劳动大军它只起很小的作用。该系统的另一个问题是,因为是把语音变换成多字节语言中的字,由于许多字具有相同的声音但意义绝然不同,难以把布莱叶盲字准确地变换成特定的字。从而存在着大量的造成问题的多义性。为了便利视力受损的人使用计算机,必须克服这样的多义性问题。这样,需要改进用于多字节语言的布莱叶输入系统以解决多义性问题。本专利技术提供一种改进型的用于把布莱叶盲字翻译成多字节语言的识别系统,该系统解决了翻译中的多义性。通过解决翻译中的多义性,该改进型的识别系统有助于把视力受损的用户纳入到劳动大军中。通过向视力受损的用户既提供用于输入布莱叶盲字以翻译成多字节语言的装置又提供消除翻译中的多义性的装置,从而反映出用户的意图,来达到本文档来自技高网...

【技术保护点】
一种用于在计算机系统里把布莱叶盲字翻译成多字节字符语言的方法,该计算机系统具有一个带着多条条目的数据库,每条条目包含从布莱叶盲字到由该多字节语言的至少一个字组成的短语的变换,该方法包括步骤:接收语音上代表着多字节语言的一部分的布莱叶盲字 输入,布莱叶盲字输入由多行组成;对于每行尝试把该行和至少一条的数据库条目匹配以翻译该行;当该行不和至少一条的数据库条目匹配时,从该行的尾部截掉足以代表一个字的一部分布莱叶盲字输入,并尝试将该截短后的行与至少一条数据库条目的匹 配;当该截短后的行不和至少一条数据库条目匹配时,重复进行所述截短步骤,直至截短的行与至少一条数据库条目匹配;把匹配的数据库条目中的短语存储到输出文件中,从而该短语不同于其它短语;向用户输出该输出文件;从用户接收输入,该输 入指示该输出文件中某选定短语中的某字;输出该指定字的用户,从而用户可以判定该指定的字是否是预想的字;以及当用户判定该指定的字不是预想的字时,输出语音相同的字以及这些语音相同的字的用法,以使用户选择该预想的字;接收用户对预想的 字的指示;用该预想的字替换该选定短语中的该指定的字;以及在数据库中存储一条条目,该条目带有包含该预想的字和对应的布莱叶盲字输入的该选定短语。...

【技术特征摘要】
...

【专利技术属性】
技术研发人员:彼得卡姆赫翁
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1