具有自动校正的手写及语音输入制造技术

技术编号:2929161 阅读:204 留言:0更新日期:2012-04-11 18:40
本发明专利技术揭示一种混合方法以增进数据处理系统中的手写辨识及语音辨识。在一实施例中,一前端被用于辨识笔画、字元及/或音素。该前端传回具有符合该输入的相对或绝对可能性的候选者。依据该语言的语言特征(如正被输入的字词为字母或语意语言、如字词及片语被使用的频率、输入字词的语音的类似部分、该语言的形态、或该字词被输入的上下文),一后端结合该前端自输入字词所判定的候选者以配对已知字词以及在目前上下文中此字词的使用可能性。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术与使用数据处理系统的人类语言输入的识别有关,如在桌上型电脑、手持电脑、个人数据助理等等的上的手写辨识及语音辨识。
技术介绍
由于存储器限制、尺寸外型的严格大小限制以及输入与修正文字的控制(按钮、选单等等)的严格限制,小型装置上的文字输入是一具挑战性的问题。现今接受文字输入的手持电脑装置变得更小。近来从携带电脑、手持电脑与个人数据助理至双向传呼、行动电话以及其他携带无线技术的发展已导出对于一小型携带用户友善的用户界面的需求,以接受文字输入以编辑文件及信息,如用于双向消息传输系统以及尤其是可同时传送及接收电子邮件(e-mail)或短消息的系统。多年来,携带电脑已变得越来越小。在制造一更小携带电脑的努力中的一项尺寸限制元件为键盘。如果使用标准打字尺寸按键,该携带电脑至少和该键盘一样大。缩小的键盘已被使用在携带电脑上,但该缩小键盘按键太小而无法被一用户以足够的精确性简单或快速的操作。在一携带电脑中加入一全尺寸键盘也会阻碍该电脑的真正携带性效用。多数的携带电脑无法不被置于一平坦工作表面上操作以允许该用户用两手输入。一用户在站立或移动时无法轻易地使用一携带电脑。手写辨识为已被采用的一种方式,其可解决具备侦测一手指或触控笔的动作的一电子感应屏幕或平板的小型装置上的文字输入问题。在称为个人数位助理(PDAs)的最新世代小型携带电脑中,各公司尝试藉由在该PDA中加入手写辨识软件以解决此问题。一用户可藉由在一触控感应板或显示屏幕上书写而直接地输入文字。该辨识软件随即将此手写文字转换为数位数据。一般,该用户即时写入文字而该PDA即时辨识一字元。在该触控感应板或显示屏幕上的书写建立指出该接触点的一数据输入串。该手写辨识软件分析该数据输入串的几何特征以判定符合该用户正在书写的一字元。该手写辨识软件典型地执行几何外型辨识以判定该手写字元。不幸地,目前该手写辨识软件的准确度仍不令人满意。目前的手写辨识解决方案具有许多问题,例如即使在强大的个人电脑上,该手写辨识软件并非十分准确;而在小型装置上,存储器限制更进一步限制手写辨识的准确性;而个人书写风格也与用于训练该手写软件的不同。由于这些原因,许多手写或‘graffiti’产品要求该用户学习个别字母的一组特定笔画。这些特定笔画组合被用于简化该系统的几何外型辨识处理并增加辨识率。这些笔画常与书写该字母的自然方式十分不同。以上提出的问题的最终结果为非常低的产品采用度。语音辨识为被采用以解决文字输入问题的另一方式。一语音辨识系统典型地包括一麦克风以侦测并记录该语音输入。该语音输入被数位化并被分析以取出一语音样本。语音辨识典型地需要一强大系统以处理该语音输入。某些能力有限的语音辨识系统已被用于小型装置上,如用于行动电话上以供语音控制操作。对于语音控制操作而言,一装置仅需识别几种命令。即使对于依有限范围的语音辨识而言,由于语音样本会随着不同用户以及不同情况有所变化,一小型装置典型地并不具有令人满意的语音辨识准确度。发展出一种更实用的系统以处理人类语言输入是有利的,该系统具有一用户友善方式,如手写辨识系统以供以一自然方式输入手写或语音辨识系统以供以一自然方式说出语音输入,该系统具有改善的准确度以及降低的计算需求,如降低的存储器需求及处理能力需求。
技术实现思路
此处描述一混合方式以增进数据处理系统上的手写辨识及语音辨识。在一实施例中,一前端被用于识别笔画、字元、音节及/或音素。该前端传回具备符合该输入的相对或绝对可能性的候选者。依据该语言的语言学特征,如字母或表意语言;输入中字词,如正被使用中的字词或片语的频率,该输入字词的语音的可能部分,该语言的型态;或该输入字词的上下文,一后端结合该前端从字词输入所判定的候选者以匹配已知字词以及该些字词在目前上下文中的可能用法。该后端可使用外卡以选择候选字词、使用语言特征以预测一待完成字词或完整的接续字词、呈现候选字词以供用户选择、及/或提供附加输出,如字元的自动重音、自动大写以及自动增加标点及定义符号,以协助该用户。在一实施例中,对多个输入模式同步使用一语言后端,如语音辨识、手写辨识以及键盘输入。本专利技术的一实施例包含一种在一数据处理系统上处理语言输入的方法,其包含对多个字词成分分别接收多个辨识结果已处理一语言的一字词的用户输入,并从多个辨识结果与指出一字词列表的使用可能性中判定该字词的用户输入的一或多个候选字词。该多个辨识结果中至少有一个包含多个候选字词成分以及多个可能性指标。该多个可能性指标指出该多个字词成分符合该用户输入的一部分相对于彼此的可能性程度。在一实施例中,该候选字词成分包含来自手写辨识的一笔画、来自手写辨识的字元以及来自语音辨识的音素。该语言可为字母的或表意的。在一实施例中,判定一或多个候选字词包含消除该多个辨识结果的多个候选字词组合、自该语言的一字词列表选择多个候选字词,该多个候选字词含有该多个辨识结果的候选字词成分的组合、从该多个辨识结果及指出一字词列表的使用可能性的数据中对该一或多个候选字词判定一或多个可能性指标以指出符合该字词的用户输入的相对可能性、或依据一或多个可能性指标排序该一或多个候选字词。在一实施例中,自动地从一或多个候选字词选择一候选者并呈现给该用户。可依据该语言中的任何片语、该语言中的字词对(word pairs)、以及该语言中的三连字串(word trigrams)而执行该自动选择。也可依据该语言的任何形态(morphology)以及该语言的文法规则而执行该自动选择。也可依据所接收的该字词的用户输入的一上下文而执行该自动选择。在一实施例中,该方法进一步包含依据预料一用户输入接续字词而自动选择的字词而预测多个候选字词。在一实施例中,该方法包含呈现该一或多个候选字词以供用户选择,并接收一用户输入以选择该多个候选字词其中之一。在一实施例中,一字词成分的多个辨识结果包含一组候选字词成分的任一者对于符合该用户字词输入的一部分具有相同可能性的一指示。指出该字词列表的使用可能性的数据可包含该语言中的字词使用频率、一用户使用字词的频率以及一文件中使用字词的频率的任一个。在一实施例中,该方法进一步包含自动重音一或多个字元、自动大写一或多个字元、自动增加一或多个标点符号以及自动增加一或多个定义符号的任一者。本专利技术的一实施例包含在一数据处理系统上辨识语言输入的方法,该方法包含通过样式识别处理一语言的一字词的一用户输入以对多个字词成分个别建立多个辨识结果,并从多个辨识结果及指出一字词列表的使用可能性的数据中判定该用户输入字词的一或多个候选字词。该多个辨识结果的至少一者包含多个候选字词成分以及多个可能性指标。该多个可能性指标指出该多个字词成分符合该用户输入的一部分相对于彼此的可能性程度。该样式辨识可包括手写辨识,其中每个该多个候选字词成分包括一笔画,例如用于一表意语言符号或字母字元;或一字元,例如用于一字母语言。该字词可为一字母字词或一表意语言符号。该样式辨识可包括语音辨识,其中每个候选字词成分包含一音素。在一实施例中,一字词成分的多个辨识结果的一包含一指示,其指出一组候选字词成分的任一个具有同等的可能性符合该用户输入的该字词的一部分。该组候选字词成分包含该语言的所有字母字元。指出该字词列表的使用可能性的数据可包含该语言中的字词本文档来自技高网
...

【技术保护点】
一种在数据处理系统中用于识别语言输入的方法,其至少包含以下步骤:    通过样式辨识处理一语言的一字词的用户输入以分别对数个字词成分产生数个辨识结果,该数个辨识结果的至少其中之一包含数个候选字词成分以及数个可能性指标,该数个可能性指标指出该数个字词成分与该用户输入的一部分相对于彼此为符合的可能性程度;及    自该数个辨识结果以及可指出一字词列表的使用可能性的数据中判定一或多个可供用户输入的该字词的候选字词。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:A鲁滨逊ER布拉德福德D凯P范莫斯J斯蒂芬尼克
申请(专利权)人:美国联机股份有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利