当前位置: 首页 > 专利查询>微软公司专利>正文

提供相关文本自动完成制造技术

技术编号:3778631 阅读:129 留言:0更新日期:2012-04-11 18:40
例如图形输入板PC或其它处理设备等处理设备可接收非文本语言输入。可识别该非文本语言输入以产生一个或多个文本字符。处理设备可基于所产生的一个或多个文本字符来生成包括一个或多个前缀的列表。可基于多个预测数据源和一个或多个前缀来生成多个文本自动完成预测。可基于与每个文本自动完成预测相关联的特征来对多个文本自动完成预测进行排列和排序。处理设备可以呈现预定数量的最佳文本自动完成预测。对所呈现的预定数量的最佳文本自动完成预测中的一个的选择可导致当前正在被输入的单词被替换为预定数量的最佳文本自动完成预测中所选的那一个。

【技术实现步骤摘要】
【国外来华专利技术】提供相关文本自动完成些旦 冃豕用于诸如例如图形输入板个人计算机(PC)或其它处理设备等处理设备的许多输入系统提供文本预测能力以流线化文本输入过程。例如,在现有文本 预测实现中,随着单词被一次一个字符地输入,仅有是当前正被输入单词的延 b的单词可作为文本预测来呈现给用户。如果用户看到正确的单词,则用户可 以选择该单词来完成该单词的输入。概述提供本概述是为了以简化的形式介绍将在以下详细描述中进一步描述的 一些概念。本概述并不旨在标识出所要求保护的主题的关键特征或必要特征, 也不旨在用于限定所要求保护的主题的范围。在根据本专利技术主题的各实施例中, 一种处理设备可接收语言输入。该语言 输入可以是诸如例如数字墨水输入、语音输入、或其它输入等非文本输入。该 处理设备可以识别该语言输入并可以产生一个或多个文本字符。该处理设备可 以随后基于所产生的一个或多个文本字符来生成一个或多个前缀的列表。对于 数字墨水输入,可在一个或多个前缀的列表中包括备选识别。可基于所生成的 一个或多个前缀的列表来从多个预测数据源生成多个文本自动完成预测。可生 成描述每个文本自动完成预测的多个特征的特征向量。可基于相应的特征向量 来排序并存储文本自动完成预测。该处理设备可以呈现预定数量的最佳文本自 动完成预测。对所呈现的预定数量的最佳文本自动完成预测中的一个的选择可 导致当前正在被输入的单词被替换为所呈现的预定数量的最佳文本自动完成 预测中所选的那一个。在某些实施例中, 一个或多个预测数据源可基于用户数据来生成。在此类 实施例中,文本自动完成预测可至少部分基于用户数据来生成。附图 u为了描述能够获得上述和其它优点和特征的方式,以下将描述并通过参考附图中示出的各具体实施例来呈现更为具体的描述。可以理解,这些附图仅描述各典型实施例,从而不被认为是对其范围的限制,将通过使用附图用附加特征和细节来描述和说明各个实现。附图说明图1是示出可用于实现根据本专利技术主题的各实施例的示例性处理设备的功能框图。图2A-2B示出根据本专利技术主题的一个实施例中的处理设备的示例性显示的一部分。图3是示出可在训练处理设备时执行以生成相关可能文本自动完成预测的示例性处理的流程图。图4是示出用于识别非文本输入、生成文本自动完成预测、以及呈现预定数量的文本自动完成预测的示例性过程的流程图。图5是示出可包括可由应用程序调用的例程或过程的所展示的识别预测应用程序接口和所展示的识别预测结果应用程序接口的框图。详细描述以下详细描述各实施例。尽管讨论各个具体实现,但应当理解,这仅是出于说明的目的。相关领域技术人员将认识到,可以使用其它组件和配置而不背离本专利技术的主题的精神和范围。概览在根据本专利技术主题的各实施例中,可提供一种处理设备。该处理设备可接收来自用户的语言输入。该语言输入可以是文本、数字墨水、语音、或其它语言输入。在一个实施例中,可识别诸如例如数字墨水、语音、或其它非文本语言输入等非文本语言输入以产生一个或多个文本字符。该处理设备可基于该输入文本或所产生的一个或多个文本字符来生成一个或多个前缀的列表。对于数字墨水输入,可在一个或多个前缀的列表中包括备选识别。处理设备可基于所生成的一个或多个前缀的列表来从多个预测数据源生成多个文本自动完成预测。该处理设备可基于与每个自动完成预测相关联的特征来对多个文本自动完成预测进行排序。该处理设备可将预定数量的最佳文本自动完成预测呈现为可能文本自动完成预测。对所呈现的预定数量的最佳文本自动完成预测中的一个的选择可导致当前正在被输入的单词被替换为所呈现的预定数量的最佳文本自动完成预测中所选的那一个。在根据本专利技术主题的一个实施例中,多个预测数据源可包括基于词典的预测数据源、输入历史预测数据源、个性化词典预测数据源、以及n元语法语言模型预测数据源。基于词典的预测数据源可以是使用诸如例如英语、中文、或另一语言等特定语言的通用语言数据源。输入历史预测数据源可基于包括在诸如电子邮件、文本文档、或其它文档等新创建或新修改的用户文档中,以及包括但不限于数字墨水、语音输入、或其它输入的其它输入中的文本。对于输入历史预测数据源,处理设备可以跟踪最近被输入的单词、这些单词被输入了有多久、哪些单词在其它单词之后被输入、以及这些单词多久被输入一次。个性化词典预测数据源可以是基于用户数据的用户词典,用户数据诸如例如,包括在诸如电子邮件、文本文档、或其它文档等用户文档中的文本。对于个性化词典预测数据源,处理设备可以跟踪大多数或全部已经被输入的单词、以及哪些单词在其它单词之后被输入。在某些实施例中,可以维护诸如例如单词频率或其它信息等语言模型信息。n元语法语言模型预测数据源可以是通用语言数据源,或可以通过分析用户数据(例如,用户文档、电子邮件、文本文档)并产生包括与来自预测数据源的单词和字母的组相关的信息的n元语法语言模型来构建(或修改/更新)。示例性处理设备图1是示出可用于实现根据本专利技术的主题的各实施例的示例性处理设备100的功能框图。处理设备100可以包括总线110、处理器120、存储器130、只读存储器(ROM) 140、存储设备150、输入设备160、和输出设备170。总线110可以准许处理设备100的各组件之间的通信。处理器120可以包括解释和执行指令的至少一个常规处理器或微处理器。存储器130可以是随机存取存储器(RAM)或存储供处理器120执行的信息和9指令的另一种类型的动态存储设备。在一个实施例中,存储器130可包括闪速RAM设备。存储器130还可以存储在处理器120执行指令期间使用的临时变量或其它中间信息。ROM 140可以包括常规ROM设备或为处理器120存储静态信息和指令的另一种类型的静态存储设备。存储设备150可以包括用于存储数据和/或指令的任何类型的介质。输入设备160可包括显示器或触摸屏,该显示器或触摸屏可进一步包括用于从诸如例如,电子或非电子笔、指示笔、用户的手指或其他书写设备等书写设备接收输入的数字化仪。在一个实施例中,书写设备可包插定点设备,诸如例如,计算机鼠标或其他定点设备。输出设备170可包括向用户输出信息的一个或多个常规机制,包括一个或多个显示器或其它输出设备。处理设备100可响应于处理器120执行诸如例如存储器130或其它介质等有形机器可读介质中所包含的指令序列来执行这些功能。这些指令可从诸如存储设备150等另一机器可读介质或经由通信接口 (未示出)从单独的设备读入存储器130中。示例图2A示出根据本专利技术主题的一个实施例中的处理设备的示例性显示的一部分。用户可以使用书写设备来输入诸如例如数字墨水202的笔画等语言输入。数字墨水的笔画可以形成字母,字母可以形成一个或多个单词。在此示例中,数字墨水202可以形成字母"uni"。诸如例如数字墨水识别器等识别器可以识别数字墨水202并可以呈现识别结果204。识别器可经由多个识别路径来产生多个可能识别结果,但仅将来自最有可能的识别路径的最佳识别结果作为识别结果204来呈现或显示。处理设备可基于多个可能识别结果来生成包括至少一个前缀的列表。例如,处理设备可生成包括前缀"uni"的列表。处理设备可对多个预测数据源进行参考以寻找以该前缀开始的单词。处理设备可从多个预测数据源产生许多可能文本自动完成本文档来自技高网...

【技术保护点】
一种用于对于语言输入提供文本自动完成预测的机器实现的方法,所述机器实现的方法包括: 识别所述语言输入并产生至少一个文本字符(404); 基于所述至少一个文本字符来生成包括至少一个前缀的列表(406); 基于所生成的列表来从 多个预测源生成多个文本自动完成预测(408); 基于与所述多个文本自动完成预测中的每一个相关联的多个特征来对所述多个文本自动完成预测进行排序(410,412);以及 呈现预定数量的最佳文本自动完成预测作为对于所述语言输入的可能文 本自动完成预测(414)。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:B利昂Q张
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利