用于向语音使能应用程序提供输入的方法和装置制造方法及图纸

技术编号：8659773 阅读：167 留言：0更新日期：2013-05-02 06:56

一些实施例致力于允许用户提供输入到未连接至执行语音使能应用程序的计算机的移动通信装置，如智能电话中的、旨在用于该语音使能应用程序的语音输入。该移动通信装置可以将用户的语音输入作为音频数据提供给在服务器上执行的代理应用，其确定要向哪个计算机提供所接收音频数据。当代理应用确定了要将音频数据提供至其的计算机时，其将该音频数据发送至该计算机。在一些实施例中，自动语音识别可以在将音频数据提供给计算机之前针对其执行。在这种实施例中，代替提供音频数据，代理应用可以将根据执行自动语音识别而生成的识别结果发送至所标识计算机。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
在此描述的技术总体上致力于促进用户与语音使能应用程序的相互作用。
技术介绍
语音使能软件应用程序是能够经由从用户提供的语音输入来与该用户相互作用的和/或能够按语音形式向人类用户提供输出的软件应用程序。语音使能应用在许多不同环境中使用，如字处理应用、电子邮件应用、文本消息和web浏览应用、手持式装置命令和控制，以及许多其它方面。这种应用可以是专有语音输入应用，或者可以是能够进行多种类型的用户相互作用(例如，视觉、文本、以及/或其它类型的相互作用)的多模态化应用。当用户通过讲话与语音使能应用通信时，通常使用自动语音识别来确定用户话语的内容。接着，语音使能应用可以基于所确定的用户话语内容来确定要采取的恰当动作。图1示出了包括计算机101的常规系统，计算机101执行语音使能应用程序105和自动语音识别(ASR)引擎103。用户107可以经由麦克风109向应用程序105提供语音输入，该麦克风经由有线连接或无线连接直接连接至计算机101。当用户对着麦克风109讲话时，将语音输入提供给ASR引擎103，该ASR引擎针对该语音输入执行自动语音识别，并将文本识别结果提供给应用程序105。
技术实现思路
一个实施例致力于提供一种向在计算机上执行的语音使能应用程序提供输入的方法。该方法包括在至少一个服务器计算机处接收从未通过有线或无线连接方式连接至所述计算机的移动通信装置所提供的音频数据；在所述至少一个服务器计算机处获取根据针对该音频数据执行自动语音识别而生成的识别结果；以及将该识别结果从所述至少一个服务器计算机发送至执行该语音使能应用程序的所述计算机。另一实施例致力于提供编码有...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2010.09.08 US 12/877,3471.一种向在计算机上执行的语音使能应用程序提供输入的方法，该方法包括: 在至少一个服务器计算机处接收由未通过有线或无线连接方式连接至所述计算机的移动通信装置所提供的音频数据；在所述至少一个服务器计算机处获取根据针对该音频数据执行自动语音识别而生成的识别结果；以及将该识别结果从所述至少一个服务器计算机发送至执行该语音使能应用程序的所述计算机。2.根据权利要求1所述的方法，其中，该移动通信装置包括智能电话。3.根据权利要求1所述的方法，其中，所述至少一个服务器是至少一个第一服务器，并且其中，获取该识别结果的动作还包括: 将该音频数据发送至在至少一个第二服务器上执行的自动语音识别(ASR)引擎；并且在所述至少一个第二服务器上接收来自所述至少一个(ASR)引擎的识别结果。4.根据权利要求1所述的方法，其中，获取该识别结果的动作还包括: 利用在所述至少一个服务器上执行的至少一个自动语音识别(ASR)引擎来生成识别结果。5.根据权利要求1所述的方法，其中，该计算机是多个计算机中的第一计算机，并且其中，所述方法还包括: 从移动通信装置接收与所述音频数据相关联的标识符；并且利用该标识符来确定第一计算机是所述多个计算机中要将识别结果发送至其的计算机。6.根据权利要求5所述的方法，其中，该标识符是第一标识符，并且其中，利用该第一标识符来确定第一计算机是所述多个计算机中要将识别结果发送至其的计算机的动作还包括: 接收来自第一计算机的针对音频数据的请求，该请求包括第二标识符；确定第一标识符是否与第二标识符匹配或映射至第二标识符；以及当确定第一标识符与第二标识符匹配或映射至第二标识符时，确定第一计算机是所述多个计算机中要将识别结果发送至其的计算机。7.根据权利要求6所述的方法，其中，将识别结果从所述至少一个服务器计算机发送至执行语音使能应用程序的计算机的动作响应于确定第一计算机是所述多个计算机中要将识别结果发送至其的计算机而执行。8.编码有指令的至少一个非临时性有形计算机可读介质，该指令当通过至少一个服务器计算机的至少一个处理器被执行时，执行向在计算机上执行的语音使能应用程序提供输入的方法，该方法包括: 在所述至少一个服务器计算机处接收由未通过有线或无线连接方式连接至所述计算机的移动通信装置所提供的音频数据；在所述至少一个服务器计算机处获取根据针对该音频数据执行自动语音识别而生成的识别结果；以及将该识别结果从所述至少一个服务器计算机发送至执行该语音使能应用程序的所述计算机。9.根据权利要求8所述的至少一个非临时性有形计算机可读介质，其中，该移动通信装置包括智能电话。10.根据权利要求8所述的至少一个非临时性有形计算机可读介质，其中，所述至少一个服务器是至少一个第一服务器，并且其中，获取识别结果的动作还包括: 将该音频数据发送至在至少一个第二服务器上执行的自动语音识别(ASR)引擎；并且在所述至少一个第二服务器上接收来自所述至少一个(ASR)引擎的识别结果。11.根据权利要求8所述的至少一个非临时性有形计算机可读介质，其中，获取该识别结果的动作还包括: 利用在所述至少一个服务器上执行的至少一个自动语音识别(ASR)引擎来生成识别结果。12.根据权利要求8所述的至少一个非临时性有形计算机可读介质，其中，该...

【专利技术属性】
技术研发人员：J·M·卡塔尔斯，
申请(专利权)人：纽昂斯通讯公司，
类型：
国别省市：

全部详细技术资料下载我是这个专利的主人