语音识别宏运行时环境制造技术

技术编号：4590801 阅读：228 留言：0更新日期：2012-04-11 18:40

所公开的语音识别系统允许用户在不进行大量软件开发的情况下定义个性化的、上下文知晓的语音命令。可使用用户友好语言来定义命令集并将其存储在可扩展标记语言（ＸＭＬ）文档中。命令集内的每个命令对象可包括一个或多个用户可配置动作、一条或多条可配置规则、以及一个或多个可配置条件。命令集可由命令集加载器来管理，该命令集加载器加载每个命令集并将其处理成计算机可执行代码。命令集加载器可以启用和禁用命令集。宏处理组件可以基于当前启用的命令来向语音识别引擎的ＡＰＩ提供语音识别语法。在语音识别引擎识别到与该语法一致的用户语音时，宏处理组件可以发起一个或多个计算机可执行动作。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】语音识别宏运行时环境背景用于计算机用户的早期语音识别系统已经提供了基本口述功能。这些系统将口述单词转换为书写文本。通常这些系统被实现为与诸如文字处理应用程序等其它用户应用程序合作地运行于计算机的操作系统之上的用户应用程序。稍后的语音识别系统有时通过提供静态、预定义操作来包括除口述之外的命令和控制功能。这些操作允许用户界面的有限控制，诸如开启应用程序和在应用程序之间切换。使用这些传统语音识别系统，创建新语音命令需要语音识别应用程序编程接口 (API)的知识和诸如0++编程等大量软件开发。新的操作将需要自定义开发的软件应用程序与语音识别API接口。因为需要庞大的开发工作来使用这些系统创建、更新、以及维护新的操作，所以提供个性化操作、适应个别用户的需要是不切实际的。概述此处所公开的语音识别系统允许用户在不进行大量软件开发的情况下定义个性化的、上下文知晓的语音命令。命令集可使用用户友好宏语言来定义。命令集内的命令对象可以包括一个或多个用户可配置动作、一条或多条可配置规则、以及零个或更多可配置条件。命令集可由软件子系统命令集加载器来管理，该命令集加载器加载每一命令集并将其处理成诸如公共对象模型(COM)对象等计算机可执行代码。命令数据可由可扩展标记语言(XML)文件来定义。例如，XML文件可由软件提供者创建、由用户直接创建、和/或由用户经由一系列用户界面提示来创建。命令集加载器可以监视命令数据中的改变并可以改变、启用和/或禁用命令集。该语音识别系统可以包括宏处理组件。该宏处理组件可以与所加载的命令集和计算机的语音识别引擎进行接口。宏处理组件...

【技术保护点】
一种使用语音识别引擎（２０２）的方法，所述方法包括：　接收第一命令对象（２１６），其中所述第一命令对象包括指示单词、条件、以及第一计算机可执行动作的第一数据；　评估所述条件；　根据所述评估的结果来生成包括所述单词的第一语音识别语法（２２４）；　将所述第一语音识别语法（２２４）传送到所述语音识别引擎（２０２）；以及　响应于从所述语音识别引擎（２０２）接收到识别指示来执行所述第一计算机可执行动作，其中所述识别指示与所述单词相关联。

【技术特征摘要】
【国外来华专利技术】US 2007-5-17 60/938,518;US 2008-3-18 12/048,7141.一种使用语音识别引擎(202)的方法，所述方法包括接收第一命令对象(216)，其中所述第一命令对象包括指示单词、条件、以及第一计算机可执行动作的第一数据；评估所述条件；根据所述评估的结果来生成包括所述单词的第一语音识别语法(224)；将所述第一语音识别语法(224)传送到所述语音识别引擎(202)；以及响应于从所述语音识别引擎(202)接收到识别指示来执行所述第一计算机可执行动作，其中所述识别指示与所述单词相关联。2. 如权利要求1所述的方法，其特征在于，所述第一命令对象(216)由可扩展标记语言(XML)文件(214)来定义。3. 如权利要求2所述的方法，其特征在于，还包括监视目录位置来寻找所述XML文件(214)。4. 如权利要求2所述的方法，其特征在于，还包括根据真正简单聚合 (RSS)订阅源来下载所述XML文件(214)。5. 如权利要求2所述的方法，其特征在于，还包括验证与所述XML文件 (214)相关联的数字证书。6. 如权利要求1所述的方法，其特征在于，还包括监视所述条件来寻找所述结果的改变，其中根据所述改变来生成第二语音识别语法(224)。7. 如权利要求1所述的方法，其特征在于，还包括接收第二命令对象，其中所述第二命令对象包括指示第二计算机可执行动作的第二数据；其中所述第二计算机可执行动作在被执行时定义所述第一命令对象(216)。8. 如权利要求7所述的方法，其特征在于，所述第二计算机可执行动作在被执行时定义所述第一命令对象(216)的条件。9. 如权利要求8所述的方法，其特征在于，所述第二计算机可执行动作在被执行时定义命名状态的值，且其中所述第一命令对象(216)的条件取决于所述命名状态的值。10. 如权利要求1所述的方法，其特征在于，所述单词与语义特性相关联，且其中所述第一计算机可执行动作的参数取决于所述语义特性。11. 一种系统，包括第一命令集(206)，其中所述第一命令集包括第一命令对象(216)，且其中所述第一命令对象(216)包括指示第一单词、条件、以及计算机可执行动作的第一数据；语音识别组件(202)，其中所述语音识别组件(202)适用于接收语法(224) 并响应于与所述语法(224) —致的语音来返回识别指示；以及与所述语音识别组件(202)进行通信的宏...

【专利技术属性】
技术研发人员：RL钱伯斯，B金，
申请(专利权)人：微软公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人