复合姿势-语音命令制造技术

技术编号：7039725 阅读：249 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及复合姿势-语音命令。一种多媒体娱乐系统将姿势和语音命令组合以提供增强的控制方案。用户的身体位置或运动可被识别为姿势，且可被用于提供用于识别用户生成的声音(诸如语音输入)的上下文。同样，语音输入可被识别为语音命令，且可被用于提供用于将身体位置或运动识别为姿势的上下文。权重可被赋给这些输入以促进处理。当姿势被识别出时，加载与识别出的姿势相关联的语音命令的有限集合以供使用。此外，语音命令的附加集合可按分层方式被结构化，以使得说出来自语音命令的一个集合的语音命令导致系统加载下一集合的语音命令。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机系统的控制，尤其涉及使用结合了声音(诸如语音或拍手)和身体位置(诸如姿态或姿势)两者的复合命令的系统和方法。
技术介绍
通常向计算机游戏和其他多媒体应用的用户提供用户控制，用户控制允许用户完成基本功能(诸如浏览和选择内容)以及执行更复杂的功能(诸如操纵游戏人物)。通常，这些控制通过诸如鼠标、键盘、话筒、图像源、音频源、遥控器等输入设备作为输入被提供给控制器。遗憾的是，学习和使用此类控制命令可能是困难或麻烦的，由此造成了用户与完全享受此类游戏、应用及其特征之间的障碍。
技术实现思路
公开了用于使用结合了声音(诸如语音或拍手)和身体位置(诸如姿态或姿势) 两者的复合命令的系统和方法。多媒体对象被显示在用户界面上。用户界面的控制器包括用于捕捉由用户产生的任何声音以及用户的静态和动态身体位置(包括姿态或姿势)的捕捉设备。该控制器处理所捕捉的数据以识别身体位置命令和声音命令。有利地，使用身体位置命令和声音命令的组合允许用分布在不同的操作状态级别上的较小命令集合来实现该系统。因此，处理身体位置命令和声音命令的组合增强了识别软件的可靠性和准确性。例如，捕捉设备可捕捉与身体位置移动有关的输入并将该移动识别为所定义的姿势。给定所捕捉的输入，与识别出的姿势相关联的语音或声音命令的有限集合可被标识并被加载到控制器中。在接收到声音输入时，基于所加载的声音命令集合识别声音输入。最后，基于识别出的姿势以及识别出的声音命令的组合执行动作。有利地，可在用户界面上提供上下文菜单以帮助用户列出可用的语音或声音命令，且这些上下文菜单本质上可以是分层的。例如，第一姿势可导致...

【技术保护点】
１．一种用于使用语音命令的集合来控制计算系统的方法，包括：在显示监视器上显示一个或多个对象（４１０）；从传感器接收身体位置数据（４１２）；基于接收的身体位置数据识别与所述一个或多个对象有关的姿势（４１４）；基于识别出的姿势选取所述声音命令的集合的子集（４１６），所述声音命令的集合包括多个子集，每个子集与一个或多个姿势以及相应子集的声音命令识别数据相关联；加载所选取的声音命令的子集的声音命令识别数据（４１８）；从话筒接收声音输入（４２０）；使用所加载的声音命令识别数据从所述声音输入识别声音命令（４２２）；以及响应于识别出的声音命令执行动作（４２４）。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：C·克莱因，A·M·瓦赛尔，J·S·弗莱克斯，V·拉尔科，T·M·苏摩，
申请(专利权)人：微软公司，
类型：发明
国别省市：US

全部详细技术资料下载我是这个专利的主人