当前位置: 首页 > 专利查询>微软公司专利>正文

语音和手势识别增强制造技术

技术编号:11206854 阅读:65 留言:0更新日期:2015-03-26 15:17
增强了对计算设备的用户输入的识别。用户输入是语音或通过用户作出屏幕接触手势而输入的手写数据,或者是用户所说的一个或多个规定单词以及用户所作出的一个或多个规定屏幕接触手势的组合,或者用户所说的一个或多个规定单词以及用户所作出的一个或多个规定非屏幕接触手势的组合。

【技术实现步骤摘要】
【国外来华专利技术】背景移动计算设备的计算能力和功能持续地快速增长。现在,可购买到各种类型的移动计算设备,它们使用户在移动时能够担负得起并且方便地执行完全胜任的计算和数据通信活动。如今的移动计算设备通常集成各种功能,包括多个不同无线数据通信能力、触敏显示屏、一个或多个话筒、以及一个或多个摄像机。智能电话和平板计算机是这类移动计算设备的两个热门示例。对于移动计算设备用户可用的移动计算应用的数目和类型也持续地快速增长,经常使用移动计算设备来执行他们的在线计算和信息管理任务的人的数目也是如此。事实上,移动计算设备已经成为许多人的主要计算设备。基于如今的移动计算设备(诸如智能电话和平板计算机)的紧凑尺寸和手持性质,这些设备不包括全尺寸的物理键盘或鼠标。因此,如今的移动计算设备用户经常使用设备的触摸显示屏、话筒和摄像机来与他们的移动计算设备交互。换言之,移动计算设备用户经常利用他们的移动计算设备的触摸显示屏、话筒和摄像机来将命令和数据输入到设备中。另外,其它类型的个人计算设备(诸如膝上型计算机和台式计算机)普遍包括一个或多个话筒,并且可配备有触敏显示屏和一个或多个摄像机。平面计算机(也称为台面计算机)也包括触敏显示屏和一个或多个摄像机,并且可配备有一个或多个话筒。这类个人计算设备或平面计算机的用户能够利用设备/计算机的触敏显示屏、话筒和摄像机来将命令和数据输入到设备/计算机中。事实上,即将到来的一代计算设备操作系统将包括对于这类“替代”类型的命令和数据输入的增强的支持。概述提供本
技术实现思路
是为了以简化的形式介绍将在以下详细描述中进一步描述的一些概念。本概述不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。此处描述的语音和手势识别增强技术实施例一般地涉及对计算设备的用户输入的识别的增强。在一个示例性实施例中,计算设备既支持语音又支持触摸,并且用户输入是包括用户所说出的一个或多个单词的语音,或者包括通过用户作出屏幕接触手势而手写的一系列字符的手写数据。在接收到用户输入之后,因用户而异的补充数据上下文被用于缩减用户输入识别子系统的词汇表,其中只要用户输入是语音用户输入识别子系统就是语音识别子系统,而只要用户输入是手写数据用户输入识别子系统就是手写识别子系统。用户输入识别子系统以及经缩减的词汇表随后被用于将用户输入转换成可识别文本,该可识别文本形成用户输入识别子系统所预测的对应于用户输入的单词或单词序列,其中经缩减的词汇表用于最大化这一转换的准确度。在另一示例性实施例中,计算设备既支持语音又支持触摸,并且用户输入是用户所说出的一个或多个规定单词以及用户作出的一个或多个规定屏幕接触手势的组合。在接收用户输入之后,用户输入被解释。该解释随后被用来实施与单词和手势的组合相关联的适当的命令,其中这一组合允许用户以自然和高效的方式与计算设备交互并控制计算设备。在又一示例性实施例中,计算设备既支持语音又支持视觉,并且用户输入是用户所说出的一个或多个规定单词以及用户作出的一个或多个规定非屏幕接触手势的组合。在接收用户输入之后,用户输入被解释。该解释随后被用来实施与单词和手势的组合相关联的适当的命令,其中这一组合允许用户以自然和高效的方式与计算设备交互并控制计算设备。附图简述参考以下描述、所附权利要求书以及附图,将更好地理解此处所描述的语音和手势识别增强技术实施例的具体特征、方面和优点,附图中:图1是以简化的形式示出常规语音识别子系统的示例性实施例的示图。图2是以简化的形式示出常规在线手写识别子系统的示例性实施例的示图。图3是以简化形式示出用于增强对于计算设备的用户输入的识别的过程的示例性实施例的流程图,其中用户输入是语音或者手写数据中的任意一种。图4是以简化形式示出用于使用因用户而异的补充数据上下文来缩减用户输入识别子系统的词汇表的过程的一个实施例的流程图。图5是以简化形式示出用于使用因用户而异的补充数据上下文来缩减用户输入识别子系统的词汇表的过程的另一实施例的流程图。图6是以简化形式示出用于增强对用户输入到支持语音且支持触摸的计算设备的命令的识别的过程的示例性实施例的流程图。图7是以简化形式示出用于增强对用户输入到支持语音且支持视觉的计算设备的命令的识别的过程的示例性实施例的流程图。图8是以简化的形式示出由用户形成的下划线空中手势的示例性实施例的示图。图9是示出其上可实现本文所述的语音和手势识别增强技术的各实施方式和元素的通用计算机系统的简化示例的示图。具体实施方式在以下对语音和手势识别增强技术实施例(此后简称为“识别增强技术实施例”)的描述中,对附图进行了参考,附图形成了实施例的一部分且在其中作为说明示出了可在其中实践该识别增强技术的具体实施例。可以理解,可以使用其它实施例并且可以做出结构上的改变而不背离识别增强技术实施例的范围。还应注意,出于清楚的目的,在描述此处所描述的识别增强技术实施例中将依靠具体的术语,但并不意味着这些实施例被限制于所选择的具体术语。此外,应当理解的是,每个具体术语包括以宽泛地类似方式工作以实现类似目的的所有其技术等同物。此处提及“一个实施例”、或“另一实施例”、或“示例性实施例”、或“替代实施例”、或“一个实施方式”、或“另一实施方式”、或“示例性实施方式”、或“替代实施方式”意味着结合实施例或实施方式描述的特定特征、结构或特性可被包括在识别增强技术的至少一个实施例中。在本说明书中各个地方出现短语“在一个实施例中”、“在另一实施例中”、“在示例性实施例中”、“在替代实施例中”、“在一个实施方式中”、“在另一实施方式中”、“在示例性实施方式中”、“在替代实施方式中”不一定全都指同一实施例或实施方式,也不是与其他实施例/实施方式互斥的单独或替换实施例/实施方式。此外,表示识别增强技术的一个或多个实施例或实施方式的过程流的顺序并不固有地指示任何特定顺序,也不暗示对识别增强技术的任何限制。术语“屏幕接触手势”在此处用于指代由用户经由给定的手写模态(诸如由用户握持的笔或指示笔、或用户的手指,诸如此类)直接在计算设备的触敏显示屏上作出的物理轻击或敲击、或复合敲击中的任意一者。术语“支持触摸的计算设备”在此处用于指代包括触敏显示屏的计算设备,该触敏显示屏能够检测用户在显示屏上作出的屏幕接触手势的存在、位置以及移动路径(如果适用的话)并随后解释该手势。术语“支持语音的本文档来自技高网
...

【技术保护点】
一种用于增强对用户输入到支持语音且支持触摸的计算设备的命令的识别的计算机实现的过程,包括:使用所述计算设备来执行以下过程动作:接收用户输入,所述用户输入是由所述用户说出的一个或多个规定单词和由所述用户作出的一个或多个规定屏幕接触手势的组合;解释所述用户输入;以及使用所述解释来实施与所述单词和手势的组合相关联的适当的命令,其中所述组合允许用户以自然和高效的方式与所述计算设备交互并控制所述计算设备。

【技术特征摘要】
【国外来华专利技术】2012.07.20 US 13/554,5131.一种用于增强对用户输入到支持语音且支持触摸的计算设备的命令的识别
的计算机实现的过程,包括:
使用所述计算设备来执行以下过程动作:
接收用户输入,所述用户输入是由所述用户说出的一个或多个规定单词和由
所述用户作出的一个或多个规定屏幕接触手势的组合;
解释所述用户输入;以及
使用所述解释来实施与所述单词和手势的组合相关联的适当的命令,其中所
述组合允许用户以自然和高效的方式与所述计算设备交互并控制所述计算设备。
2.如权利要求1所述的过程,其特征在于,所述用户首先说出所述一个或多
个规定单词,随后作出所述一个或多个规定屏幕接触手势。
3.如权利要求1所述的过程,其特征在于,所述用户首先作出所述一个或多
个规定屏幕接触手势,随后说出所述一个或多个规定单词。
4.如权利要求1所述的过程,其特征在于,所述用户说出所述一个或多个规
定单词中的给定的一个单词,并基本并发地作出所述一个或多个规定屏幕接触手势
中给定的一个屏幕接触手势。
5.一种用于增强对用户输入到支持语音且支持视觉的计算设备的命令的识别
的计算机实现...

【专利技术属性】
技术研发人员:S·巴斯彻A·古普塔
申请(专利权)人:微软公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1