利用深度成像扩充语音识别制造技术

技术编号：11833080 阅读：113 留言：0更新日期：2015-08-05 19:21

公开了涉及使用深度成像来扩充语音识别的实施例。例如，一个所公开的实施例在计算设备上提供了一种方法，其包括从深度相机接收物理空间的深度信息，从一个或多个麦克风接收音频信息，从音频信息辨识一个或多个可能的口语词语的集合，基于将来自音频信息的一个或多个可能的口语词语的集合与深度信息比较，确定用于计算设备的语音输入，以及基于所确定的语音输入在计算设备上采取行动。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】
技术介绍
计算机化语音识别设法辨识来自音频信息、诸如来自经由一个或多个麦克风接收的音频信号的口语词语。然而，在辨识音频信息中的口语词语中可能出现歧义。另外，口语词语的上下文(例如口语词语是否意图作为对计算设备的语音输入)可能无法从这样的音频信息容易地确定。
技术实现思路
公开了涉及扩充语音识别的深度成像的使用的实施例。例如，一个公开的实施例在计算设备上提供了一种方法，其包括从深度相机接收物理空间的深度信息，从一个或多个麦克风接收音频信息，从音频信息辨识一个或多个可能的口语词语的集合，基于将来自音频信息的一个或多个可能的口语词语的集合与深度信息比较，确定用于计算设备的语音输入，以及基于所确定的语音输入在计算设备上采取行动。提供本
技术实现思路
来以简化的形式引入在以下【具体实施方式】中进一步描述的概念的选择。本
技术实现思路
不意图辨识所要求保护的主题的关键特征或本质特征，也不意图用于限制所要求保护的主题的范围。另外，所要求保护的主题不限于解决在本公开的任何部分中指出的任何或全部缺点的实现方式。【附图说明】图1示出根据本公开的实施例的语音识别环境的示意性示例。图2是图示了根据本公开的实施例的用于识别语音的方法的流程图。图3是图示了根据本公开的另一实施例的用于识别语音的方法的流程图。图4是图示了根据本公开另外的实施例的用于识别语音的方法的流程图。图5示意性地示出非限制性计算系统。【具体实施方式】计算机化语音识别可能构成各种挑战。例如，各个词语的发音、口音、尖利性、语气、瑕疵/语言障碍和人类语音的其它变量可能广泛地在用户之间不同。此外，回声和/或噪音...

【技术保护点】
在计算设备上，一种用于识别用户的语音的方法，包括：从深度相机接收物理空间的深度信息；从一个或多个麦克风接收音频信息；从音频信息辨识一个或多个可能的口语词语的集合；基于将来自音频信息的所述一个或多个可能的口语词语的集合与深度信息比较，确定用于计算设备的语音输入；以及基于所确定的语音输入在计算设备上采取行动。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：J卡普尔，I塔舍夫，M塞尔策尔，SE霍奇斯，
申请(专利权)人：微软技术许可有限责任公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人