当前位置: 首页 > 专利查询>英特尔公司专利>正文

使用深度图像的姿势识别制造技术

技术编号:9494085 阅读:57 留言:0更新日期:2013-12-26 05:00
此处公开了与使用深度图像的姿势识别相关联的方法、装置和制品。在各种实施例中,装置可以包括被配置为确定面部是否存在于由深度相机所生成的相应图像帧的一个或多个灰度图像中的面部检测引擎,和被配置为在由深度相机所生成的一个或多个深度图像中跟踪手部的手部跟踪引擎。装置还可以包括被配置为基于手部跟踪引擎的跟踪结果提取特征并至少部分地基于所提取的特征推断手部姿势的特征提取和姿势推断引擎。还公开和声明了其它实施例。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】此处公开了与使用深度图像的姿势识别相关联的方法、装置和制品。在各种实施例中,装置可以包括被配置为确定面部是否存在于由深度相机所生成的相应图像帧的一个或多个灰度图像中的面部检测引擎,和被配置为在由深度相机所生成的一个或多个深度图像中跟踪手部的手部跟踪引擎。装置还可以包括被配置为基于手部跟踪引擎的跟踪结果提取特征并至少部分地基于所提取的特征推断手部姿势的特征提取和姿势推断引擎。还公开和声明了其它实施例。【专利说明】使用深度图像的姿势识别
本公开的实施例涉及数据处理的领域,特别是与姿势识别相关联的方法、装置和制品。
技术介绍
除非另外指明,本节中所描述的材料不是本申请中的权利要求书的现有技术且不因为被包括在本节中而被承认为是现有技术。随着智能电视、智能电话和平板机的迅速发展,存在着创造专利技术性的特征/使用模型以便基于更高的计算能力、更大带宽和更丰富的内容向顾客提供更好的个人化服务、社交网络和增值服务(added value service, AVS)的迫切需求。用户交互在用户体验中扮演重要角色。在已有的用户接口技术中,通常采用键盘、鼠标、跟踪球和其它点击设备。姿势是一种自然的交互方法,而且已经在现实的日常生活中广泛利用。大多数已有的姿势识别系统利用依赖于光线、照明和其它环境条件的公共网络相机。结果是,当前的姿势识别系统通常是不稳定或低效的。【专利附图】【附图说明】作为示例实施例而非限制,在附图中呈现了本公开的各实施例,附图中相同的标记指示相似的元素,附图中:图1根据本公开的各种实施例示出了姿势识别布置的概述;图2根据本公开的各种实施例更详尽地示出了图1的基于姿势的输入服务;图3根据本公开的各种实施例示出了姿势识别方法;图4根据本公开的各种实施例示出了示例深度图像;图5根据本公开的各实施例示出了适合用来实践图1的计算装置的示例计算机系统;以及图6根据本公开的各实施例示出了具有被配置为使装置实践图3的方法的一些或全部方面的编程指令的制品。【具体实施方式】此处公开了与使用深度图像的姿势识别相关联的方法、装置和制品。在各种实施例中,装置可以包括被配置为确定面部是否存在于由深度相机所生成的相应图像帧的一个或多个灰度图像中的面部检测引擎,和被配置为在由深度相机所生成的一个或多个深度图像中跟踪手部的手部跟踪引擎。装置还可以包括被配置为基于手部跟踪引擎的跟踪结果提取特征并至少部分地基于所提取的特征推断手部姿势的特征提取和姿势推断引擎。在各种实施例中,可以将面部检测引擎配置为使用例如Haar-Cascade模型来分析灰度图像以确定面部是否存在于一个或多个灰度图像中。而且,可以将面部检测引擎或手部跟踪引擎配置为使用一个或多个深度图像来确定面部和相机之间的距离测量。在各种实施例中,还可以将手部跟踪引擎配置为选择在大小方面比所述一个或多个深度图像小的深度图像的相应区域,以便至少部分地基于所确定的面部和相机之间的距离来检测和跟踪手部。还可以将手部跟踪引擎配置为确定手部的位置测量。可以将手部跟踪引擎配置为,使用借助概率密度梯度的均值偏移过滤,对一个或多个深度图像中的相应图像以手部中心的(X,y)坐标对来确定位置测量。在各种实施例中,可以将特征提取和姿势推断引擎配置为提取偏心率测量、紧致度测量、方向测量、矩形测量、水平中心测量、垂直中心测量、最小边界框角度测量或最小边界框宽高比测量、左右测量差或上下测量差中的一个或多个。而且,可以将特征提取和姿势推断引擎配置为基于所提取的特征推断张开的手部姿势、闭起的手部拳头姿势、大拇指朝上的姿势、大拇指朝下的姿势、大拇指朝左的姿势或大拇指朝右的姿势中的一个。另外,还可以将特征提取和姿势推断引擎配置为通知应用关于所推断的手部姿势。在各种实施例中,装置还可以包括相机。装置可以是从台式计算机、膝上型计算机、平板计算机、服务器、智能手机、个人数字助理、游戏控制台或机顶盒中选择的一个。在各种实施例中,第一方法可以包括由计算装置在由深度相机所生成的一个或多个深度图像的所选相应区域中跟踪手部,其中所选相应区域在大小方面比所述相应的一个或多个深度图像小。第一方法还可以包括由计算设备至少部分地基于跟踪的结果推断手部姿势。在各种实施例中,第二方法可以包括由计算装置从由深度相机所生成的图像帧的深度图像的相应区域中提取一个或多个特征。第二方法还可以包括由计算装置至少部分地基于从深度图像所提取的一个或多个特征来推断姿势。现在将使用由本领域技术人员为将其工作的实质传达给本领域其他技术人员而普遍采用的术语进一步描述说明性实施例的各种方面。然而对于那些本领域技术人员显而易见的是,可以将替代实施例实践为所述方面的仅仅一部分。为了解释的目的,叙述了具体数字、材料和配置以提供对说明性实施例的全面理解。然而对于本领域技术人员显而易见的是,没有这些具体细节也可以实践各替代实施例。在其它实例中,省略或简化了公知的特征以便不阻碍说明性实施例。还以最有助于理解说明性实施例的方式将各种操作进而描述为多个具体操作;然而描述的顺序不应被解释为暗示这些操作必然是依赖顺序的。特别是,这些操作不必以呈现的顺序被执行。以括号的格式描述的特征指示所述特征为可选特征,例如,“应用服务的(分区的)实例”指示所述应用服务可为/可不为“分区的”。重复使用了短语“在一实施例中”。此短语通常不指同一实施例;但可指。除非上下文另外指明,术语“包含”、“具有”和“包括”是同义的。短语“A/B”意味着“A或B”。短语“A和/或B”意味着“(A)、(B)或(A和B)”。短语“A、B和C中的至少一个”意味着“(A)、(8)、(0、(六和幻、(六和C)、(B和C)或(A、B和C)”。短语“(A)B”意味着“(B)或(AB)”,即A是可选的。图1根据本公开的各种实施例示出了姿势识别布置的概述。如所示的,对于各实施例,计算装置102结合基于姿势的输入服务114,可以耦合于具有深度特征的相机106以便使人员104能够使用姿势,特别是手部姿势,向在装置102上操作的应用112提供输入。除了基于姿势的输入服务(WTSgbis) 114之外,计算装置102可以是本领域内已知的多个计算设备中的任何一个。这样的计算设备的示例包括但不限于台式计算机、膝上型计算机、平板计算机、智能电话、个人数字助理、游戏控制台和/或机顶盒。同样,除了可以通过由GBIS114提供的服务接收姿势输入之外,应用112可以是得益于姿势输入的多个应用(例如游戏、媒体播放器、视频应用等)中的任何一个。对于各实施例,除了应用112和GBIS114之外,装置102还可以包括系统服务116以用来提供各种各样的系统服务,包括但不限于对应用112和GBISl 14的通信服务和对相机106的外设服务。计算装置102和相机106之间的耦合可以是有线或无线的。对于各实施例,还可以将系统服务116配置为支持通过计算装置102对网络的访问。网络可以是有线或无线的、局域或广域的、私有或公共的,包括例如因特网(Internet)。相机106可以是本领域内已知的被配置为捕捉和输出图像巾贞,包括确定目标物体与相机的距离、输出各种图像帧的深度图像和灰度图像的任何深度相机。适用相机的示例可以是DImager,可从日本的松下(Pan本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:X·童D·丁W·李Y·张
申请(专利权)人:英特尔公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1