当前位置: 首页 > 专利查询>英特尔公司专利>正文

实时的连续交互学习及检测制造技术

技术编号:12220131 阅读:94 留言:0更新日期:2015-10-21 23:20
系统和方法可以提供:将多个训练样本划分为第一质心顺序列表,移除所述第一质心顺序列表中的一个或多个重复质心以获取第一精简的质心列表,以及基于所述第一精简的质心列表来生成隐马尔可夫模型(HMM)参数的集合。此外,可以将多个检测样本划分为第二质心顺序列表,其中,可以移除所述第二质心顺序列表中的一个或多个重复质心以获取第二精简的质心列表。可以使用所述第二精简的质心列表来确定所述多个检测样本与HMM参数的集合之间的匹配概率。在一个示例中,精简的质心列表缺乏时间变化性。

【技术实现步骤摘要】
【国外来华专利技术】
实施例整体上涉及对交互(例如,姿势和语言输入)进行的基于计算机的检测。更具体地,实施例涉及实时人机交互的连续学习和检测。
技术介绍
人体运动具有很多细微之处,这些细微之处使得难以对运动进行建模,虽然在合理的时间框架中并非不可能。例如,由于在对给定姿势进行建模中可能要考虑空间和时间因素二者,因此,对于需要检测其姿势的群体在该姿势被多快地执行可能具有巨大的差异。将这些变动考虑在建模中可能引入不确定性,这种不确定性可能降低姿势检测决策的准确性。此外,传统的检测算法可能针对感兴趣的姿势的潜在起点和终点执行耗时的搜索。这可能使性能减慢并且使紧接的(back-to-back)姿势的检测(例如,连续检测)变得不可行。简言之,对实时系统而言,常规姿势学习和检测系统的处理时间可能是过长的。【附图说明】通过阅读以下说明和所附的权利要求,以及通过参照以下附图,实施例的各种优点对本领域技术人员而言将变得显而易见,在附图中:图1是根据实施例的学习/训练序列的示例的框图;图2是根据实施例的检测序列的示例的框图;图3是根据实施例的处理训练样本的方法的示例的流程图;图4是根据实施例的处理检测样本的方法的示例的流程图;图5是根据实施例的计算设备的示例的框图;图6是根据实施例的处理器的示例的框图;以及图7是根据实施例的系统的示例的框图。【具体实施方式】现转向图1,示出了针对多个训练样本16(16a-16c)的训练序列10。在一个示例中,训练样本16表示在一个或多个训练会话期间由例如图像/深度传感器等的传感器14捕获的姿势样本(例如,人体姿势输入)。在这样的情况下,训练样本16可以在训练会话期间从空间坐标12 (例如,二维/2D、三维/3D、n维)中获得,所述空间坐标12与一个或多个对象(例如,人类、动物、机器人、机器)的物理部件(例如,手、手指、虹膜等)的位置相对应。例如,训练样本的第一集合16a可以与第一对象(例如,来自第一群体统计的个体)相对应,训练样本的第二集合16b可以与第二对象(例如,来自第二群体统计的个体)相对应,训练样本的第三集合16c可以与第三对象(例如,来自第三群体统计的个体)相对应等。当对象做出例如圆周形的手部运动等的特定的手部动作时,可以对该对象进行可视化地监测和/或记录。训练样本16还可以表示语音样本(例如,人类语言输入),其中,传感器14可以包括在训练会话期间设置于一个或多个对象的可听范围内的麦克风。在这样的情况下,训练样本16可以包括从语言输入提取的音素数据。其他类型的交互数据还可以用于训练样本16。训练样本16可以经历聚类过程18,所述聚类过程18确定针对训练样本16的群集集合20( “CO”到“C5”)。可以基于目标分辨率来预先确定该群集集合20中的群集的数量。在这一点上,在设置群集的数量时,可以在分辨率和处理速度之间进行某些折衷。聚类过程18还可以确定与群集集合20相对应的群集质心集合22,其中,质心集合22中的每一个质心可以指示相对应的群集的中心点。此外,可以将多个训练样本16中的每一个训练样本分配给群集质心集合22中的质心。由此,可以将空间坐标12中的每一个分配给最近的质心,以便于进行所述分配。在一个示例中,聚类过程18使用k均值(k-means)聚类来确定训练样本16的群集集合20和群集质心集合22。例如,k均值聚类可以提供:将质心放置为尽可能远离另一个,以及将属于训练样本16的每一个样本与最近的质心相关联以获取“早期编组(early groupage)”。当没有样本未决时,可以将k个新的质心重新计算为由早期编组产生的群集的“重心(barycenter) ”。一旦已经确定该k个新质心,则新的绑定可以在训练样本16和最近的新质心之间完成。结果可以是一个循环,在该循环中k个质心逐步改变它们的位置,直到不再做出变化为止。如将要更加详细讨论的,每一个质心可以由唯一的值来标识,以在训练隐马尔可夫模型(HMM)时使用。HMM通常可以包含多个状态,其中每一个状态具有相关联的观测概率分布,该观测概率分布确定在时间上的特定时刻处以及每一对状态处生成观测的概率,并且具有相关联的转移概率。在一个示例中,可以使用诸如Baum-Welch算法等的算法和/或过程来训练HMM。由此,所示出的聚类过程18将训练样本16划分为质心顺序列表24(24a_24c)。例如,质心顺序列表24中的第一列24a可以与训练样本的第一集合16a相对应,第二列24b可以与训练样本的第二集合16b相对应,第三列24c可以与训练样本的第三集合16c相对应等,其中,质心顺序列表24中的项可以包含质心的唯一值/标识符。特别注意的是,示出的质心顺序列表24包括顺序重复质心,例如,重复质心26,其表示训练样本16的时间维度(例如,取决于采样率)。如将要更详细地讨论的,移除这样的时间维度可以继而消除时间变化性,并且使得能够对交互进行实时、连续的学习和检测。更特别地,质心顺序列表24可以经受过滤过程28,过滤过程28从质心顺序列表24中移除诸如重复质心26等的顺序重复中心,以获得精简的质心列表30(30a-30c)。因此,所示出的精简的质心列表24缺乏时间变化性。该精简的质心列表30可以随后被供给HMM训练过程32,其基于精简的质心列表30来生成HMM参数的集合34。群集集合20可以具与有在HMM中的状态的一对一映射。通过有效地使群集间转移的优先级高于群集内转移(例如,使CO — Cl的转移的优先级高于CO — CO转移),这样的方式可以创建具有增强的鲁棒性的模型。如将更详细地讨论的,增强的鲁棒性可以进一步利于对交互进行实时、连续的学习和检测。图2示出了检测序列36,在检测序列36中,与空间坐标38相关联的多个检测样本40被供给到质心分配过程42。因此,检测样本40可以表示在系统(例如,游戏系统、视频会议系统、消息传送系统、社交网络系统等)的实时操作期间由传感器46捕获的姿势样本、语音样本等。示出的质心分配过程42基于在训练序列(例如,已经讨论过的训练序列10(图1))中确定的相同群集和质心布置来将检测样本40划分为质心顺序列表44。质心顺序列表44因此可以具有时间维度,过滤过程28通过从质心顺序列表44中移除一个或多个顺序重复质心(例如,质心48)来消除该时间维度。其结果是,可以获取精简的质心列表50,其中,精简的质心列表50缺乏时间变化性。简言之,移除重复质心48可以保持从一个群集到另一个群集的转移,同时消除对在特定的群集上持续时间的依赖性。示出的检测序列36还提供:使用精简的质心列表50来确定检测样本40与同训练会话相关联的HMM参数的集合34之间的一个或多个匹配概率52。更特别地,可以将滑动窗口 54应用到精简的质心列表50来获取用于前向算法58的候选列表56。例如,候选列表56中的第一项是,从右到左,“Cl、C5、C4、C3、C2、Cl”,其与所示出的示例中的滑动窗口 54的最右端位置相对应。类似地,候选列表56中的第二项是,从右到左,“C5、C4、C3、C2、Cl、CO”,其与所示出的示例中的滑动窗口 54的下一位置相对应。候选列表56中的每一项可以被经受前向算法58,以便确定底层交互(例如,姿势交互、语音交互)的匹配概率5本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/CN104995664.html" title="实时的连续交互学习及检测原文来自X技术">实时的连续交互学习及检测</a>

【技术保护点】
一种用于处理训练样本的装置,包括:划分模块,将多个训练样本划分为质心顺序列表;过滤器,移除所述质心顺序列表中的一个或多个重复质心以获取精简的质心列表;以及参数模块,基于所述精简的质心列表来生成隐马尔科夫模型(HMM)参数集合。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:C·埃文斯
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1