使用深度信息识别视频图像序列中的活动制造技术

技术编号：19878595 阅读：23 留言：0更新日期：2018-12-22 18:03

提供了用于识别包括深度信息的视频图像帧的序列中的活动的技术。体现这些技术的方法包括将每个接收的图像帧分割成多个窗口，以及，生成多个时空图像单元格，图像单元格来自所述帧的所选择的子序列的窗口的分组。该方法还包括计算每个图像单元格的每个像素的四维(4D)光流矢量，以及，计算每个光流矢量的三维(3D)角度表示。该方法进一步包括基于每个图像单元格中的像素的3D角度表示的柱状图来生成该图像单元格的分类特征。接着，将分类特征提供给识别分类器，识别分类器被配置成基于所生成的分类特征来识别视频序列中描绘的活动的类型。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用深度信息识别视频图像序列中的活动
技术介绍
识别图像序列或视频中描绘的活动的类型的能力常常是有用的，例如在监控应用、机器人应用、视频游戏中，或者作为更复杂的图像处理系统中的首要操作。不幸的是，由于照明、背景干扰、主体的姿势、视角等的变化，自动的活动识别是相对困难的计算问题。现有的方法常常采用词典学习或聚类方法并且趋于计算上昂贵的，需要长时间的分类训练和/或相对快的处理器。即使这样，这些方法并不趋于是稳健的，导致可能不可接受的活动识别精度。附图说明本专利或申请文件包含以彩色执行的至少一个附图。具有(一个或多个)彩色附图的本专利或专利申请公布的副本将在专利局收到请求并支付必要的费用之后来提供。随着以下详细描述的进行，以及在参考附图之后，所要求保护的主题的实施例的特征和优点将变得显而易见，其中相同的附图标记描绘相同的部分。图1是按照这里所公开的某些实施例配置的活动识别系统的实现的顶层框图。图2图示了按照这里所公开的某些实施例的人类活动的深度图像帧序列的示例。图3是按照这里所公开的某些实施例配置的活动识别系统的更详细的框图。图4图示了按照这里所公开的某些实施例的图像帧裁剪。图5图示了按照这里所公开的某些实施例的图像单元格。图6图示了按照这里所公开的某些实施例的2D光流矢量。图7图示了按照这里所公开的某些实施例的4D光流矢量的角表示。图8图示了按照这里所公开的某些实施例的基于柱状图的特征生成。图9是图示按照这里所公开的某些实施例的用于深度图像中的活动识别的方法的流程图。图10是示意性图示按照这里所公开的某些实施例的被配置为执行活动识别的系统平台的框图。虽然以下详细描述...

【技术保护点】
1.一种用于深度相机生成的图像中的活动识别的处理器实现的方法，该方法包括：由处理器接收深度图像帧的序列，深度图像帧包括多个像素；由处理器将每个帧分割成多个窗口；由处理器生成多个时空图像单元格，图像单元格包括：来自所述帧的所选择的子序列的窗口的分组；由处理器计算每个图像单元格的每个像素的四维(4D)光流矢量；由处理器计算每个光流矢量的三维(3D)角度表示；由处理器基于3D角度表示的柱状图来生成每个图像单元格的分类特征；以及，由处理器执行识别分类器以基于分类特征来识别活动。

【技术特征摘要】
【国外来华专利技术】1.一种用于深度相机生成的图像中的活动识别的处理器实现的方法，该方法包括：由处理器接收深度图像帧的序列，深度图像帧包括多个像素；由处理器将每个帧分割成多个窗口；由处理器生成多个时空图像单元格，图像单元格包括：来自所述帧的所选择的子序列的窗口的分组；由处理器计算每个图像单元格的每个像素的四维(4D)光流矢量；由处理器计算每个光流矢量的三维(3D)角度表示；由处理器基于3D角度表示的柱状图来生成每个图像单元格的分类特征；以及，由处理器执行识别分类器以基于分类特征来识别活动。2.如权利要求1的方法，进一步包括：检测每帧中的感兴趣的主题并且关于感兴趣的主题来裁剪该帧。3.如权利要求2的方法，进一步包括：使得每个裁剪后的帧相对于另一裁剪后的帧在空间上对齐。4.如权利要求1或2的方法，其中计算4D光流矢量进一步包括：基于施加到图像单元格的像素上的组合的局部-全局能量最小化函数来计算二维(2D)光流矢量；基于所计算的连续帧中的相应的像素之间的差来将第三维添加到2D光流矢量；以及将第四维添加到2D光流矢量，第四维包括预先确定的标量值。5.如权利要求1的方法，其中分类特征的生成进一步包括：将柱状图与3D角度表示的每个维度相关联，该柱状图包括与多个角度范围中的每一个相对应的长柱；基于与每个长柱相关联的图像单元格中的每个像素的幅度来增加所述长柱；归一化柱状图；以及，串联柱状图以生成分类特征。6.如权利要求5的方法，其中，柱状图长柱的数量在5至9个长柱的范围。7.如权利要求1或2的方法，其中，识别分类器是支持矢量机(SVM)分类器。8.如权利要求1或2的方法，进一步包括训练识别分类器，训练包括：接收对应于已知的活动的训练深度图像帧的序列；生成训练帧的每个图像单元格的分类特征；以及，提供分类特征和与已知的活动相关联的标签到识别分类器以用于训练。9.一种用于深度相机生成的图像中的活动的识别的系统，该系统包括：单元格生成电路，用于：接收深度图像帧的序列，深度图像帧包括多个像素；将每个帧分割成多个窗口；以及，生成多个时空图像单元格，图像单元格包括来自所述帧的所选择的子序列的窗口的分组；光流计算电路，用于；计算每个图像单元格的每个像素的四维(4D)光流矢量；角度计算电路，用于计算每个光流矢量的三维(3D)角度表示；单元格特征计算电路，用于基于3D角度表示的柱状图来生成每个图像单元格的分类特征；以及，识别分类器电路，用于基于分类特征来识别活动。10.如权利要求9的系统，进一步包括：裁剪和对齐电路，用于检测每帧的感兴趣的主题并且关于感兴趣的主题而裁剪该帧。11.如权利要求10的系统，其中，裁剪和对齐电路进一步用于使得每个裁剪后的帧相对于另一裁剪后的帧在空间上对齐。12.如权利要求9或10的系统，其中，光流计算电路进一步包括：2D光流计算电路，用于基于施加到图像单元格的像素上的组合的局部-全局能量最小化函数来计算二维(2D)光流矢量；以及，3D/4D光流计算电...

【专利技术属性】
技术研发人员：唐绍鹏，姚安邦，陈玉荣，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人