基于深度与RGB信息和多尺度多方向等级层次特征的行为识别方法技术

技术编号：9143509 阅读：372 留言：0更新日期：2013-09-12 05:02

一种基于深度与RGB信息和多尺度多方向等级层次特征的行为识别方法。具体包含以下步骤：视频预处理；目标运动变化过程描述；多尺度多方向等级层次特征提取；模型构建；模型选择和推断。本发明专利技术首先利用深度图像进行行为识别能够克服可见光图像行为识别常遇到的困难，如光照变化、阴影、物体遮挡等因素的干扰；其次本发明专利技术提出的深度差值运动历史图像和深度限制RGB图差值运动历史图像能很好捕获深度图像序列和RGB图像序列中人体行为的变化过程；再次本发明专利技术公开的多尺度多方向等级层次特征既有空间分辨能力也有细节描述能力，且具有很好的鲁棒性和区分性；最后、根据光线的亮暗，可自主选择模型，进一步提高了行为识别算法的适应性。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度与RGB信息和多尺度多方向等级层次特征的行为识别方法
本专利技术属于计算机视觉和模式识别
，涉及一种基于深度与RGB信息和多尺度多方向等级层次特征的行为识别方法，解决利用可见光图像进行行为识别的困难，并提高行为识别的准确性和鲁棒性，可以用于对监控视频中人体目标的行为识别，实现对监控视频的智能化管理。
技术介绍
随着计算机技术和信息技术的发展，对基于视频的人体行为分析的需求越来越迫切，在诸如智能监控、家居安全、智能机器人、运动员辅助训练等系统中，行为分析起到了越来越重要的作用。然而早期的人体行为识别大多是利用普通的RGB图像序列进行行为分析，这样会受到光照、阴影、色度、环境变化等因素的干扰。利用深度图像进行人体行为识别是近年来兴起的技术。这主要得益于深度图摄像机的成本降低，特别是微软推出Kinect设备。与可见光图像不同，深度图像像素值仅与物体空间位置有关，不会受光照、阴影、色度、环境变化等因素的干扰，能够有效地突破可见光图像识别遇到的问题和瓶颈。在一定的空间范围内，深度图像可以用来进行3D空间中的行为识别，代替可见光摄像机的双目视觉。因为人体运动分析在高级人机交互、视频会议、安全监控、医疗诊断、基于内容的图像存储和检索等方面，具有潜在的经济价值和广泛的应用前景，因此利用深度图像进行行为分析得到国内外广大机器视觉研究者们的关注。在计算机视觉和模式识别相关研究领域中，提高人体行为识别的准确性和稳定性一直是最活跃的研究问题之一，并且能够设计出一种鲁棒的行为描述法也是一个重点和难点。由于利用可见光图像会受到光照、阴影、色度、环境变化等因素的干扰，在识...
基于深度与RGB信息和多尺度多方向等级层次特征的行为识别方法

【技术保护点】
一种基于深度与RGB信息和多尺度多方向等级层次特征的行为识别方法，该方法具体包含以下步骤：第1、视频预处理预处理包括对输入的深度和RGB图像序列滤波去噪，同时，通过Kinect设备的红外装置，可以测出目标与摄像头的大概距离，根据该距离值，加上0.5获得大阈值，减去1获得小阈值；当某像素的深度值大于该阈值时，将该像素标记为0，否则标记为1，这样，能够移除背景对目标的干扰；第2、运动变化过程描述（1）捕获深度视频序列人体变化过程，获得深度差值运动历史图像；（2）捕获RGB视频序列人体运动变化过程，获得深度限制RGB图差值运动历史图像；第3、多尺度多方向等级层次特征提取在第2步获得的深度差值运动历史图像和深度限制RGB差值运动历史图像的基础上，分别寻找图像中非零像素，从而获得对应的人体历史运动的矩形区域，并在该区域内，提取多尺度多方向的等级层次特征描述对应的人体行为；?第4、不同模型构建公共行为数据集DHA中每个样本都包括RGB和深度图像序列，同时，该数据集被划分为训练数据集和测试数据集，按照第3步的方法，为DHA的训练数据集中的每个样本分别提取深度图像序列和RGB图像序列上的多尺度多方向的...

【技术特征摘要】
1.一种基于深度与RGB信息和多尺度多方向等级层次特征的行为识别方法，该方法具体包含以下步骤：第1、视频预处理预处理包括对输入的深度和RGB图像序列滤波去噪，同时，通过Kinect设备的红外装置，可以测出目标与摄像头的大概距离，距离单位为米，根据该距离值，加上0.5米获得大阈值，减去1米获得小阈值；当某像素的深度值大于大阈值或小于小阈值时，将该像素标记为0，否则标记为1，这样，能够移除背景对目标的干扰；第2、运动变化过程描述(1)捕获深度视频序列人体变化过程，获得深度差值运动历史图像；(2)捕获RGB视频序列人体运动变化过程，获得RGB差值运动历史图像；第3、多尺度多方向等级层次特征提取在第2步获得的深度差值运动历史图像和RGB差值运动历史图像的基础上，分别寻找图像中非零像素，从而获得对应的人体历史运动的矩形区域，并在该区域内，提取多尺度多方向的等级层次特征描述对应的人体行为；第4、不同模型构建公共行为数据集DHA中每个样本都包括RGB和深度图像序列，同时，该数据集被划分为训练数据集和测试数据集，按照第3步的方法，为DHA的训练数据集中的每个样本分别提取深度图像序列和RGB图像序列上的多尺度多方向的等级层次特征，然后，在训练数据集上分别训练基于深度的多尺度多方向的等级层次特征和基于深度、RGB融合的多尺度多方向的等级层次特征的支持向量机模型；第5、模型选择和模型推断在公共行...

【专利技术属性】
技术研发人员：高赞，申晓霞，张桦，薛彦兵，徐光平，
申请(专利权)人：天津理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人