一种基于深度递归分层条件随机场的人体行为识别方法技术

技术编号：13284451 阅读：61 留言：0更新日期：2016-07-09 01:18

本发明专利技术公开了一种基于深度递归分层条件随机场的人体行为识别方法，首先，分别提取由RGB‑D摄像机拍摄行为动作场景的RGB‑D视频中行为动作主体的人体姿态和可能与其相互交互的物体信息，将这两种信息作为深度递归分层条件随机场的中间层状态，建模预测输出目标状态层中当前状态和当前所有已发生的预测输出状态集合的相关性，构建深度递归分层条件随机场模型；其次，采用BCFW优化方法驱动的结构化支持向量机分类器学习关于人体行为序列的判别分类模型；最后，根据学习得到的模型参数和即得判别模型预测待测试的人体行为序列的类别。本发明专利技术对行为动作具有显著的鲁棒性，在一定程度上提高了人体行为动作的识别准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度递归分层条件随机场的人体行为识别方法
本专利技术涉及一种人体行为识别方法，尤其涉及一种基于深度递归分层条件随机场(DeepRecursiveandHierarchicalConditionalRandomFields，DR-HCRFs)的人体行为识别方法，属于计算机视觉行为识别

技术介绍
人体行为识别在计算机视觉中具有举足轻重的位置，在智能监控、人机交互和体育视频处理等领域中有着广泛的应用。近几年，针对室内场景的行为识别研究主要使用概率图模型的方法对人物行为进行分类解析。常见的概率图模型主要分为两种结构：生成模型和判决模型。常见的生成模型有：隐马尔可夫模型(HiddenMarkovModel)、贝叶斯网络(DBNs)、半马尔可夫模型(Semi-MarkovModels)。生成模型需要对先验信息的分布和相关性进行建模，当输入的变量之间存在较为复杂的相关性时，联合分布的建模将变得复杂甚至不准确。相反使用判决模型对条件概率建模，可以衍生出准确而有效的推断。例如：隐条件随机场(HiddenCRFs)、环状条件随机场(LoopyCRFs)。此外，现有的行为识别研究侧重于在原有技术上加入语义上下文信息，例如物体与行为、行为与行为的上下文信息。通过实验证明这些语义信息能够作为判别模型中的隐状态提高行为识别的准确度。O.Sener和A.Saxena.rCRF于2015年在RSS上发表的《recursivebeliefestimationoverCRFsinRGB-Dactivityvideos》，从RGB视频中提取人体姿态特征和物体启示信息，通过加入...

【技术保护点】
一种基于深度递归分层条件随机场的人体行为识别方法，其特征在于，包括如下步骤：步骤1，获取人体行为的RGB‑D训练视频样本，该RGB‑D训练视频样本包括RGB视频信息、深度信息和人体骨架信息，联合RGB视频信息和人体骨架信息，并从中提取人体姿态特征、交互物体的形状和位置特征，以及人体和交互物体的相对位置特征，将上述特征串联后得到行为表示特征；步骤2，根据步骤1得到的行为表示特征，构建当前视频段中行为表示特征、人体姿态和交互物体组成的中间状态、行为预测标签三部分链接而成的全连通概率图模型，结合训练视频样本中第一个视频段到当前视频段的前一个视频段的行为预测标签，建立当前视频段的深度递归分层条件随机场模型；步骤3，利用平均场近似算法，将步骤2建立的深度递归分层条件随机场模型转换为一阶线性链条件随机场模型；步骤4，利用最大‑间隔算法，学习步骤3得到的一阶线性链条件随机场模型的参数；步骤5，根据步骤3得到的一阶线性链条件随机场模型和步骤4学习得到的参数，识别测试视频样本对应的行为预测标签。

【技术特征摘要】
1.一种基于深度递归分层条件随机场的人体行为识别方法，其特征在于，包括如下步骤：步骤1，获取人体行为的RGB-D训练视频样本，该RGB-D训练视频样本包括RGB视频信息、深度信息和人体骨架信息，联合RGB视频信息和人体骨架信息，并从中提取人体姿态特征、交互物体的形状和位置特征，以及人体和交互物体的相对位置特征，将上述特征串联后得到行为表示特征；步骤2，根据步骤1得到的行为表示特征，构建当前视频段中行为表示特征、人体姿态和交互物体组成的中间状态、行为预测标签三部分链接而成的全连通概率图模型，结合训练视频样本中第一个视频段到当前视频段的前一个视频段的行为预测标签，建立当前视频段的深度递归分层条件随机场模型；步骤3，利用平均场近似算法，将步骤2建立的深度递归分层条件随机场模型转换为一阶线性链条件随机场模型；步骤4，利用最大-间隔算法，学习步骤3得到的一阶线性链条件随机场模型的参数；步骤5，根据步骤3得到的一阶线性链条件随机场模型和步骤4学习得到的参数，识别测试视频样本对应的行为预测标签。2.如权利要求1所述基于深度递归分层条件随机场的人体行为识别方法，其特征在于，所述深度递归分层条件随机场模型的势能函数Ψ(y,h,o,x；ω)为：其中，t＝1,…,T表示训练视频样本的第t个视频段，ω1、ω2、ω3、ω4均表示模型的参数，ht、ot、yt分别表示第t个视频段的人体姿态、交互物体、行为预测标签；表示xt和ht、ot的依赖性，φ(xt)表示第t个视频段中的行为表示特征xt到特征空间的映射函数；表示ht和ot之间的相关性，表示交互物体s在第t视频段中是否...

【专利技术属性】
技术研发人员：刘天亮，王新城，谯庆伟，戴修斌，罗杰波，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人