基于时空多尺度统计匹配模型的动作检测方法技术

技术编号：17442361 阅读：41 留言：0更新日期：2018-03-10 15:10

本发明专利技术公开了一种基于时空多尺度统计匹配模型的动作检测方法，首先通过挖掘高斯差分LARK(GLARK)特征来编码局部内容相似性。这种特征可以很好地描述弱边缘的形状和走势，并提出了一种基于时空多尺度统计匹配的SMSM模型，平衡了局部小窗口GLARK结构和局部大窗口邻域结构之间的关系。其次，在SMSM模型中采用多尺度复合模板集，并对不同尺度大小的可变动作能够鲁棒检测。实验表明，本方法解决了背景干扰带来的弱边缘漏检问题，提升了多尺度匹配效率，能够准确地检测动作。

全部详细技术资料下载

【技术实现步骤摘要】
基于时空多尺度统计匹配模型的动作检测方法
本专利技术属于视频目标检测识别领域，涉及一种基于时空多尺度统计匹配模型的动作检测方法。
技术介绍
在过去的20年中，级联分类和贝叶斯法则等方法逐渐被提了出来。为了确定分类器的参数，传统的目标检测方法需要大量的训练，这就造成了实时性差的问题。近年来，有人提出了一种新的无训练方法。2007年，H.Takeda提出了经典核回归来恢复图像的高频信息，这可以用来降噪。2009年，P.Milanfar研究出了自适应核回归的方法来去除噪声，提高图像的细节和目标检测。同年，H.J.Seo和P.Milanfar作出了进一步的努力，并提出了局部自适应回归核的方法，这是一种用于目标检测的非参数方法。几年后，H.J.Seo致力于从不同方面提高回归核的鲁棒性。其中，在2011年，H.J.Seo和P.Milanfar采用时空自适应局部回归核(3DLARK,3D即时空)。3DLARK可以很好地捕捉视频的局部结构特征。然而，H.J.Seo在中提出的匹配算法(以下简称为““Seo算法”)并不适用于非紧凑的目标，如人的动作。采用带背景的完整模板和测试视频相匹配，这限制测试视频场景的选择。识别精度依赖于模板与测试视频的背景相似度。只有当测试视频的背景与模板非常相似时，结果才能是令人满意的。相反，当视角改变或场景复杂时，结果总是令人失望。2007年，Wang通过方法模板图像并将其分割成多个部分来检测人脸。当中，模板只包含人脸，这给了一些去除背景的灵感。采用无背景模板来缓解场景限制。此外，当动作部分被场景遮挡时，那么完整模板的匹配也不能识别到它。因此，需要...
基于时空多尺度统计匹配模型的动作检测方法

【技术保护点】
一种基于时空多尺度统计匹配模型的动作检测方法，其特征在于：包括以下步骤：1)、构建新的局部GLARK特征；

【技术特征摘要】
1.一种基于时空多尺度统计匹配模型的动作检测方法，其特征在于：包括以下步骤：1)、构建新的局部GLARK特征；式中，K(·,·)为局部自适应回归核核值，l∈[1,...,P2]，P2是以感兴趣像素为中心的局部窗口中像素的总数；ΔXl＝[dx,dy]T，dx和dy分别表示空间图像表面x轴微分和y轴微分；式中，Ωl代表时空分析窗口，m∈Ωl，Zx(m)和Zy(m)分别为空间图像表面m处x轴和y轴高斯差分梯度矩阵，ZT(m)为m处时间维上的梯度；2)、根据步骤1)得到的局部GLARK特征得到模板视频序列和测试视频序列的特征矩阵FQ和特征矩阵...

【专利技术属性】
技术研发人员：柏连发，朱均炜，韩静，张毅，
申请(专利权)人：南京理工大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人