一种基于时空上下文分析的在线视频行为检测系统及其方法技术方案

技术编号：20486309 阅读：37 留言：0更新日期：2019-03-02 19:33

一种基于时空上下文分析的在线视频行为检测方法，该方法采用深度学习框架并结合时空上下文分析技术实现了输入视频中发生行为的在线检测，且该检测是在时间域和空间域联合进行的。本发明专利技术包括两个部分：视频片段内的行为检测和视频片段间的链接。在视频片段内算法利用编码‑解码模型，结合当前帧和时空动态信息，产生候选动作区域；视频片段间链接把候选动作区域链接成行为链，该链持续关注指定的动作对象，从它出现直到结束，同时以在线的方式预测出行为的类别。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于时空上下文分析的在线视频行为检测系统及其方法
本专利技术涉及视频行为分析
，具体涉及到一种基于时空上下文分析的在线视频行为检测系统及其方法，该方法采用深度学习框架并结合时空上下文分析技术实现了输入视频中发生行为的在线检测，且该检测是在时间域和空间域联合进行的。
技术介绍
视频行为检测不仅要对给定视频中出现的行为进行正确地分类，还要对行为进行时间域和空间域上的定位，是视频人类行为理解研究中的关键一步。简单地说，目前存在的方法通常采用一个二步处理的程序来解决这个问题：用经过重新训练的动作检测器产生单帧的动作检测结果，包括经过回归的物体框和相应的动作分类得分；通过在整个视频持续时间内连接或者追踪单帧的动作检测结果形成最终的时空动作链，通常这些连接或者追踪是在一些约束条件下进行的，比如：要求相邻帧的动作检测框重叠区域要尽可能的大。这种处理的局限性主要体现在两个方面：1)它仅仅利用当前的图像或者运动信息进行单帧的行为检测，而忽略了动作行为在时间上的连续性；2)连接算法通常用一种离线和批处理的方式进行，也即：动作链从视频的开始一直被延续到视频结尾，再用另外的时间域剪枝算法来消除虚假的检测结果。在本专利技术中，通过以下途径解决上述两个问题：1)联合当前帧和时空下上文信息进行动作检测；2)采用在线检测的方式，在一次处理中完成行为链生成和行为分类预测。2017年，Zhu等人(ZhuH.,VialR.,andLuS.2017.“ASpatio-temporalConvolutionalRegressionNetworkforVideoActionProposal...

【技术保护点】
1.一种基于时空上下文分析的在线视频行为检测系统，其特征在于，包括视频行为时空上下文信息融合网络和运动框在线链接和分类算法；其中：所述视频行为时空上下文信息融合网络，用于将当前帧信息和一个视频片段内行为时空上下文信息进行融合；所述运动框在线链接和分类算法，用于以在线的方式把对应于同一运动目标的运动框链接起来，形成一条完整的行为链，并对其行为类别进行分类。

【技术特征摘要】
1.一种基于时空上下文分析的在线视频行为检测系统，其特征在于，包括视频行为时空上下文信息融合网络和运动框在线链接和分类算法；其中：所述视频行为时空上下文信息融合网络，用于将当前帧信息和一个视频片段内行为时空上下文信息进行融合；所述运动框在线链接和分类算法，用于以在线的方式把对应于同一运动目标的运动框链接起来，形成一条完整的行为链，并对其行为类别进行分类。2.根据权利要求1所述的基于时空上下文分析的在线视频行为检测系统，其特征是，所述视频行为时空上下文信息融合网络具体包括：单帧特征提取网络，用于提取视频片段内当前帧RGB图像和光流图像深度表述特征；视频片段时空上下文信息融合网络，构建基于ConvGRU模型的编码-解码模块用于提取视频片段时空上下文表述特征，并使之与视频当前帧特征进行融合，得到融合特征。具体即为：ConvGRU模型接收单帧图像表述特征，通过前向传播过程得到视频片段内运动序列表征；再通过后向传播过程得到时空上下文信息和当前帧信息的融合特征；行为检测网络，用于在融合特征上进行单帧行为检测，得到行为分类得分和对行为发生的位置进行定位，产生运动框。3.根据权利要求1所述的基于时空上下文分析的在线视频行为检测系统，其特征是，所述运动框在线链接和分类算法具体包括：构建行为类别侯选池，用于维持对于给定视频当前最有可能出现的指定数目的行为类别；行为类别候选池更新算法，用于对行为类别进行打分，逐渐缩小当前视频可能所属的行为类别范围，实现行为链在线快速分类；行为链在线增长算法，用于将视频片段对应的行为候选区域链接于已存在的行为链，实现行为链在线增长；或者将行为候选区域确定为新的行为链。4.一种基于时空上下文分析的在线视频行为检测方法，是基于权利要求1-3任意一项检测系统，对在线视频行为检测，其特征在于，包括以下步骤：步骤1：对当前帧计算光流图像，提取RGB图像和光流图像的深度表述特征，具体即为在VGG16网络结构conv5层上构建另外的卷积网...

【专利技术属性】
技术研发人员：李楠楠，张世雄，张子尧，李革，安欣赏，张伟民，
申请(专利权)人：深圳龙岗智能视听研究院，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人