一种视频行为时间轴检测方法技术

技术编号：19480986 阅读：20 留言：0更新日期：2018-11-17 10:38

本发明专利技术公布了一种视频行为时间轴检测方法，基于深度学习和时间结构建模，并结合粗粒度检测与细粒度检测做视频行为时间轴检测，在已有模型SSN的基础上，使用双流模型来提取视频的时空特征；对行为的时间结构进行建模，将单个行为分为三个阶段；接着提出一种新的能够有效提取视频行为的时间边界信息的特征金字塔；最后结合粗粒度检测与细粒度检测，使得检测结果更加精确；本发明专利技术的检测精度高，超过了当前已有的所有公开方法，具有广泛的适用性，可适用于智能监控系统或者人机监护系统中对人类感兴趣视频片段的检测，便于后续的分析与处理，具有重要的应用价值。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频行为时间轴检测方法
本专利技术涉及视频分析
，尤其涉及一种视频行为时间轴检测方法，该方法基于深度学习并结合视频上下文信息进行视频内人类行为的时间轴检测。
技术介绍
包含人类行为的视频可以分为两类：一类是经过人工裁剪的、仅包含人类行为而不包含任何无关背景视频的视频；一类是拍摄后未经裁剪的视频，该类视频中不仅仅包括人类行为而且包含无关的背景片段，比如片头，观众等。视频行为时间轴检测指在一段未经过人工裁剪的视频中，定位出人类行为发生的起始时间与结束时间，并识别人类行为的类别。目前已有的视频行为时间轴检测方法主要遵循两步策略：首先，提取大量的很可能包含人类动作视频片段的视频行为时间轴候选框，然后对所提取的候选框进行位置和长度上的细微调整，并对定位到的行为进行分类。一般地，视频行为时间轴候选框提取虽然能大致定位到视频内的人类行为，但定位精度较低，与动作片段的重叠率较低，因此对视频行为时间轴候选框的调优和精确分类非常重要。在实际的应用场景中，精确地定位到人类行为发生的起始时间和结束时间非常重要，。本专利技术在已有视频行为时间轴候选框提取方法的基础上，主要针对视频行为时间轴检测这一任务，基于深度学习，进行精确的视频行为时间轴定位。目前根据视频行为时间轴检测方式的不同，可以将现有的视频行为时间轴检测模型分为两类：第一类是一阶段方法。所谓的一阶段方法，是指直接从未裁剪视频中寻找和定位人类行为的方法。这一类方法的效率相对较高。但是由于视频内包含的信息量巨大，这种直接一步到位的定位方法很难取得较好的定位结果。第二类方法是两阶段方法，即先提取视频行为时间轴候选框，然...

【技术保护点】
1.一种视频行为时间轴检测方法，该方法包括如下步骤：1)对待检测视频，使用TAG提取视频行为时间轴候选框；2)对每一个视频行为时间轴候选框进行时间结构建模，将单个候选框分为三个阶段；3)使用视频分类深度模型提取视频的时空特征，将特征保存在内存中；4)在每一个阶段上，建立多层特征金字塔以有效提取视频行为的时间边界信息；5)在金字塔特征上，构建三个分类器A、B、C和一个回归器R，三个分类器分别进行行为分类、候选框内行为完整性评估、候选框内行为分阶段完整性评估；6)利用分类器C的候选框分阶段完整性评估结果，使用TAG中提出的组合方法，从不完整行为片段中组合出完整的行为片段。7)进行两种不同粒度的行为时间轴检测；融合两种粒度的检测结果，由此达到精确的视频行为时间轴定位的目的。

【技术特征摘要】
1.一种视频行为时间轴检测方法，该方法包括如下步骤：1)对待检测视频，使用TAG提取视频行为时间轴候选框；2)对每一个视频行为时间轴候选框进行时间结构建模，将单个候选框分为三个阶段；3)使用视频分类深度模型提取视频的时空特征，将特征保存在内存中；4)在每一个阶段上，建立多层特征金字塔以有效提取视频行为的时间边界信息；5)在金字塔特征上，构建三个分类器A、B、C和一个回归器R，三个分类器分别进行行为分类、候选框内行为完整性评估、候选框内行为分阶段完整性评估；6)利用分类器C的候选框分阶段完整性评估结果，使用TAG中提出的组合方法，从不完整行为片段中组合出完整的行为片段。7)进行两种不同粒度的行为时间轴检测；融合两种粒度的检测结果，由此达到精确的视频行为时间轴定位的目的。2.如权利要求1所述视频行为时间轴检测方法，其特征是，步骤3)所述的视频分类深度模型为基于BNInception网络的双流模型；该模型将视频的RGB图片和光流特征分别输入两个相同结构的BNInception网络，训练其学习视频的颜色特征与运动特征；其提取的特征向量的长度为1024。3.如权利要求2所述的视频行为时间轴检测方法，其特征是，对每个时间轴候选框，将其两端各延长候选框长度的1/2，以包含行为的上下文语义信息。针对每个延长后的视频行为时间轴候选框，将其分为三个阶段，分别为“起始阶段”，“中间阶段”和“结束阶段”，对应一个行为的“起始”，“进行”和“结束”。4.如权利要求3所述的视频行为时间轴检测方法，其特征是，对于每个视频行为时间轴候选框的“起始阶段”，“中间阶段”和“结束阶段”...

【专利技术属性】
技术研发人员：李革，张涛，李楠楠，林凯，孔伟杰，李宏，
申请(专利权)人：北京大学深圳研究生院，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人