一种基于弱监督学习的视频时序动作检测方法技术

技术编号：20486211 阅读：27 留言：0更新日期：2019-03-02 19:30

本发明专利技术涉及数字图像处理技术领域，具体为一种基于弱监督学习的视频时序动作检测方法。该方法具体步骤是，步骤1：把视频输入分类器，分别得到不同的检测置信度；步骤2：融合视频在不同分类器的得分；步骤3：条件随机场精调结果；检测阶段的步骤是，步骤4：把待检测视频输入训练出的分类器，得到不同的检测置信度；步骤5：通过FC‑CRF优化融合不同的检测置信度。本方法可将人类的先验知识和神经网络的输出结合起来，实验结果表明FC‑CRF在ActivityNet上提高了20.8％mAP@0.5的检测性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于弱监督学习的视频时序动作检测方法
本专利技术涉及数字图像处理
，具体为一种基于弱监学习的视频时序动作检测方法。
技术介绍
在过去的几年里，受深度学习在基于图像的分析任务方面的巨大成功的启发，许多模型具有深度学习架构，特别是卷积神经网络(CNN)或递归神经网络(RNN)已被引入到基于视频的动作分析中。Karpathy等人首先在视频中采用深度学习进行动作识别，并设计处理单帧或一系列帧的各种深度学习模型。Tran等人构建一个C3D模型，该模型在空间-时间视频体中执行3D卷积并整合外观和运动提示以便更好地表示。Wang等人提出时间分段网络(TSN)，它继承了双流特征提取结构的优点，并利用稀疏采样方案来应对更长的视频剪辑。Qiu等人提出伪3D(P3D)残余网络以循环利用3DCNN的现成2D网络。除了处理动作识别之外，还有其他一些工作可以解决行动检测或候选区域生成问题。Shou等人利用多级CNN检测网络进行时间动作定位。Escorcia等人提出了DAPs模型，该模型使用RNN编码视频序列，并在单个过程中检索行动建议。Lin等人跳过使用单步动作检测器(SSAD)的候选区域生成步骤。Shou等人设计卷积-解卷积(CDC)网络来确定精确的时序界限。在过去的几年中，行为分析在视频理解领域引起了很多关注。根据手工特征表示或深度学习模型体系结构，对此问题进行了许多研究。大量现有工作以强监督的方式处理行动分析任务，其中无背景的行动实例的训练数据被手动注释或修剪掉。近年来，一些强监督方法取得了令人满意的结果。然而，如今在越来越大规模的视频数据集上，标注动作实例的精确时间...

【技术保护点】
1.一种基于弱监督学习的视频时序动作检测方法,其具体步骤如下：步骤1：把视频输入分类器，分别得到不同的检测置信度；步骤2：融合视频在不同分类器的得分；步骤3：条件随机场精调结果。

【技术特征摘要】
1.一种基于弱监督学习的视频时序动作检测方法,其具体步骤如下：步骤1：把视频输入分类器，分别得到不同的检测置信度；步骤2：融合视频在不同分类器的得分；步骤3：条件随机场精调结果。2.根据权利要求1所述的基于弱监督学习的视频时序动作检测方法，其特征在于：所述的步骤1按如下顺序进行：A)把视频划分为不重合的等长片段，以片段为单位抽取特征。B)分类器根据这些片段的特征，分别对不同的动作类别给出对应的检测置信度。3.根据权利要求1所述的基于弱监督学习的视频时序动作检测方法，其特征在于：所述的步骤2按如下顺序进行：C)给定视频片断，经过初始分类器，得到对应类别得分(详见步骤1)；D)根据得分，擦除视频片断部分内容，得到新视频片断。具体操作为：根据视频片断类别得分，算出其类别的分类概率，然后根据概率高低，随机把对应视频片段，移出训练集。E)把训练集的所有视频遍历一次，如上述移除部分视频片段，得到新的训练集。4.根据权利要求1所述的基于弱监督学习的视频时序动作检测方法，其特征在于：所述的步骤3按如下顺序进行：F)在新训练集的视频上训练分类器；G)训练收敛判断，判断为否时，重复步骤第二步和第三步，判断为是时，得到一系列训练好的分类器。5.根据权利要求1-4任意一项所述的基于弱监督学习的视频时序动作检测方法，在步骤3之后还包含有检测阶段,该检测阶段的具体步骤是：步骤4：把待检测视频输入训练出的分类器，得到不同的检测置信度；步骤5：通过FC-CRF优化融合不同的检测置信度。6.根据权利要求5所述的基于弱监督学习的视频时序动作检测方法，其特征在于：所述的步骤4按如下顺序进行：I)把待检测视频划分为不重合的等长片段，以片段为单位抽取特征。II)训练好的分类器根...

【专利技术属性】
技术研发人员：李革，钟家兴，李楠楠，孔伟杰，张涛，黄靖佳，
申请(专利权)人：北京大学深圳研究生院，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人