检测视频中的动作的方法、装置和系统制造方法及图纸

技术编号：18356493 阅读：30 留言：0更新日期：2018-07-02 10:25

本申请公开了检测视频中的动作的方法、装置和系统。检测视频中的动作的方法包括：获取视频中多个片段分别对应的动作度估值；根据所述多个片段分别对应的动作度估值，生成所述视频的时序动作度序列；以及基于所述时序动作度序列，聚合得到所述视频中的动作预测时域区间。

全部详细技术资料下载

【技术实现步骤摘要】
检测视频中的动作的方法、装置和系统
本申请涉及计算机视觉(CV)领域，具体涉及检测视频中的动作的方法、装置和系统。
技术介绍
理解人的行为和动作是计算机视觉系统的一项重要任务。目前，利用计算机视觉系统的动作识别技术以视频作为输入数据，但仅能处理经过剪辑后只包含与动作相关的内容的视频片段。在动作识别的过程中，动作识别系统主要使用深度学习的方法来分析动态变化的视频内容，并克服距离、视角变化、相机移动以及场景变化等因素造成的影响。动作识别技术通过用深度学习的方法来融合形状信息、运动特征以及长程时序关系等视频内容，能够识别经过剪辑的视频中的动作类别。但是将动作识别技术运用到实际中时，系统需要处理的视频往往是未经过剪辑的原始视频。这就要求动作识别系统不再局限于仅能够识别动作的类别，而还需要能够在未经剪辑的原始视频中检测到每个动作实例的开始和结束时间。这个任务可称为时域动作检测，即在视频中检测出所有动作实例的开始、结束时间以及它们所属的动作类别。时域动作检测技术在安全监控、网络视频分析、视频直播分析乃至无人驾驶等领域都具有巨大的应用价值。当前，对于时域动作检测的研究并不充分，尤其是还缺少较理想的方法能够准确地检测出所有动作实例的开始时间和结束时间。
技术实现思路
本申请提供了检测视频中的动作的方法、装置和系统。根据本申请的一个方面，检测视频中的动作的方法包括：获取视频中多个片段分别对应的动作度估值；根据所述多个片段分别对应的动作度估值，生成所述视频的时序动作度序列；以及基于所述时序动作度序列，聚合得到所述视频中的动作预测时域区间。根据一个实施方式，所述获取视频中多个片段分...
检测视频中的动作的方法、装置和系统

【技术保护点】
1.一种检测视频中的动作的方法，包括：获取视频中多个片段分别对应的动作度估值；根据所述多个片段分别对应的动作度估值，生成所述视频的时序动作度序列；以及基于所述时序动作度序列，聚合得到所述视频中的动作预测时域区间。

【技术特征摘要】
1.一种检测视频中的动作的方法，包括：获取视频中多个片段分别对应的动作度估值；根据所述多个片段分别对应的动作度估值，生成所述视频的时序动作度序列；以及基于所述时序动作度序列，聚合得到所述视频中的动作预测时域区间。2.如权利要求1所述的方法，其中，所述获取视频中多个片段分别对应的动作度估值包括：利用第一卷积神经网络计算所述视频中多个片段中的每个片段分别对应的第一动作度估值，所述第一动作度估值由所述片段中任意一帧图像得到；利用第二卷积神经网络计算所述每个片段分别对应的第二动作度估值，所述第二动作度估值由所述片段的光流场图像得到，所述光流场图像由所述片段中任意多帧图像提取的光流场合并形成；以及根据所述每个片段分别对应的第一动作度估值及第二动作度估值，得到所述每个片段分别对应的动作度估值。3.如权利要求2所述的方法，其中，所述根据所述每个片段分别对应的第一动作度估值及第二动作度估值，得到所述每个片段分别对应的动作度估值包括：将所述每个片段分别对应的第一动作度估值及第二动作度估值相加，得到所述每个片段分别对应的动作度估值。4.如权利要求1所述的方法，其中，所述根据所述多个片段分别对应的动作度估值，生成所述视频的时序动作度序列包括：对所述多个片段分别对应的动作度估值进行归一化处理，并根据归一化处理后的各动作度估值，生成所述视频的时序动作度序列。5.如权利要求1所述的方法，其中，所述基于所述时序动作度序列，聚合得到所述视频中的动作预测时域区间包括...

【专利技术属性】
技术研发人员：熊元骏，赵岳，王利民，林达华，汤晓鸥，
申请(专利权)人：北京市商汤科技开发有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人