视频分析方法及装置制造方法及图纸

技术编号：17780328 阅读：86 留言：0更新日期：2018-04-22 09:09

本公开涉及一种视频分析方法及装置，所述方法包括：将待识别视频输入单帧识别模型，得到所述待识别视频中单帧图像的单帧特征；根据帧长度、起始帧和识别步长，将所述待识别视频划分为各视频块；根据各视频块包括的单帧图像的单帧特征和帧长度，确定各视频块的特征流矩阵；将初始注意力矩阵和视频块的特征流矩阵，输入长短期记忆模型进行处理，得到视频块的注意力矩阵；根据视频块的注意力矩阵，确定所述待识别视频的注意力向量。本公开选择性地关注视频空间上比较重要的区域，以及时间上相对重要的帧，进而减少了不相关信息对视频分析结果的影响。

全部详细技术资料下载

【技术实现步骤摘要】
视频分析方法及装置
本公开涉及计算机视觉领域，尤其涉及一种视频分析方法及装置。
技术介绍
视频分析是计算机视觉领域的一个重要方向，近几年，神经网络在图像分析领域取得了重大突破，然而相对图像而言，视频增加了时间维度信息，因此让机器理解不同视频帧在时间维度上的联系变得尤为重要。在传统的方法中，通常利用光流等手工特征来描述视频的时间信息，往往只考虑不同的单帧图像的分析结果，无法准确区分视频中整体动作中的某部分关键动作，导致视频的识别结果不准确。
技术实现思路
有鉴于此，本公开提出了一种视频分析方法及装置，用以解决传统的视频分析方法中，不能准确区分视频中整体工作中的关键动作，导致视频的识别结果不准确的问题。根据本公开的一方面，提供了一种视频分析方法，所述方法包括：将待识别视频输入单帧识别模型，得到所述待识别视频中单帧图像的单帧特征；根据帧长度、起始帧和识别步长，将所述待识别视频划分为各视频块；根据各视频块包括的单帧图像的单帧特征和帧长度，确定各视频块的特征流矩阵；将初始注意力矩阵和视频块的特征流矩阵，输入长短期记忆模型进行处理，得到视频块的注意力矩阵；根据视频块的注意力矩阵，确定所述待识别视频的注意力向量。在一种可能的实现方式中，将初始注意力矩阵和视频块的特征流矩阵，输入长短期记忆模型进行处理，得到视频块的注意力矩阵，包括：根据单帧特征的特征宽、单帧特征的特征高以及所述帧长度，确定所述视频块的初始注意力矩阵；将所述初始注意力矩阵和第一个视频块的特征流矩阵，输入长短期记忆模型进行处理，得到第一个视频块的注意力矩阵；将第二个视频块及其后续的视频块作为当前视频块，依次将上一...
视频分析方法及装置

【技术保护点】
一种视频分析方法，其特征在于，所述方法包括：将待识别视频输入单帧识别模型，得到所述待识别视频中单帧图像的单帧特征；根据帧长度、起始帧和识别步长，将所述待识别视频划分为各视频块；根据各视频块包括的单帧图像的单帧特征和帧长度，确定各视频块的特征流矩阵；将初始注意力矩阵和视频块的特征流矩阵，输入长短期记忆模型进行处理，得到视频块的注意力矩阵；根据视频块的注意力矩阵，确定所述待识别视频的注意力向量。

【技术特征摘要】
1.一种视频分析方法，其特征在于，所述方法包括：将待识别视频输入单帧识别模型，得到所述待识别视频中单帧图像的单帧特征；根据帧长度、起始帧和识别步长，将所述待识别视频划分为各视频块；根据各视频块包括的单帧图像的单帧特征和帧长度，确定各视频块的特征流矩阵；将初始注意力矩阵和视频块的特征流矩阵，输入长短期记忆模型进行处理，得到视频块的注意力矩阵；根据视频块的注意力矩阵，确定所述待识别视频的注意力向量。2.根据权利要求1所述的方法，其特征在于，将初始注意力矩阵和视频块的特征流矩阵，输入长短期记忆模型进行处理，得到视频块的注意力矩阵，包括：根据单帧特征的特征宽、单帧特征的特征高以及所述帧长度，确定所述视频块的初始注意力矩阵；将所述初始注意力矩阵和第一个视频块的特征流矩阵，输入长短期记忆模型进行处理，得到第一个视频块的注意力矩阵；将第二个视频块及其后续的视频块作为当前视频块，依次将上一个视频块的注意力矩阵和当前视频块的特征流矩阵，输入长短期记忆模型进行处理，得到当前视频块的注意力矩阵。3.根据权利要求2所述的方法，其特征在于，将上一个视频块的注意力矩阵和当前视频块的特征流矩阵，输入长短期记忆模型进行处理，得到当前视频块的注意力矩阵，包括：将上一个视频块的注意力矩阵和当前视频块的特征流矩阵加权求和，得到整合特征矩阵；将所述整合特征矩阵输入长短期记忆模型进行处理，得到当前视频块的注意力矩阵。4.根据权利要求1所述的方法，其特征在于，根据视频块的注意力矩阵，确定所述待识别视频的注意力向量，包括：将单帧图像所在的视频块的注意力矩阵取平均值，得到单帧图像的单帧向量；根据所有单帧图像的单帧向量，得到所述待识别视频的注意力向量。5.根据权利要求1至4中任一项所述的方法，其特征在于，将初始注意力矩阵和视频块的特征流矩阵，输入长短期记忆模型进行处理，得到视频块的注意力矩阵，还包括：得到当前视频块的类别概率；将所述类别概率输入分类器进行处理，得到当前视频块的视频块类别；根据视频块的视频块类别，确定所述待识别视频的视频类别。6.一种视频分析装置，其特征在于，包括：单帧特征确定模块，用于将待识别视频输入单帧识别模型，得到所述待识别视频中单帧图像的单帧特征；视频块划分模块，用于根据帧长度、起始帧和识别步长，将所述待识别视频划分为各...

【专利技术属性】
技术研发人员：季向阳，杨武魁，陈孝罡，
申请(专利权)人：清华大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人