一种高效运动互补神经网络系统技术方案

技术编号：24035859 阅读：40 留言：0更新日期：2020-05-07 01:53

本发明专利技术公开了一种高效运动互补神经网络系统，包括视频读取单元、视频类别单元和神经网络补充单元；所述视频读取单元对输入的视频进行读取，同时对视频的描述信息等文字辅助信息进行提取；所述视频类别单元根据网络等视频提取源对视频的描述信息对视频的类别进行初步判定，并将视频划分到神经网络中已有的类别分区中；所述神经网络补充单元分成两个模块，对视频分类的方法进行优化，缩短视频分类的时间。本发明专利技术针对双流法和3D卷积法分别做出提高计算光流效率和缩小网络计算量的优化方法，提升了视频提取和分类的速度。

An efficient motor complementary neural network system

全部详细技术资料下载

【技术实现步骤摘要】
一种高效运动互补神经网络系统
本专利技术涉及一种深度学习技术，尤其是一种高效运动互补神经网络系统。
技术介绍
如今网络上存在大规模的视频数据，占到了整个互联网信息的70%，而对这些数据进行自动分类有很大的意义。视频分类任务不仅需要高的精度，还需要尽可能快的速度，以应对海量的数据。近年来，随着深度学习在图像分类任务上大获成功，有很多研究者将深度学习引入视频分类任务中。视频分类的深度学习模型和图像分类的最大区别在于运动信息的捕捉，也就是帧间的运动信息的建模。目前常用的运动信息建模方法有两种：双流卷积网络和3D卷积网络。双流卷积网络利用光流来获取运动信息，光流是空间运动物体在观察成像平面上的像素运动的瞬时速度所构成的图像。双流法提取视频的光流模态，与RGB模态构成两路输入，然后将RGB流和光流两路的结果进行融合得到最终结果。3D卷积神经网络将2D的卷积拓展到3D，也就是将空间卷积拓展到时空。卷积核的大小也从二维变为三维。上述两种建模时序运动信息的方法虽然能取得比较高的精度，但是其速度很慢，难以进行高效的部署。双流法的时间主要消耗在提取光流，例如用CPU提取光流每帧需要360ms，即使用K80GPU每帧也需要60ms。3D卷积的时间主要消耗在卷积的过程，这是由于3D卷积的网络计算量远远大于2D卷积。
技术实现思路
专利技术目的：提供一种高效运动互补神经网络系统，以解决上述问题。技术方案：一种高效运动互补神经网络系统，定长累计运动矢量模块，用于将运动矢量的累计到它所对...

【技术保护点】
1.一种高效运动互补神经网络系统，其特征在于，包括：/n定长累计运动矢量模块，用于将运动矢量的累计到它所对应的原始帧，而累计的帧数固定长度，以提高运动矢量的清晰度和表达能力；/n均衡运动策略模块，用于将视频分成原始帧和运动矢量两部分，所述原始帧存储少量图像，所述运动矢量存储帧间运动信息，根据用户对视频提取的精度要求确定运动矢量的提取长度，对视频进行分段，提取长度越短视频处理的精度越高，将运动矢量累计到视频对应的原始帧的位置上，同时对累计的帧数进行长度固定，在视频编码格式中自动保存运动矢量信息；在原始帧流上采用较大的分辨率，在运动矢量流上采用较小的分辨率。/n

【技术特征摘要】
1.一种高效运动互补神经网络系统，其特征在于，包括：
定长累计运动矢量模块，用于将运动矢量的累计到它所对应的原始帧，而累计的帧数固定长度，以提高运动矢量的清晰度和表达能力；
均衡运动策略模块，用于将视频分成原始帧和运动矢量两部分，所述原始帧存储少量图像，所述运动矢量存储帧间运动信息，根据用户对视频提取的精度要求确定运动矢量的提取长度，对视频进行分段，提取长度越短视频处理的精度越高，将运动矢量累计到视频对应的原始帧的位置上，同时对累计的帧数进行长度固定，在视频编码格式中自动保存运动矢量信息；在原始帧流上采用较大的分辨率，在运动矢量流上采用较小的分辨率。

2.一种高效运动互补神经网络系统，其特征在于，包括视频读取单元、视频类别单元和神经网络补充单元，针对双流法和3D卷积法两种视频提取的方法进行了优化，可以做到提高计算光流的效率，缩小网络计算量，提升视频分类的效率；
视频读取单元，对输入的视频进行读取，进一步获取网络等输入源中对视频的文字描述信息，为视频的初步分类进行数据搜集；
视频类别单元，在视频提取源的描述信息下，对输入的视频的类别进行初步的判定，在扩充视频类别的数据库的同时，可以通过视频类别的最终判定，修正神经网络的判定结果，提高神经网络的学习能力；
神经网络补充单元，其内部的两个模块分别针对计算光流的效率和网络计算量进行优化，缩短视频分类的时间，具体步骤为：
步骤1、将视频转化成编码格式；
步骤2、使用定长累计运动矢量法加速光流计算；
步骤3、使用均衡运动法加速网络计算。

3.根据权利要求2所述的一种高效运动互补神经网络系统，其特征在于，所述神经网络补充单元通过定长累计运动矢量法来加速光流计算，通过均衡运动法来加速网络计算，这两种方法在使用小计算量的前提下，可以提取到具有很强表达能力和互补性的运动信息；将二者结合，可以实现运动信息的互补建模，缩短视频分类的计算时间，提高视频分类的计算精度。

4.根据权...

【专利技术属性】
技术研发人员：张一帆，程科，程健，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人