一种基于光流和神经网络的视频内容检测方法技术

技术编号:18290536 阅读:20 留言:0更新日期:2018-06-24 05:41
本发明专利技术公开了一种基于光流和神经网络的视频内容检测方法:用户通过人机交互模块的输入设备输入检索信息,用户电脑获取该检索信息并处理成语义信息;用户电脑根据语义信息向后台服务器发送提取指令;后台服务器根据提取指令对视频采集模块和存储器的视频进行光流和神经网络的检测;将检索结果发送到人机交互模块的输出设备。通过对视频流进行光流和神经网络的检测改变了传统的视频检测以及检索方式,将检索信息处理成为语义信息,根据语义信息生成检索指令,这样在检索的过程中就不会产生分歧,检索结果更准确,解决了计算机理解和用户理解之间的鸿沟的问题。

【技术实现步骤摘要】
一种基于光流和神经网络的视频内容检测方法
本专利技术属于图像处理技术、视频分类技术与人工智能
,具体涉及一种基于光流和神经网络的视频内容检测方法。
技术介绍
近年,随着互联网技术的发展,视频采集设备的轻便化,视频传输的快捷,造成了网络上视频内容爆炸式增长。对于当前的直播平台、视频服务网站,或者是安防监控系统,要在海量的视频数据中检索、抽取或者监控有用的视频内容,成为各部门研究的热点。以美国短视频服务为例,当前instagram的活跃用户为5亿,snapchat活跃用户为1.5亿,两者的短视频流量在近年同时暴增:2015年10月-2016年3月,Instagram短视频流量增长40%,而Snapchat2015年的视频流量比前一年增长4倍以上,每天超过60亿次播放量。而在国内,随着4G牌照的发放,也扫清了视频爆发的一个路障。过去一年内短视频平台人均单日启动次数上涨67%,短视频平台人均单日使用时长上涨45%。而另一项研究也显示,移动短视频用户规模不断扩大,预计今年底将达到2.42亿人,增长率为58.2%。而在监控领域,IDC研究表明,2012年的数据存储总量约为2.8ZB,2020年数据存储量约为40ZB(1ZB=1亿TB)。数据量正在以55%的速度逐年增长,全世界粗略估计有至少有2亿个监控摄像头。目前随着视频检索技术的发展,常用的建立内容索引的方式大致分为:视频镜头分割技术、关键帧提取和结构分析、关键帧特征提取和描述和对镜头进行分类和场景提取,这样的视频检索方法存在这样一个缺点:在特征提取中只考虑了低级图像特征而没有提取具有真正描述性的图像高级特征,这样实际上会造成获取的分类与用户实际理解的分类不一致的状况。
技术实现思路
本专利技术的目的在于:提供一种基于光流和神经网络的视频内容检测方法,以解决上述的提取中只考虑了低级图像特征而没有提取具有真正描述性的图像高级特征,这样实际上会造成获取的分类与用户实际理解的分类不一致的问题。本专利技术采用的技术方案如下:一种基于光流和神经网络的视频内容检测方法,所述方法包括以下步骤:步骤1:将输入的检索信息处理成语义信息;步骤2:根据步骤1所得的语义信息发送提取指令;步骤3:根据步骤2所得的提取指令对视频进行光流和神经网络的检测;步骤4:输出检索结果。通过对视频流进行光流和神经网络的检测改变了传统的视频检测以及检索方式,将检索信息处理成为语义信息,根据语义信息生成检索指令,这样在检索的过程中就不会产生分歧,检索结果更准确,解决了现有技术中提取中只考虑了低级图像特征而没有提取具有真正描述性的图像高级特征,实际上造成获取的分类与用户实际理解的分类不一致的问题。优选地,所述光流和神经网络的检测是先对视频流进行关键帧判断,若不是关键帧则进行光流估计将特征进行叠加再到物体识别网络进行识别输出结果;若是关键帧则经特征提取网络进行特征提取,再到物体识别网络进行识别,输出结果。本专利技术的关键帧的提取与传统的关键帧处理技术不一样,传统的关键帧选择也分为:特定帧法、帧平均法和直方图平均法、基于光流的运动分析法,过程较为复杂。而本专利技术的基于光流的运动分析则是对一个镜头的所有帧进行光流法的运动分析,选择运动量局部极小的帧,作为关键帧。优选地,所述关键帧的判断方法包括以下步骤:步骤3.1:将视频流的第一帧作为初始关键帧,后续以0-9帧的随机间隔选取帧;步骤3.2:检测步骤3.1所选取的帧的图像是否存在严重模糊,若存在则舍弃重选其相邻帧进行检测;步骤3.3:检测步骤3.2所得的选取帧是否存在光照不足,若存在则舍弃再选择舍弃帧的相邻帧进行检测;本专利技术的关键帧判断更为科学,所选取的关键帧均经过光照判断和图像模糊判断,筛选出的都是图像清晰光照足够的帧,有助于后续特征提取步骤提取到更准确的图像特征,提高检索结果的准确性。优选地,所述神经网络包括光流估计网络和识别网络,所述光流估计网络采用的是基于CNN的FlowNet网络;所述识别网络是在ImageNet1K数据集上预训练的ResNet网络,用以提取关键帧的卷积特征,通过神经网络处理出来的关键帧内容描述具有多维性,用户可以通过多种描述词获取视频的索引,从而不会因为用户单一的描述词而忽略掉相关的索引视频。优选地,所述检测选取帧严重模糊的方法包括以下步骤:步骤5.1:用sobel算子进行边缘检测,得到图像的边缘像素数量;步骤5.2:将图像进行灰度和二值化处理;步骤5.3:根据最高值数量/最低值数量来判断图像是否严重模糊。对关键帧的判断有统一标准,同时对于提取特征而言大大地降低了每个关键帧处理的时间,使得视频能够快速得到处理结果并且处理质量更高。综上所述,由于采用了上述技术方案,本专利技术的有益效果是:1、本专利技术中,提供了一种基于神经网络的视频内容分析方法,目前的根据视频内容的检索系统都是根据镜头的切换,以及计算低级图像特征后选取的关键帧,选择的特征也是在同一个镜头下分析的颜色、纹理、运动等特征,而这些特征描述相对于人对视频内容的理解而言都是难以理解的特征。因此在检索时必然会发生分歧,导致检索结果的不准确。基于神经网络的视频内容分析方法将多维特征进行了融合解决了上述计算机理解和用户理解的鸿沟的问题。2、本专利技术中,传统的视频内容检索方法大多是要根据低级特征检测镜头,将镜头进行特征检测以后进行聚类,而本专利技术在关键帧选择时仅根据非模糊,光照条件较好等条件进行挑选,从而处理出整个视频的描述内容,生成的视频内容描述更加完整,也更加多样化。3、本专利技术中,通过神经网络处理出来的关键帧内容描述具有多维性,用户可以通过多种描述词获取视频的索引,从而不会因为用户单一的描述词而忽略掉相关的索引视频。4、本专利技术中,计算光流仅仅只需要计算像素值的相对运行,这对于提取特征而言大大地降低了每个关键帧处理的时间,使得视频能够快速得到处理结果。附图说明图1为本专利技术中实施例4中的FlowNet结构图;图2为本专利技术中实施例4中的ResNet结构图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。实施例1一种基于光流和神经网络的视频内容检测方法,所述方法包括以下步骤:步骤1:将输入的检索信息处理成语义信息;步骤2:根据步骤1所得的语义信息发送提取指令;步骤3:根据步骤2所得的提取指令对视频进行光流和神经网络的检测;步骤4:输出检索结果。通过对视频流进行光流和神经网络的检测改变了传统的视频检测以及检索方式,将检索信息处理成为语义信息,根据语义信息生成检索指令,这样在检索的过程中就不会产生分歧,检索结果更准确,解决了现有技术中提取中只考虑了低级图像特征而没有提取具有真正描述性的图像高级特征,实际上造成获取的分类与用户实际理解的分类不一致的问题。实施例2在实施例1的基础上,所述光流和神经网络的检测是先对视频流进行关键帧判断,若不是关键帧则进行光流估计将特征进行叠加再到物体识别网络进行识别输出结果;若是关键帧则经特征提取网络进行特征提取,再到物体识别网络进行识别,输出结果。本专利技术的关键帧的提取与传统的关键帧处理技术不一样,传统的关键帧选择也分为:特定帧法、帧平均法和直方图平均法本文档来自技高网
...
一种基于光流和神经网络的视频内容检测方法

【技术保护点】
1.一种基于光流和神经网络的视频内容检测方法,其特征在于,所述方法包括以下步骤:步骤1:将输入的检索信息处理成语义信息;步骤2:根据步骤1所得的语义信息发送提取指令;步骤3:根据步骤2所得的提取指令对视频进行光流和神经网络的检测;步骤4:输出检索结果。

【技术特征摘要】
1.一种基于光流和神经网络的视频内容检测方法,其特征在于,所述方法包括以下步骤:步骤1:将输入的检索信息处理成语义信息;步骤2:根据步骤1所得的语义信息发送提取指令;步骤3:根据步骤2所得的提取指令对视频进行光流和神经网络的检测;步骤4:输出检索结果。2.根据权利要求1所述的基于光流和神经网络的视频内容检测方法,其特征在于:所述光流和神经网络的检测是先对视频流进行关键帧判断,若不是关键帧则进行光流估计将特征进行叠加再到物体识别网络进行识别输出结果;若是关键帧则经特征提取网络进行特征提取,再到物体识别网络进行识别,输出结果。3.根据权利要求2所述的基于光流和神经网络的视频内容检测方法,其特征在于,所述关键帧的判断方法包括以下步骤:步骤3.1:将视频流的第一帧作为初始关键帧,后续以0-9帧的随机间隔选取帧;步骤3.2:检测步骤3.1所选取...

【专利技术属性】
技术研发人员:徐枫陈建武肖谋
申请(专利权)人:北京易智能科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1