一种深度学习的暴力检测系统技术方案

技术编号:20026479 阅读:29 留言:0更新日期:2019-01-06 05:14
本发明专利技术提供了一种深度学习的暴力检测系统,包括图像输入模块、图像全局特性模块、深度网络模型模块、3D网络模型模块、D3D网络模型模块、图像输出模块,所述图像输入模块用于输入所检测的图像,所述图像全局特性模块用于提取出图像的全局特征,所述深度网络模型模块用于将所提取的图像全局特征融合在深度网络模型中,所述3D网络模型模块基于深度网络模型模块确定暴力检测结果,所述D3D网络模型模块用于优化3D网络模型模块暴力检测结果,所述图像输出模块用于输出优化的暴力检测结果。本发明专利技术的有益效果为:提供了一种深度学习的暴力检测系统,有效的提高了暴力检测的准确率。

【技术实现步骤摘要】
一种深度学习的暴力检测系统
本专利技术涉及暴力检测
,具体涉及一种深度学习的暴力检测系统。
技术介绍
随着平安城市建设的不断推进,视频监控系统大范围普及,利用智能视频分析技术实现对类似暴力行为进行检测及预警成为一种迫切需求。现有的暴力检测系统根据分析信号的差异,可细分为基于音频的方法、基于音视频的方法和基于视频的方法。在实际监控系统中,绝大多数的监控系统并没有安装音频采集设备,在这种情况下,基于音频的方法便无法奏效,而基于图像视频数据的暴力检测就变得更具研究价值。此外,爆炸、流血和汽车追逐等行为通常是检测电影片段中暴力场景的有效线索,但是在日常生活中,这类行为是十分稀少的。相反的,暴力打斗及群体斗殴行为在日常生活中出现最为频繁,造成的危害范围最广。
技术实现思路
针对上述问题,本专利技术提供一种深度学习的暴力检测系统。本专利技术的目的采用以下技术方案来实现:提供了一种深度学习的暴力检测系统,包括图像输入模块、图像全局特性模块、深度网络模型模块、3D网络模型模块、D3D网络模型模块、图像输出模块,所述图像输入模块用于输入所检测的图像,所述图像全局特性模块用于提取出图像的全局特征,所述深度网络模型模块用于将所提取的图像全局特征融合在深度网络模型中,所述3D网络模型模块基于深度网络模型模块确定暴力检测结果,所述D3D网络模型模块用于优化3D网络模型模块暴力检测结果,所述图像输出模块用于输出优化的暴力检测结果。本专利技术的有益效果为:提供了一种深度学习的暴力检测系统,有效的提高了暴力检测的准确率。附图说明利用附图对本专利技术作进一步说明,但附图中的实施例不构成对本专利技术的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。图1是本专利技术的结构示意图;附图标记:图像输入模块1、图像全局特性模块2、深度网络模型模块3、3D网络模型模块4、D3D网络模型模块5、图像输出模块6。具体实施方式结合以下实施例对本专利技术作进一步描述。参见图1,本实施例的一种深度学习的暴力检测系统,包括图像输入模块1、图像全局特性模块2、深度网络模型模块3、3D网络模型模块4、D3D网络模型模块5、图像输出模块6,所述图像输入模块1用于输入所检测的图像,所述图像全局特性模块2用于提取出图像的全局特征,所述深度网络模型模块3用于将所提取的图像全局特征融合在深度网络模型中,所述3D网络模型模块4基于深度网络模型模块3确定暴力检测结果,所述D3D网络模型模块5用于优化3D网络模型模块4暴力检测结果,所述图像输出模块6用于输出优化的暴力检测结果。本实施例提供了一种深度学习的暴力检测系统,有效的提高了暴力检测的准确率。优选的,所述图像全局特性模块2包括数据输入层、卷积计算层、激励层、池化层;所述数据输入层对输入的图像进行预处理;所述卷积计算层对图像进行滤波以及卷积操作;所述激励层把卷积计算层的输出结果做非线性映射;所述池化层用于压缩非线性映射后的图像;在卷积计算层中,通过卷积操作对预处理后的图像提取局部邻域特征,经过多层迭代,通过二维卷积提取出图像的全局特征:上式中,i表示图像当前所在的卷积层,j表示该层的特征映射数量,表示在第i层第j个特征映射上(x,y)位置处的激活值,此激活值就是图像的二维全局特征;f(·)表示激活函数,其中,H,W分别表示二维卷积核的高度、宽度的大小;表示卷积核的权重,表示第i-1层第d个特征映射在(x,y)处的激活值,bij表示偏置向量。本优选实施例通过二维卷积可以很容易地抽取图像的空间信息,简单方便,应用范围最广,但是仅利用这些表观特征并不足以对视频进行完整表达,会使视频有所缺失。优选的,所述深度网络模型模块3将图像全局特性模块2中的二维卷积核经过空间扩展生成三维卷积核,在像素点(x,y,z)处的三维卷积计算定义为:上式中,i表示图像当前所在的卷积层,j表示该层的特征映射数量,表示在第i层第j个特征映射上(x,y,z)位置处的激活值;此激活值就是图像的三维全局特征;f(·)表示激活函数,其中,H,W,T分别表示三维卷积核的高度、宽度和时间维度上的大小;表示卷积核的权重,表示第i-1层第d个特征映射在(x,y,z)处的激活值,bij表示偏置向量。本优选实施例与二维卷积公式相比,三维卷积在对卷积核和像素点的表示上都增加了时间维度。将卷积核扩展至三维空间后,在对图像序列进行卷积时,卷积操作就会在空域和时域同时进行,这样经过卷积和池化操作后,输出的特征图依旧是图像序列,可以很好的保留视频中的时空信息。经过多个三维卷积的特征提取,就可以提取出视频的全局时空特征。优选的,所述3D网络模型模块4基于深度网络模型模块3使用C1、C2、C3三个卷积计算层,C1、C2和C3使用的三维卷积核尺寸分别为7×7×5、5×5×5和3×3×3像素;3D网络模型模块4的输入为由40帧连续图像构成的图像片段X;图像帧在经过预处理后,归一化为60×90像素大小并转换为灰度图;输出标量Y标量,用来表示模型对图像输入的检测结果,对于训练好的模型,如果测试图像中包含暴力场景,那么输出Y为1,否则输出结果为0;所述3D网络模型模块4对前两个卷积计算层计算得到的特征图进行池化操作,池化通过下式计算:式中,δT为采样函数,其中,t为时间,T为采样周期,n∈[0,+∞]且n为正整数,表示x层第y个特征图,表示x-1层第y个特征图,θ和B分别为乘性偏置和加性偏置,表示x层第y个乘性偏置,表示x层第y个加性偏置;所述池化操作采用二维池化操作,即不在时间维度对输入特征图序列进行降采样操作,池化因子分别设为3×3和2×2像素;在模型训练过程中,3D网络模型模块4采用均方误差作为代价函数,其表达式如下:式中,H1(X,θ)表示3D网络模型代价函数,G为模型函数,θ为模型参数,X为训练样本,N为样本数量,而是样本实际标签,k∈[1,N],N∈[1,+∞];代价函数值越小表明模型与训练集拟合的越好;本优选实施例一方面可以进一步减少网络参数,另一方面也赋予了特征图平移不变和旋转不变等特性,使得学到的特征更加鲁棒。优选的,所述D3D网络模型模块5基于3D网络模型,其输入为128×128像素的40帧连续图像,连续图像为三通道彩色图像;将三维卷积核统一设为3×3×3像素,在卷积操作时,D3D网络模型模块5对特征图进行填充操作,使得卷积后得到的特征图与计算前保持一样的大小;在池化过程中也使用三维池化操作,即在时间维度对输入特征图序列进行降采样操作,池化因子设为2×2×2像素;所述D3D网络模型模块5在模型训练过程中的代价函数选取负对数似然函数,其表达式如下:式中,H2(X,θ)表示D3D网络模型代价函数,G为模型函数,θ为模型参数,Xk为第k个训练样本,m是类别数,N是每类样本数,是第k个数据实际标签;k∈[1,N],N∈[1,+∞],l∈[1,m],m∈[1,+∞]。本优选实施例采用了更加复杂的结构,因此处理的图像数据维度可以更高,这样可以加快图像时间信息的提取,去除其中的大量冗余。采用本专利技术深度学习的暴力检测系统进行暴力检测,选取5个检测场景进行实验,分别为检测场景1、检测场景2、检测场景3、检测场景4、检测场景5,对暴力检测准确率和暴力检测速度进行统计,本文档来自技高网...

【技术保护点】
1.一种深度学习的暴力检测系统,其特征在于,包括图像输入模块、图像全局特性模块、深度网络模型模块、3D网络模型模块、D3D网络模型模块、图像输出模块,所述图像输入模块用于输入所检测的图像,所述图像全局特性模块用于提取出图像的全局特征,所述深度网络模型模块用于将所提取的图像全局特征融合在深度网络模型中,所述3D网络模型模块基于深度网络模型模块确定暴力检测结果,所述D3D网络模型模块用于优化3D网络模型模块暴力检测结果,所述图像输出模块用于输出优化的暴力检测结果。

【技术特征摘要】
1.一种深度学习的暴力检测系统,其特征在于,包括图像输入模块、图像全局特性模块、深度网络模型模块、3D网络模型模块、D3D网络模型模块、图像输出模块,所述图像输入模块用于输入所检测的图像,所述图像全局特性模块用于提取出图像的全局特征,所述深度网络模型模块用于将所提取的图像全局特征融合在深度网络模型中,所述3D网络模型模块基于深度网络模型模块确定暴力检测结果,所述D3D网络模型模块用于优化3D网络模型模块暴力检测结果,所述图像输出模块用于输出优化的暴力检测结果。2.根据权利要求1所述的深度学习的暴力检测系统,其特征在于,所述图像全局特性模块包括数据输入层、卷积计算层、激励层、池化层;所述数据输入层对输入的图像进行预处理;所述卷积计算层对图像进行滤波以及卷积操作;所述激励层把卷积计算层的输出结果做非线性映射;所述池化层用于压缩非线性映射后的图像。3.根据权利要求2所述的深度学习的暴力检测系统,其特征在于,在卷积计算层中,通过卷积操作对预处理后的图像提取局部邻域特征,经过多层迭代,通过二维卷积提取出图像的全局特征:上式中,i表示图像当前所在的卷积层,j表示该层的特征映射数量,表示在第i层第j个特征映射上(x,y)位置处的激活值,此激活值就是图像的二维全局特征;f(·)表示激活函数,其中,H,W分别表示二维卷积核的高度、宽度的大小;表示卷积核的权重,表示第i-1层第d个特征映射在(x,y)处的激活值,bij表示偏置向量。4.根据权利要求3所述的深度学习的暴力检测系统,其特征在于,所述深度网络模型模块将图像全局特性模块中的二维卷积核经过空间扩展生成三维卷积核,在像素点(x,y,z)处的三维卷...

【专利技术属性】
技术研发人员:覃群英
申请(专利权)人:佛山铮荣科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1