一种基于3DCNN的超市安防系统技术方案

技术编号:20727506 阅读:20 留言:0更新日期:2019-03-30 18:20
本发明专利技术公开了一种基于3DCNN的超市安防系统,提出的3DCNN网络训练模型的特征图像结合时间的信息,提高结果的准确性和速度。本发明专利技术采用的智能监控系统其特征包括影像信息采集模块、训练网络识别偷盗行为和预警模块。其具体流程如下:步骤1:采集超市内识别到人的影像信息,对影像进行归一化处理;步骤2:建立影像数据库;步骤3:构建3DCNN结构,训练深度学习网络;步骤4:选取16帧连续相连图像,尺寸大小为128x171进行随机抖动裁剪为112x112然后输入到已训练好的3DCNN模型中;步骤5:输出结果为非偷盗,则通过预警模块的第二微控单元与采集模块实时通讯,重新采集影像信息;步骤6:输出结果为偷盗则锁定人物信息,进行补光拍照数据存储,并通知管理人员。

【技术实现步骤摘要】
一种基于3DCNN的超市安防系统
本专利技术设计一种智能监控
,尤其涉及一种基于3DCNN模型的智能视频识别。
技术介绍
监控系统广泛应用于安防等领域,快速准确识别监控内容进行分类是一个重要的课题,卷积神经网络(CNN)是一种深度模型,可训练滤波器和局部邻域池操作交替应用于原始输入图像,从而产生越来越复杂的特征的层次结构。现有的安防系统通常构架的模型采用图像输入,这种方法视视频帧为静止图像并利用CNN来识别单个帧级别的动作,然而这些方法没有考虑多个连续帧中编码的运动信息。为了解决上述技术的问题,本专利技术基于3D卷积设计了一种超市安防系统,捕获沿空间和时间维度的特征,提高识别速度和准确度。
技术实现思路
本专利技术提出一种超市安防系统,构建3DCNN模型对视频样本进行识别,联系时间和空间维度的运动编码,提高了识别偷盗行为的准确度和速度。本专利技术解决其技术问题采用的方案是:该智能监控系统,其特征在于:包括影像信息采集模块、训练网络识别偷盗行为和预警模块。所述的影像信息采集系统包括视频采集、视频处理和第一微控单元。所述的网络训练识别模块包括影像数据集和3DCNN模型。所述的预警模块包括显示和第二微控单元。一种权利要求1所述的超市智能监控系统的监控方法,其特征在于:具体步骤为:步骤1:锁定区域范围内存在人的监控影像;步骤2:采集超市内的影像信息,对影像进行归一化处理;步骤3:建立影像数据库;步骤4:构建3DCNN结构,其设置为:8个卷积层,5个最大池化层,2个完全连接层和1个softmax丢失层来预测动作标签。所有的3D卷积滤波器均采用3x3x3,步幅为1x1x1,其5个卷积层滤波器数量依次为64、128、128、256、256,5个池化层依次跟在卷积层后面,除了第一个池化层内核大小是1x2x2,步幅为1x2x2,其余池化层为2x2x2,步幅为2x2x2,每个完全连接层有4096个输出单元,最后接一个softmax丢失层来预测动作标签;步骤5:训练深度学习网络,利用SGD优化器对视频进行训练,输出每个视频块中的预测结果;步骤6:选取16帧连续相连图像,尺寸大小为128x171进行随机抖动裁剪为112x112然后输入到已训练好的3DCNN模型中,经过训练分类输出结果;步骤7:输出结果为非偷盗,则通过预警模块的第二微控单元与采集模块实时通讯,重新采集影像信息;步骤8:输出结果为偷盗则通过第二微控单元与影像采集模块进行实时通讯锁定人物信息,进行补光拍照数据存储,并通知管理人员。一种基于权利要求1所述的超市智能监控所采用的3DCNN模型,其特征在于:包括以下内容:(1)视频预处理将带有人的图像的前后帧从视频样本库里截取出来,引用大小为cxlxhxw的视频剪辑,其中c是通道数,l是帧的长度,h和w分别为是视频的高度和宽度,将视频所有帧输入尺寸设置为3x16x128x171,视频被分为非重叠的16帧。进行随机裁剪我3x16x112x112。(2)3DCNN架构设置3D卷积和池内核大小为dxkxk,其中d为内核时间深度,k为内核空间大小。使用8个卷积层,5个最大池化层,2个完全连接层和1个softmax丢失层来预测动作标签。所有的3D卷积滤波器均采用3x3x3,步幅为1x1x1,其5个卷积层滤波器数量依次为64、128、128、256、256,5个池化层依次跟在卷积层后面,除了第一个池化层内核大小是1x2x2,步幅为1x2x2,其余池化层为2x2x2,步幅为2x2x2,每个完全连接层有4096个输出单元,最后接一个softmax丢失层来预测动作标签。利用SGD优化器对视频进行训练,输出每个视频块中的预测结果。(3)3DCNN训练过程(3.1)卷积层将输入数据输入到卷积层,卷积内核深度全部设置为3x3x3,卷积层中每个特征层都会与上一层中多个连续层相连,因此保留了运动的信息。在卷积结束以后执行加偏差项和激励函数tanh以获得特征图,形式上,在第i层的第j个特征图上的位置(x,y,z)的值由其中,Ri是沿着时间维度的3D内核的大小,是(p,q,r)连接到前一层中第m个要素图的内核值。(3.2)池化层本专利技术池化层使用maxpooling,S1设置为1x2x2,为了不过早的合并信息并且满足16帧的剪辑长度,剩下的4个池化层采用2x2x2的内核深度,步幅为1。(3.3)3DCNN训练过程将视频样本进行随机裁剪为3x16x112x112,通过堆叠多个连续帧组成一个立方体,然后在立方体中运用3D卷积核,卷积层中每个特征层都会与上一层中多个连续层相连,因此保留了运动的信息。在卷积结束以后执行加偏差项bij和激励函数tanh以获得特征图每个卷积层一次采用64、128、256、256、256个滤波器,将输出送入池化层进行采样,减少内存使用和计算负荷,通过卷积和池化以后输入到完全连接层,得到4096个特征图,每一次训练结束之后,得出偏差项和权值,反向传播以后更新权值和偏差,训练结束后将视频描述符通过LRN进行归一化处理将完全连接层的输出ai加上一个softmax函数进行分类在神经网络反向传播中,对网络中的权重进行修改,需要损失函数c=-∑yilnai(5)利用SGD进行训练,SGD即每一次迭代计算mini-batch的梯度,然后对参数进行更新,即:Δθt=-η*gt(7)其中η是学习率,gt是梯度SGD完全依赖于当前batch的梯度。采用30个小样本,初始学习率为0.003,从头开始训练网络,每150K次迭代除以2。优化在1.9M迭代(大约13个时期)停止。附图说明为了更清楚的说明本专利技术现有实例的技术,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍。图1是一示列性实例示出一种基于3D卷积超市安防的原理框图图2是一示列性实例示出一种基于3D卷积超市安防的流程图图3是一示列性实例示出一种基于3D卷积超市安防的3DCNN训练模型的结构具体实施方式下面是结合附图对本专利技术的具体实施方式进行描述,以便本领域的技术人员更好的理解本专利技术。目前深度学习模型是一类可以通过从低级特征构建高级特征来学习特征层次的机器。广泛应用于人类识别、语音识别、音频分类等,现有的CNN框架采用的是视频帧为静止图像来识别单帧级别的动作,然而这些方法只考虑了空间的信息,没有考虑多个连续帧中编码的运动信息。为了解决上述的技术,本专利技术基于3DCNN结构设计了一种超市安防系统,同时捕获时间和空间维度的特征,提高识别的速度和准确度。为了便于理解,对本专利技术的实施列一种基于3DCNN结构的超市安防系统进行详细的说明:参见图1所示,本专利技术基于3DCNN结构的超市安防系统包括影像信息采集模块、训练网络识别偷盗行为和预警模块。影像信息采集包括视频采集、视频处理和第一微控单元。其中摄像头由1-3个枪击摄像头组成,枪机摄像头专门负责相关影像采集,由于进入网络训练时需要特定的尺寸大小,视频处理用于处理采集信息,将视频帧大小统一设为128x171,第一微控单元用于综合控制摄像模块和视频处理模块的具体动作,同时负责与预警系统的实时通讯,其主要是根据图像特征锁定和实时预警。训练网络识别偷盗行为包括建立数据集、构建3DCNN网络结构和训练3DCNN结构。预警模块包括显示和预警。将经过3DCNN网络的训本文档来自技高网...

【技术保护点】
1.一种超市安防系统,包括:影像信息采集模块、训练网络识别偷盗行为、预警模块。

【技术特征摘要】
1.一种超市安防系统,包括:影像信息采集模块、训练网络识别偷盗行为、预警模块。2.一种基于三维神经网络的超市安防系统,其特征包括以下步骤:(1)影像信息采集模块影响信息采集包括数据采集、视频处理和第一微控单元,首先从超市监控样本库里提取人物视频样本,视频处理即对数据进行归一化处理,即各帧具有相同的宽和高;(2)训练网络识别偷盗行为(2.1)3DCNN架构设置将带有人的图像的前后帧从视频样本库里截取出来,引用大小为cxlxhxw的视频剪辑,其中c是通道数,l是帧的长度,h和w分别为是视频的高度和宽度,将视频所有帧输入尺寸设置为3x16x128x171,视频被分为非重叠的16帧。3D卷积和池内核大小为dxkxk,其中d为内核时间深度,k为内核空间大小。使用8个卷积层,5个最大池化层,2个完全连接层和1个softmax丢失层来预测动作标签,5个卷积层的滤波器数量从1到5分别为64、128、256、256、256。所有的3D卷积层均采用3x3x3,在时间和空间上的步幅均为1x1x1,5个池化层依次跟在卷积层后面,除了第一个池化层内核大小是1x2x2,步幅为1x2x2,其余池化层为2x2x2,步幅为2x2x2,每个完全连接层有4096个输出单元,最后接一个softmax丢失层来预测动作标签。利用SGD优化器对视频进行训练,输出每个视频块中的预测结果。(2.2)3DCNN架构训练将视频样本进行随机裁剪为3x16x112x112,通过堆叠多个连续帧组成一个立方体,然后在立方体中运用3D卷积核,卷积层中每个特征层都会与上一层中多个连续层相连,因此保留了运动的信息。在卷积结束以后执行加偏差项和激励函数tanh以获得特征图,形式上,在第i层的第j个特征图上的位置(x,y,...

【专利技术属性】
技术研发人员:李雅兰严永强吴羽峰李泽南张益溢方维
申请(专利权)人:中国计量大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1