当前位置: 首页 > 专利查询>江南大学专利>正文

一种基于改进VGG16卷积网络的排烟视频检测方法技术

技术编号:19823596 阅读:17 留言:0更新日期:2018-12-19 15:21
本发明专利技术属于目标检测技术领域,具体涉及一种基于改进VGG16卷积网络的排烟视频检测方法,步骤如下:步骤1:生成烟囱排放图像数据集;步骤2,将训练集送入到改进VGG16卷积网络中进行训练,得到多个权重模型。所述的改进VGG16卷积网络的主网络结构是VGG16,最后两个全连接层改成两层卷积层,用于多尺度提取烟囱图像特征,再连接全局均值池化层,生成的矩阵用于结果输出,最后输入到损失函数中进行分类,构造完整的网络结构。本发明专利技术检测的速度得到了很大的提升,并且使用不同长宽比的default box,使得多个default box可以适应不同物体的不同形状和尺寸。

【技术实现步骤摘要】
一种基于改进VGG16卷积网络的排烟视频检测方法
本专利技术属于目标检测
,具体涉及一种基于改进VGG16卷积网络的排烟视频检测方法。
技术介绍
在快速发展的现代社会中,“安全,快速,方便”已成为现代社会的代名词,生活中各个方面充满了对科技的利用。计算机视觉作为一门研究如何使机器“看”的科学,它利用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使图像更适合人眼观察或仪器检测。目前,计算机视觉成为科学领域中一个富有挑战性、重要且热门的研究领域。我国化工厂发展迅速,烟囱排烟现象复杂,而且造成空气污染较为严重。随着国内环保法规的日益严格,对化工厂排烟情况监测更加重视。为了人类的可持续发展,空气污染是必须解决的重大问题。虽然目前在有些场景中使用了摄像机对排烟进行监控,但是仍然需要有人对监控画面进行看守,这样不仅耗时费力,而且也无法保证准确、实时地对排烟情况做出反应。为了满足实际应用的需要,针对目前烟囱排烟监管和检测出现的各种不足,对排烟情况的智能化检测进行了研究,随着深度学习的不断发展、应用领域不断扩大,对烟囱排烟进行自动化、智能化实时监控、检测成为可能,因而设计了一种基于改进VGG16卷积网络的烟囱排烟视频实时检测方法。
技术实现思路
本专利技术采用改进VGG16卷积网络,对烟囱排烟视频及图像进行排烟检测,能有效满足实时性和精度要求。本专利技术的技术方案如下:一种基于改进VGG16卷积网络的排烟视频检测方法,步骤如下:步骤1:生成烟囱排放图像数据集;步骤1.1爬取烟囱排烟图像从网页上下载烟囱排烟视频,截取图片帧;将烟囱排烟图像和图片帧整合生成数据集。步骤1.2数据增强对步骤1.1中整合生成的数据集进行数据增强。所述的数据增强包括旋转、反射变换、翻转变换、缩放变换、平移变换、尺度变换、对比度变换、噪声扰动和颜色变换。数据增强增加数据集内图像个数,提高神经网络识别能力和泛化能力,从而提高训练精度。步骤1.3特征标记对增强后的数据集中的排烟图像的烟雾部分用矩形框进行特征标记,得到矩形框的坐标信息(x,y,w,h),(x,y)为矩形框的中心坐标,(w,h)为矩形框的宽和高,将带有矩形框坐标信息的图像生成新的数据集A,该数据集A将用于改进VGG16卷积网络训练。步骤2:获取最优权重模型;将数据集A中标记图像分为训练集Q1、验证集Q2和测试集Q3。进一步的,设置训练集Q1占数据集A的60%;验证集Q2占数据集A的20%;测试集Q3占数据集A的20%。步骤2.1训练生成多个权重模型将训练集Q1送入到改进VGG16卷积网络中进行训练,得到多个权重模型。所述的改进VGG16卷积网络的主网络结构是VGG16,最后两个全连接层改成两层卷积层,用于多尺度提取烟囱图像特征,再连接全局均值池化层,生成1×1×N的矩阵用于结果输出,最后输入到损失函数softmax中进行分类,构造完整的网络结构。其中全局池化层在整个特征图上取均值,可大量减少模型的总参数量,提高检测速度。所述步骤2.1中用改进VGG16卷积网络对训练集Q1进行训练的具体步骤如下:步骤2.1.1得到正负样本用于新网络训练defaultbox是改进VGG16卷积网络自动标记的烟囱框,defaultbox的面积Sk如下:其中,Smin表示最底层的面积,取值为0.2;Smax表示最顶层的面积,取值为0.9。defaultbox的宽为:其中,Δw为宽的偏移量。defaultbox的高为:其中,Δh为高的偏移量。defaultbox的长宽比ar有5种,ar={1,4/3,16/9,3/4,9/16}。defaultbox在不同的特征层有不同的大小,在同一个特征层又有不同的长宽比,能覆盖输入排烟图像中的各种形状和大小的烟雾。将defaultbox的面积与训练集Q1中特征标记的矩形框进行比较,defaultbox的面积与训练集Q1中特征标记的矩形框的重叠面积大于0.5时,图像标记为正样本,小于0.3时标记为负样本,产生的正样本和负样本比为1:3。步骤2.1.2获取defaultbox的类别的置信度和坐标值将步骤2.1.1得到的正样本和负样本放入改进VGG16卷积网络训练,得到三层特征层;用两个不同的3×3的卷积核对三层特征层进行卷积,得到两个1×1×N的矩阵输出,其中一个输出为分类用的置信度,即生成的每个defaultbox的类别的置信度;另一个输出为回归用的定位,即每个defaultbox的坐标值(x,y,w,h)。步骤2.1.3模型调整将三层特征层和训练集Q1送到改进VGG16卷积网络中,使用SmoothL1函数进行拟合,输出坐标向量。将输出坐标向量、步骤2.1.2中得到的defaultbox的类别的置信度和defaultbox的坐标值使用Concat方法合并,然后用损失函数softmax进行模型调整,得到多个的defaultbox。步骤2.1.4生成多个权重模型使用非极大值抑制算法对2.1.3中的多个defaultbox进行筛选得到defaultboxA,由defaultboxA生成多个权重模型。步骤2.2验证集调参验证集Q2的作用是用来调整模型参数。当训练集Q1训练出多个权重模型后,为了能找出效果最佳的权重模型,使用各个权重模型对验证集Q2进行预测,并记录权重模型的准确率。选出准确率最大的权重模型所对应的参数,用该参数生成最优权重模型。2.3衡量网络性能使用测试集Q3对步骤2.2得到的最优权重模型进行预测,衡量改进VGG16卷积网络性能。步骤3:对烟囱排放视频和图像进行测试;将视频监控设备与计算机相连接,利用步骤2中生成的训练模型对监控的烟囱视频或图像进行检测,实时监控烟囱排烟状况,对有排烟视频进行矩形框标记并在计算机上显示。本专利技术的有益效果:(1)该改进VGG16卷积网络在多尺度的特征图下提取defaultbox,使得检测精度很高。(2)该改进VGG16卷积网络将传统的全连接层改为卷积层加全局均值池化层的网络结构,使得检测的速度得到了很大的提升。(3)使用不同长宽比的defaultbox,使得多个defaultbox可以适应不同物体的不同形状和尺寸。附图说明图1是本专利技术提供的方法流程图。图2是本专利技术提供的改进VGG16卷积网络的网络框架。图3是本专利技术提供的改进VGG16卷积网络的流程图。具体实施方式下面结合技术方案和附图对本专利技术的具体实施例详细说明。一种基于改进VGG16卷积网络的排烟视频检测方法,步骤如下:步骤1:生成烟囱排放图像数据集;步骤1.1爬取烟囱排烟图像通过python代码从网页上下载烟囱排烟视频,截取图片帧;将烟囱排烟图像和图片帧整合生成数据集。步骤1.2数据增强对步骤1.1中整合生成的数据集进行数据增强。所述的数据增强包括旋转、反射变换、翻转变换、缩放变换、平移变换、尺度变换、对比度变换、噪声扰动和颜色变换。数据增强增加数据集内图像个数,提高神经网络识别能力和泛化能力,从而提高训练精度。步骤1.3特征标记对增强后的数据集中的排烟图像的烟雾部分用矩形框进行特征标记,得到矩形框的坐标信息(x,y,w,h),(x,y)为矩形框的中心坐标,(w,h)为矩形框的宽和高,将带有矩形框坐标信息的图像生成新的数据集A,该数据集A将用于改进VG本文档来自技高网...

【技术保护点】
1.一种基于改进VGG16卷积网络的排烟视频检测方法,其特征在于,步骤如下:步骤1:生成烟囱排放图像数据集;步骤1.1爬取烟囱排烟图像从网页上下载烟囱排烟视频,截取图片帧;将烟囱排烟图像和图片帧整合生成数据集;步骤1.2数据增强对步骤1.1中整合生成的数据集进行数据增强;步骤1.3特征标记对增强后的数据集中的排烟图像的烟雾部分用矩形框进行特征标记,得到矩形框的坐标信息(x,y,w,h),(x,y)为矩形框的中心坐标,(w,h)为矩形框的宽和高,将带有矩形框坐标信息的图像生成新的数据集A,该数据集A将用于改进VGG16卷积网络训练;步骤2:获取最优权重模型;将数据集A中标记图像分为训练集Q1、验证集Q2和测试集Q3;步骤2.1训练生成多个权重模型将训练集Q1送入到改进VGG16卷积网络中进行训练,得到多个权重模型;所述的改进VGG16卷积网络的主网络结构是VGG16,最后两个全连接层改成两层卷积层,用于多尺度提取烟囱图像特征,再连接全局均值池化层,生成1×1×N的矩阵用于结果输出,最后输入到损失函数softmax中进行分类,构造完整的网络结构;其中全局池化层在整个特征图上取均值,可大量减少模型的总参数量,提高检测速度;所述步骤2.1中用改进VGG16卷积网络对训练集Q1进行训练的具体步骤如下:步骤2.1.1得到正负样本用于新网络训练default box是改进VGG16卷积网络自动标记的烟囱框,default box的面积Sk如下:...

【技术特征摘要】
1.一种基于改进VGG16卷积网络的排烟视频检测方法,其特征在于,步骤如下:步骤1:生成烟囱排放图像数据集;步骤1.1爬取烟囱排烟图像从网页上下载烟囱排烟视频,截取图片帧;将烟囱排烟图像和图片帧整合生成数据集;步骤1.2数据增强对步骤1.1中整合生成的数据集进行数据增强;步骤1.3特征标记对增强后的数据集中的排烟图像的烟雾部分用矩形框进行特征标记,得到矩形框的坐标信息(x,y,w,h),(x,y)为矩形框的中心坐标,(w,h)为矩形框的宽和高,将带有矩形框坐标信息的图像生成新的数据集A,该数据集A将用于改进VGG16卷积网络训练;步骤2:获取最优权重模型;将数据集A中标记图像分为训练集Q1、验证集Q2和测试集Q3;步骤2.1训练生成多个权重模型将训练集Q1送入到改进VGG16卷积网络中进行训练,得到多个权重模型;所述的改进VGG16卷积网络的主网络结构是VGG16,最后两个全连接层改成两层卷积层,用于多尺度提取烟囱图像特征,再连接全局均值池化层,生成1×1×N的矩阵用于结果输出,最后输入到损失函数softmax中进行分类,构造完整的网络结构;其中全局池化层在整个特征图上取均值,可大量减少模型的总参数量,提高检测速度;所述步骤2.1中用改进VGG16卷积网络对训练集Q1进行训练的具体步骤如下:步骤2.1.1得到正负样本用于新网络训练defaultbox是改进VGG16卷积网络自动标记的烟囱框,defaultbox的面积Sk如下:其中,Smin表示最底层的面积;Smax表示最顶层的面积;defaultbox的宽为:其中,Δw为宽的偏移量;defaultbox的高为:其中,Δh为高的偏移量;defaultbox的长宽比ar有5种,ar={1,4/3,16/9,3/4,9/16};将defaultbox的面积与训练集Q1中特征标记的矩形框进行比较,defaultbox的面积与训练集Q1中特征标记的矩形框的重叠面积大于0.5,图像标记为正样本,小于0.3时标记为负样本,产生的正样本和负样本比为1:3;步骤2.1.2获取defaultbox的类别的置信度和坐标值将步骤2.1.1得到的正样本和负样本放入改进VGG16卷积网络训练,得到三层特征层;用两个不同...

【专利技术属性】
技术研发人员:肖志勇刘徐刘辰吴鑫鑫
申请(专利权)人:江南大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1