【技术实现步骤摘要】
一种基于改进VGG16卷积网络的排烟视频检测方法
本专利技术属于目标检测
,具体涉及一种基于改进VGG16卷积网络的排烟视频检测方法。
技术介绍
在快速发展的现代社会中,“安全,快速,方便”已成为现代社会的代名词,生活中各个方面充满了对科技的利用。计算机视觉作为一门研究如何使机器“看”的科学,它利用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使图像更适合人眼观察或仪器检测。目前,计算机视觉成为科学领域中一个富有挑战性、重要且热门的研究领域。我国化工厂发展迅速,烟囱排烟现象复杂,而且造成空气污染较为严重。随着国内环保法规的日益严格,对化工厂排烟情况监测更加重视。为了人类的可持续发展,空气污染是必须解决的重大问题。虽然目前在有些场景中使用了摄像机对排烟进行监控,但是仍然需要有人对监控画面进行看守,这样不仅耗时费力,而且也无法保证准确、实时地对排烟情况做出反应。为了满足实际应用的需要,针对目前烟囱排烟监管和检测出现的各种不足,对排烟情况的智能化检测进行了研究,随着深度学习的不断发展、应用领域不断扩大,对烟囱排烟进行自动化、智能化实时监控、检测成为可能,因而设计了一种基于改进VGG16卷积网络的烟囱排烟视频实时检测方法。
技术实现思路
本专利技术采用改进VGG16卷积网络,对烟囱排烟视频及图像进行排烟检测,能有效满足实时性和精度要求。本专利技术的技术方案如下:一种基于改进VGG16卷积网络的排烟视频检测方法,步骤如下:步骤1:生成烟囱排放图像数据集;步骤1.1爬取烟囱排烟图像从网页上下载烟囱排烟视频,截取图片帧;将烟囱排烟图像和 ...
【技术保护点】
1.一种基于改进VGG16卷积网络的排烟视频检测方法,其特征在于,步骤如下:步骤1:生成烟囱排放图像数据集;步骤1.1爬取烟囱排烟图像从网页上下载烟囱排烟视频,截取图片帧;将烟囱排烟图像和图片帧整合生成数据集;步骤1.2数据增强对步骤1.1中整合生成的数据集进行数据增强;步骤1.3特征标记对增强后的数据集中的排烟图像的烟雾部分用矩形框进行特征标记,得到矩形框的坐标信息(x,y,w,h),(x,y)为矩形框的中心坐标,(w,h)为矩形框的宽和高,将带有矩形框坐标信息的图像生成新的数据集A,该数据集A将用于改进VGG16卷积网络训练;步骤2:获取最优权重模型;将数据集A中标记图像分为训练集Q1、验证集Q2和测试集Q3;步骤2.1训练生成多个权重模型将训练集Q1送入到改进VGG16卷积网络中进行训练,得到多个权重模型;所述的改进VGG16卷积网络的主网络结构是VGG16,最后两个全连接层改成两层卷积层,用于多尺度提取烟囱图像特征,再连接全局均值池化层,生成1×1×N的矩阵用于结果输出,最后输入到损失函数softmax中进行分类,构造完整的网络结构;其中全局池化层在整个特征图上取均值,可大量减 ...
【技术特征摘要】
1.一种基于改进VGG16卷积网络的排烟视频检测方法,其特征在于,步骤如下:步骤1:生成烟囱排放图像数据集;步骤1.1爬取烟囱排烟图像从网页上下载烟囱排烟视频,截取图片帧;将烟囱排烟图像和图片帧整合生成数据集;步骤1.2数据增强对步骤1.1中整合生成的数据集进行数据增强;步骤1.3特征标记对增强后的数据集中的排烟图像的烟雾部分用矩形框进行特征标记,得到矩形框的坐标信息(x,y,w,h),(x,y)为矩形框的中心坐标,(w,h)为矩形框的宽和高,将带有矩形框坐标信息的图像生成新的数据集A,该数据集A将用于改进VGG16卷积网络训练;步骤2:获取最优权重模型;将数据集A中标记图像分为训练集Q1、验证集Q2和测试集Q3;步骤2.1训练生成多个权重模型将训练集Q1送入到改进VGG16卷积网络中进行训练,得到多个权重模型;所述的改进VGG16卷积网络的主网络结构是VGG16,最后两个全连接层改成两层卷积层,用于多尺度提取烟囱图像特征,再连接全局均值池化层,生成1×1×N的矩阵用于结果输出,最后输入到损失函数softmax中进行分类,构造完整的网络结构;其中全局池化层在整个特征图上取均值,可大量减少模型的总参数量,提高检测速度;所述步骤2.1中用改进VGG16卷积网络对训练集Q1进行训练的具体步骤如下:步骤2.1.1得到正负样本用于新网络训练defaultbox是改进VGG16卷积网络自动标记的烟囱框,defaultbox的面积Sk如下:其中,Smin表示最底层的面积;Smax表示最顶层的面积;defaultbox的宽为:其中,Δw为宽的偏移量;defaultbox的高为:其中,Δh为高的偏移量;defaultbox的长宽比ar有5种,ar={1,4/3,16/9,3/4,9/16};将defaultbox的面积与训练集Q1中特征标记的矩形框进行比较,defaultbox的面积与训练集Q1中特征标记的矩形框的重叠面积大于0.5,图像标记为正样本,小于0.3时标记为负样本,产生的正样本和负样本比为1:3;步骤2.1.2获取defaultbox的类别的置信度和坐标值将步骤2.1.1得到的正样本和负样本放入改进VGG16卷积网络训练,得到三层特征层;用两个不同...
【专利技术属性】
技术研发人员:肖志勇,刘徐,刘辰,吴鑫鑫,
申请(专利权)人:江南大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。