基于Mask R-CNN神经网络的火灾夜间场景复原方法技术

技术编号：22102333 阅读：29 留言：0更新日期：2019-09-14 03:29

本发明专利技术涉及一种于Mask R‑CNN模型的火灾夜间场景复原方法，通过训练Mask‑RCNN模型对火焰进行实例分割，将夜晚的起火位置的火焰初期的区域分割出来融合到白天的监控视频上，定位起火的具体位置，在实例分割的后续操作中，利用图像混合叠加算法，将分割出的火焰区域叠加到白天的监控视频图像上，从而实现火灾场景的复原并辅助定位起火位置，为火灾成因认定奠定了坚实的基础。

Fire Night Scene Restoration Method Based on Mask R-CNN Neural Network

全部详细技术资料下载

【技术实现步骤摘要】
基于MaskR-CNN神经网络的火灾夜间场景复原方法
本专利技术涉及图像处理与计算机视觉领域，特别涉及一种基于MaskR-CNN神经网络的火灾夜间场景复原方法，将夜间起火位置火焰融合到白天的监控视频上，实现夜晚火灾场景的复原。
技术介绍
在当今社会中，火灾一直是人类面临的主要灾害之一，严重的火灾事故不仅会造成大量的人员伤亡，还会危及生命。避免火灾不仅需要在火灾发生前及时监测、预警火灾事故，还需要在火灾发生后精准地调研分析火灾发生的原因、定位起火位置。火焰是火灾发生的重要视觉标志之一，火焰的研究对火灾的准确监控具有重要作用。传统的火灾事故调查主要以现场勘查并收集证据为主要手段，在进行火灾原因认定时，往往根据现场残留的火灾痕迹、残留物并结合证人询问笔录，通过逻辑推理得到认定结论，这种传统火灾原因调查方法具有很大的主观性和局限性。随着数字图像处理技术的发展，安防监控设备已经遍布了各大场所，这些监控视频图像已经可以客观具体地反映现场情况，对认定火灾原因发挥了良好的作用。但是由于一些客观元素限制，比如火灾发生在夜间，那么只通过监控视频，火调人员无从确定起火的具体位置，目前仍然没有很好的复原夜间火灾场景的方法。
技术实现思路
鉴于现有技术的状况及存在的不足，为了便于火灾调查人员确定夜间火灾起火位置，本专利技术提出一种基于MaskR-CNN模型的火灾夜间场景复原方法，通过训练Mask-RCNN模型对火焰进行实例分割，将夜晚的起火位置的火焰初期的区域分割出来融合到白天的监控视频上，定位起火的具体位置，在实例分割的后续操作中，利用图像混合叠加算法，将分割出的火焰区域叠加到白天的...

【技术保护点】
1.一种基于Mask R‑CNN神经网络的火灾夜间场景复原方法，利用计算机作为平台，其特征在于，步骤如下：⑴、建立火焰检测样本库：为了使用Mask‑RCNN对火焰区域进行准确的提取分割，采集主要包括夜间各种场景下的火灾监控图片，经过标定处理，作为训练数据集，完成对Mask‑RCNN网络的训练；⑵、图像的预处理：输入需要复原的火灾夜间场景视频帧，对于每一帧图像进行形态学滤波，图像随机翻转，裁剪，像素归一化，图像增强，可以去除噪声和图片尺寸因素的影响，便于网络的训练与推理；⑶、Mask R‑CNN模型训练：Mask R‑CNN 继承于Faster R‑CNN，在Faster R‑CNN上面加了一个Mask Prediction Branch，并且改良了RoI Pooling，提出了RoI Align，是Faster R‑CNN和FCN的结合，同时完成了目标检测、目标分类、像素级目标分割三类任务，Mask R‑CNN训练主要分为两个阶段，第一阶段训练区域生成网络RPN,第二阶段使用RoI Align将RPN层生成的RoI映射feature map对应位置，将映射后的区域生成固定大小的特征图进...

【技术特征摘要】
1.一种基于MaskR-CNN神经网络的火灾夜间场景复原方法，利用计算机作为平台，其特征在于，步骤如下：⑴、建立火焰检测样本库：为了使用Mask-RCNN对火焰区域进行准确的提取分割，采集主要包括夜间各种场景下的火灾监控图片，经过标定处理，作为训练数据集，完成对Mask-RCNN网络的训练；⑵、图像的预处理：输入需要复原的火灾夜间场景视频帧，对于每一帧图像进行形态学滤波，图像随机翻转，裁剪，像素归一化，图像增强，可以去除噪声和图片尺寸因素的影响，便于网络的训练与推理；⑶、MaskR-CNN模型训练：MaskR-CNN继承于FasterR-CNN，在FasterR-CNN上面加了一个MaskPredictionBranch，并且改良了RoIPooling，提出了RoIAlign，是FasterR-CNN和FCN的结合，同时完成了目标检测、目标分类、像素级目标分割三类任务，MaskR-CNN训练主要分为两个阶段，第一阶段训练区域生成网络RPN,第二阶段使用RoIAlign将RPN层生成的RoI映射featuremap对应位置，将映射后的区域生成固定大小的特征图进行分类、坐标回归和输出一个二值Mask，在训练MaskR-CNN模型时，采用如下的损失函数：L=Lcls+Lbox+Lmask其中，L表示总的误差，Lcls代表分类误差，Lbox表示回归误差，Lmask表示分割误差；Lbox和Lmask是对正样本才会起作用的，MaskR-CNN中的正样本被定义成了与Groundtruth的IoU大于0.5的预测框，在mask分支中对每个RoI的输出是K*m*m，表示k个尺寸为m*m的二值mask，k是物体类别数目；MaskR-CNN没有采用FCN中的Softmaxloss进行分类，而是通过输出K个mask预测图，每一类都输出一个mask，通过逐像素的Sigmoid计算得到，代价函数为Sigmoid对应的交叉熵损失函数，利用BinaryLoss代替MultinomialLoss，消除了不同类别的mask之间的竞争，生成了准确的二值mask；⑷、MaskR-CNN模型...

【专利技术属性】
技术研发人员：王鑫，陈钦佩，鲁志宝，
申请(专利权)人：应急管理部天津消防研究所，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人