一种基于卷积神经网络进行图像识别的水位识别方法技术

技术编号:38242606 阅读:12 留言:0更新日期:2023-07-25 18:04
本发明专利技术公开了一种基于卷积神经网络进行图像识别的水位识别方法,所述方法包括:步骤1、采集水库、河道、电站视频摄像头的截图以及网络公开视频截图组成数据集;步骤2、数据筛选,筛选出符合要求的图片进行数据标注;步骤3、使用标注数据与图片数据进行神经网络模型训练;步骤4、使用训练好的模型对视频及图片进行识别,识别结果经过报警逻辑处理后发布;解决了现有技术针对河流、水库和城市内涝的水位监测普遍采用水位传感器、标尺等进行测量并报送到上位机进行处理;存在效率低、实时性差、成本高等诸多技术问题。本高等诸多技术问题。

【技术实现步骤摘要】
一种基于卷积神经网络进行图像识别的水位识别方法


[0001]本专利技术属于水位监测
,尤其涉及一种基于卷积神经网络进行图像识别的水位识别方法。

技术介绍

[0002]我国是一个水系丰富、河流分布广泛、洪涝灾害频发的国家。洪涝灾害不仅严重威胁着生命财产安全,而且会给国民经济带来严重损失;针对河流、水库和城市内涝的水位监测普遍采用水位传感器、标尺等进行测量并报送到上位机进行处理;存在效率低、实时性差、成本高等诸多技术问题。

技术实现思路

[0003]本专利技术要解决的技术问题是:提供一种基于卷积神经网络进行图像识别的水位识别方法,以解决现有技术针对河流、水库和城市内涝的水位监测普遍采用水位传感器、标尺等进行测量并报送到上位机进行处理;存在效率低、实时性差、成本高等诸多技术问题。
[0004]本专利技术的技术方案是:
[0005]一种基于卷积神经网络进行图像识别的水位识别方法,所述方法包括:
[0006]步骤1、采集水库、河道、电站视频摄像头的截图以及网络公开视频截图组成数据集;
[0007]步骤2、数据筛选,筛选出符合要求的图片进行数据标注;
[0008]步骤3、使用标注数据与图片数据进行神经网络模型训练;
[0009]步骤4、使用训练好的模型对视频及图片进行识别,识别结果经过报警逻辑处理后发布。
[0010]数据标注的方法为:对非流体目标采用矩形目标框标注;对流体目标采用多边形逐像素标注;数据标注类别包括:水域、泄洪、行人、汽车、水尺及水尺刻度。
[0011]神经网络模型包括水域分割模型、目标检测模型、关键点检测模型和水尺读数识别模型。
[0012]使用标注数据与图片数据进行神经网络模型训练是在数据与数据标注之间建立函数关系的过程,在训练中为了获得最优解,要不断调试模型超参数、不断检查输入数据的正确性,最终得到训练好的模型。
[0013]本专利技术有益效果:
[0014]本专利技术是利用视频图片资源,主要是河道、水库数据,结合互联网公开数据集,进行深度学习训练模型;自动提取视频中的可用信息;使用训练后的模型对视频、图片进行识别;最终通过视频图像实时获取水尺水位、水库泄洪等信息;解决了现有技术针对河流、水库和城市内涝的水位监测普遍采用水位传感器、标尺等进行测量并报送到上位机进行处理;存在效率低、实时性差、成本高等诸多技术问题。
具体实施方式
[0015]本专利技术主要包括:
[0016]第一步收集水库、河道、电站等视频摄像头的截图,以及网络公开数据集;
[0017]第二步进行数据筛选,筛选出符合要求的图片进行数据标注;
[0018]第三步使用标注数据与图片数据进行神经网络模型训练;
[0019]第四步使用模型对视频、图片进行识别,识别结果经过报警逻辑处理后发布。
[0020]数据来源:
[0021]从互联网等各种渠道搜集数据,主要包括水库、电站、河道、以及城市内涝。之后进行数据筛选、数据标注,以保证输入数据的正确、合理。
[0022]数据收集与筛选
[0023]神经网络的训练是对图片样本的特征进行学习的过程,图片样本在包含大部分真实场景时,神经网络模型将具有较强的鲁棒性。真实情况下,图像画面可能会存在各种干扰,通常这种干扰都会降低识别精确度。所以在收集筛选阶段就考虑加入各种干扰情况的样本,以增加数据集的特征多样性,就能够在一定程度上改善该情况。因此本次训练的数据将尽可能考虑包含以下因素进行收集,以增加特征空间。
[0024]需要注意的是,在某些极端情况下(如强烈反光,浓雾天气,近乎透明的水面),即使是人都无法进行正确的识别判断,也就无法对该类样本进行标注,那么神经网络模型也自然无法识别该类情况。
[0025]同时,对于某些数据样本,虽然没有明显的无法识别判断,但是可能易诱导标注人员在标注时造成主观错误,这些样本都会在数据筛选时排除在外。
[0026]数据标注
[0027]数据样本的标注对于模型的精度有重要且直接的影响,因此要求标注人员必须严格按照统一的规范进行标注。标注方式为:1、对非流体目标采用矩形目标框标注,2、对流体目标采用多边形逐像素标注。数据标注类别为:水域、泄洪、行人、汽车、水尺、水尺刻度。
[0028]卷积神经网络包括主要包括以下几种主要算子:
[0029]卷积(Convolution)
[0030]卷积运算是卷积神经网络中的核心。卷积运算以一定的间隔滑动滤波器窗口并应用。将各个位置上滤波器元素和输入的对应元素相乘,再求和,然后将这个结果保存带输出的对应位置。将这个过程在所有位置都进行一遍,就可以得到卷积运算的输出。
[0031]填充(Padding)
[0032]在进行卷积层的处理之前,有时要向输入数据的周围填入固定的数据(比如0等),这称为填充,是卷积运算中经常会用到的处理。比如,对大小为(4,4)的输入数据应用了幅度为1的填充。“幅度为1的填充”是指用幅度为1像素的0填充周围。
[0033]步幅(stride)
[0034]应用滤波器的位置间隔称为步幅增大步幅后,输出大小会变小。而增大填充后,输出大小会变大。假设输入大小为(H,W),滤波器大小为(FH,FW),输出大小为(OH,OW),填充为P,步幅为S。此时,输出大小可通过式子进行计算。
[0035]化层(Pooling)
[0036]池化是缩小高、长方向上的空间的运算。比如,进行将2
×
2的区域集约成1个元素
的处理,缩小空间大小。
[0037]按步幅2进行2
×
2的Max池化时的处理顺序。“Max池化”是获取最大值的运算,此外还有Avg池化用于获取平均值。
[0038]在神经网络中,上层节点的输出和下层节点的输入之间具有一个函数关系,这个函数称为激活函数。激活函数其实是模拟人类神经元之间的信号传递,信号是从前一个神经元轴突传递到后一个神经元的树突或胞体,是从电信号转化学信号再转电信号,激活函数就是模拟化学信号到电信号之间的转换。激活函数将非线性的特性引入到神经网络中,使得网络可以逼近任何非线性函数,这样就使得模型可以解决众多的非线性问题。
[0039]Relu激活函数公式如下:
[0040]f(x)=max(0,x)
[0041]损失函数是用来评价模型的预测值和真实值的差异程度。在训练过程中损失逐渐降低说明模型的预测值正在向真实值方向逐渐靠近。不同的模型用的损失函数一般也不一样。均方误差(MSE)是回归损失函数中最常用的误差,它是预测值与目标值之间差值的平方和,其公式如下所示:
[0042][0043]OLOX模型模型训练:
[0044]神经网络的训练是在数据与数据标注之间建立函数关系的过程。在训练中为了获得最优解,需要不断调试模型超参数、不断检查输入数据的正确性、合理性、统一性。
[0045]结果处理:本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于卷积神经网络进行图像识别的水位识别方法,其特征在于:所述方法包括:步骤1、采集水库、河道、电站视频摄像头的截图以及网络公开视频截图组成数据集;步骤2、数据筛选,筛选出符合要求的图片进行数据标注;步骤3、使用标注数据与图片数据进行神经网络模型训练;步骤4、使用训练好的模型对视频及图片进行识别,识别结果经过报警逻辑处理后发布。2.根据权利要求1所述的一种基于卷积神经网络进行图像识别的水位识别方法,其特征在于:数据标注的方法为:对非流体目标采用矩形目标框标注;对流体目标采用多边形逐像素标注...

【专利技术属性】
技术研发人员:李胜郑强张冼华张荣杨正熙李涛
申请(专利权)人:贵州东方世纪科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1