一种变电站目标识别与分割方法技术

技术编号:38193578 阅读:18 留言:0更新日期:2023-07-20 21:13
本发明专利技术涉及一种变电站目标识别与分割方法,所述的方法包括以下步骤:步骤1:通过图像目标分割算法把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标;步骤2:采用语义分割DeepLabv3+算法模型将相同类型的对象用同一标签进行标记;步骤3:在获得目标的实时像素级分割后,通过对目标的边沿进行提取,从而获得目标的轮廓信息;步骤4:采用目标的轮廓估计算法即目标轮廓算法,估计出目标的形状;本发明专利技术具有采用目标分割网络、对目标轮廓进行拟合、得到目标外形估计、提高识别准确性的优点。点。点。

【技术实现步骤摘要】
一种变电站目标识别与分割方法


[0001]本专利技术属于变电站目标识别
,具体涉及一种变电站目标识别与分割方法。

技术介绍

[0002]随着我国电网规模不断扩大,变电设备数量和种类逐渐增多,组网复杂程度提高,使其运行压力增大,安全隐患也随之增加,对其安全可靠运行提出了更高要求,变电设备巡检和检测是保障变电设备可靠运行的重要手段之一,变电站的设备繁多,种类复杂,并且许多都在带电运行中,对变电设备的检测识别典型地表障碍物(包括电力线、高压线、植被、水系、烟囱、高压线塔、塔吊、桥梁、避雷针、建筑等),输出障碍物信息(包括种类、位置及轮廓),常规的目标检测网络只能给出目标的类别、位置以及最大外接矩形,降低识别的准确性;因此,提供一种采用目标分割网络、对目标轮廓进行拟合、得到目标外形估计、提高识别准确性的一种变电站目标识别与分割方法是非常有必要的。

技术实现思路

[0003]本专利技术的目的是为了克服现有技术的不足,而提供一种采用目标分割网络、对目标轮廓进行拟合、得到目标外形估计、提高识别准确性的一种变电站目标识别与分割方法。
[0004]本专利技术的目的是这样实现的:一种变电站目标识别与分割方法,所述的方法包括以下步骤:
[0005]步骤1:通过图像目标分割算法把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标;
[0006]步骤2:采用语义分割DeepLabv3+算法模型将相同类型的对象用同一标签进行标记;
[0007]步骤3:在获得目标的实时像素级分割后,通过对目标的边沿进行提取,从而获得目标的轮廓信息;
[0008]步骤4:采用目标的轮廓估计算法即目标轮廓算法,估计出目标的形状。
[0009]所述的步骤1中的图像目标分割算法采用基于特定理论的分割方法中的基于深度神经网络的算法。
[0010]所述的步骤2中的语义分割DeepLabv3+算法模型具体为:与检测模型类似,语义分割模型也是建立是分类模型基础上的,即利用CNN网络来提取特征进行分类,而对于CNN分类模型,一般情况下会存在stride>1的卷积层和池化层来降采样,此时特征图维度降低,但是特征更高级,语义更丰富,这对于简单的分类没有问题,因为最终只预测一个全局概率,对于分割模型就无法接受,因为需要给出图像不同位置的分类概率,特征图过小时会损失很多信息,但是下采样层又是不可缺少的,首先stride>1的下采样层对于提升感受野非常重要,这样高层特征语义更丰富,而且对于分割来说较大的感受野也至关重要;另外没有下采样层,特征图一直保持原始大小,计算量是非常大的,相比之下,对于前面的特征图,其
保持了较多的空间位置信息,但是语义会差一些,但是这些空间信息对于精确分割也是至关重要的,为了解决这个问题,DeepLabv3+算法模型属于典型的DilatedFCN,通过空洞卷积来减少下采样率但是又可以保证感受野。
[0011]所述的DeepLabv3+算法模型的Encoder的主体是带有空洞卷积的DCNN,采用ResNet分类网络,然后是带有空洞卷积的空间金字塔池化模块ASPP,是为了引入多尺度信息;所述的DeepLabv3+算法模型引入了Decoder模块,其将底层特征与高层特征进一步融合,提升分割边界准确度。
[0012]所述的空洞卷积具体为:空洞卷积是DeepLab模型的关键之一,它可以在不改变特征图大小的同时控制感受野,这有利于提取多尺度信息,其中rate(r)控制着感受野的大小,r越大感受野越大,通常的CNN分类网络的output_stride=32,若希望DilatedFCN的output_stride=16,只需要将最后一个下采样层的stride设置为1,并且后面所有卷积层的r设置为2,这样保证感受野没有发生变化,对于output_stride=8,需要将最后的两个下采样层的stride改为1,并且后面对应的卷积层的rate分别设为2和4;另外针对ResNet网络,最后的3个级联block采用不同rate,若output_stride=16且multi_grid=(1,2,4),那么最后的3个block的rate=2
·
(1,2,4)=(2,4,8)。
[0013]所述的空间金字塔池化ASPP具体为:在DeepLab中,采用空间金字塔池化模块来进一步提取多尺度信息,采用不同rate的空洞卷积来实现,ASPP模块主要包含以下几个部分:

一个1
×
1卷积层,以及三个3
×
3的空洞卷积,对于output_stride=16,其rate为(6,12,18),若output_stride=8,rate加倍;

一个全局平均池化层得到image

level特征,然后送入1
×
1卷积层,并双线性插值到原始大小;





得到的4个不同尺度的特征在channel维度concat在一起,然后送入1
×
1的卷积进行融合并得到256

channel的新特征。
[0014]所述的Decoder模块具体为:DeepLabv3+模型中借鉴了EncoderDecoder结构,引入了新的Decoder模块,首先将encoder得到的特征双线性插值得到4
×
的特征,然后与encoder中对应大小的低级特征concat,如ResNet中的Conv2层,由于encoder得到的特征数只有256,而低级特征维度可能会很高,为了防止encoder得到的高级特征被弱化,先采用1
×
1卷积对低级特征进行降维,两个特征concat后,再采用3
×
3卷积进一步融合特征,最后再双线性插值得到与原始图片相同大小的分割预测。
[0015]所述的DeepLabv3+算法模型所采用的backbone是ResNet网络,可以替换为改进的Xception,Xception网络主要采用depthwiseseparableconvolution,这使得Xception计算量更小,改进的Xception参考MSRA的修改,增加了更多的层;改进的Xception所有的最大池化层使用stride=2的depthwiseseparable convolution替换,可以改成空洞卷积;改进的Xception与MobileNet类似,在3
×
3depthwiseconvolution后增加BN和ReLU;采用改进的Xception网络作为backbone,DeepLab网络分割效果上有一定的提升,并且在ASPP中加入depthwise separable convolution,在基本不影响模型效果的前提下减少计算量。
[0016]所述的步骤4中的目标轮廓算法具体包括以下步骤:
[0017]步骤4.1:首先找到轮廓中距离最远的两个点,如M、N,将这本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种变电站目标识别与分割方法,其特征在于:所述的方法包括以下步骤:步骤1:通过图像目标分割算法把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标;步骤2:采用语义分割DeepLabv3+算法模型将相同类型的对象用同一标签进行标记;步骤3:在获得目标的实时像素级分割后,通过对目标的边沿进行提取,从而获得目标的轮廓信息;步骤4:采用目标的轮廓估计算法即目标轮廓算法,估计出目标的形状。2.如权利要求1所述的一种变电站目标识别与分割方法,其特征在于:所述的步骤1中的图像目标分割算法采用基于特定理论的分割方法中的基于深度神经网络的算法。3.如权利要求1所述的一种变电站目标识别与分割方法,其特征在于:所述的步骤2中的语义分割DeepLabv3+算法模型具体为:与检测模型类似,语义分割模型也是建立是分类模型基础上的,即利用CNN网络来提取特征进行分类,而对于CNN分类模型,一般情况下会存在stride>1的卷积层和池化层来降采样,此时特征图维度降低,但是特征更高级,语义更丰富,这对于简单的分类没有问题,因为最终只预测一个全局概率,对于分割模型就无法接受,因为需要给出图像不同位置的分类概率,特征图过小时会损失很多信息,但是下采样层又是不可缺少的,首先stride>1的下采样层对于提升感受野非常重要,这样高层特征语义更丰富,而且对于分割来说较大的感受野也至关重要;另外没有下采样层,特征图一直保持原始大小,计算量是非常大的,相比之下,对于前面的特征图,其保持了较多的空间位置信息,但是语义会差一些,但是这些空间信息对于精确分割也是至关重要的,为了解决这个问题,DeepLabv3+算法模型属于典型的DilatedFCN,通过空洞卷积来减少下采样率但是又可以保证感受野。4.如权利要求3所述的一种变电站目标识别与分割方法,其特征在于:所述的DeepLabv3+算法模型的Encoder的主体是带有空洞卷积的DCNN,采用ResNet分类网络,然后是带有空洞卷积的空间金字塔池化模块ASPP,是为了引入多尺度信息;所述的DeepLabv3+算法模型引入了Decoder模块,其将底层特征与高层特征进一步融合,提升分割边界准确度。5.如权利要求4所述的一种变电站目标识别与分割方法,其特征在于:所述的空洞卷积具体为:空洞卷积是DeepLab模型的关键之一,它可以在不改变特征图大小的同时控制感受野,这有利于提取多尺度信息,其中rate(r)控制着感受野的大小,r越大感受野越大,通常的CNN分类网络的output_stride=32,若希望DilatedFCN的output_stride=16,只需要将最后一个下采样层的stride设置为1,并且后面所有卷积层的r设置为2,这样保证感受野没有发生变化,对于output_stride=8,需要将最后的两个下采样层的stride改为1,并且后面对应的卷积层的rate分别设为2和4;另外针对ResNet网络,最后的3个级联block采用不同rate,若output_stride=16且multi_grid=(1,2,4),那么最后的3个block的rate=2
·
(1,2,4)=(2,4,8)。6.如权利要求4所述的一种变电站目标识别与分割方法,其特征在于:所述的空间金字塔池化ASPP具体为:在DeepLab中,采用空间金字塔池化模块来进一步提取多尺度信息,采用不同rate的空洞卷积来实现,AS...

【专利技术属性】
技术研发人员:张辉周刚李真王栋马勇杨莉
申请(专利权)人:国网河南省电力公司内乡县供电公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1