一种基于深度学习的变电站状态指示灯识别方法技术

技术编号:39731975 阅读:22 留言:0更新日期:2023-12-17 23:35
本发明专利技术公开了一种基于深度学习的变电站状态指示灯识别方法,属于计算机视觉方向处理技术领域,包括数据预处理,通过数据增强扩充数据集;训练学习阶段优化网络模型,将需要识别的指示灯图像输入到构建的网络架构中;在骨干网络中添加场景感知的

【技术实现步骤摘要】
一种基于深度学习的变电站状态指示灯识别方法


[0001]本专利技术属于计算机视觉方向处理
,具体涉及一种基于深度学习的变电站状态指示灯识别方法


技术介绍

[0002]随着当今世界电力系统的不断发展,配电站房的数量和规模也在不断扩张

随时了解配电站房中各个设备的运行状态尤为重要

对于配电站房中各个设备的运行状况,一般都伴随着相关指示灯的变化

传统意义上设备的运行检查,需要人工巡视来查看各个设备的指示灯变化情况,但是由于指示灯一般都比较聚集,人工排查操作,易出现错记

漏记的情况,随意性较强,并且也不实时,无法及时了解运行状况,效率较为低下

当然也可以采用图像处理技术,通过处理监控图像来对各个设备的指示灯状态进行判断,但是由于指示灯目标较小,分辨率低,图像模糊,携带的信息少,由此所导致特征表达能力弱,也就是在提取特征的过程中,能提取到的特征非常少,这不利于对小目标的检测,增加了检测的难度

专利技术内容
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于深度学习的变电站状态指示灯识别方法,其特征在于,方法包括以下步骤:步骤一:数据预处理,通过数据增强扩充数据集;步骤二:训练学习阶段优化网络模型,将需要识别的指示灯图像输入到构建的网络架构中;步骤三:在构建的网络架构中添加场景感知的
ROI
池化提取每个
ROI
的特征,通过
Context

Aware RoI Pooling
方法使用双线性反卷积核上采样,扩大小建议框的特征区域,避免使用复制的特征值来表示小目标;步骤四:在网络结构中的保存图像信息的特征层上上添加坐标注意力机制
CA
,构建十字架型的通道注意力,将通道注意力分解为两个沿着不同方向聚合特征的一维特征编码过程;步骤五:将步骤三得到的所有池化特征使用
Concat
操作融合在一起;步骤六:最后使用决策网络,包含一个卷积层和一个全连接层,之后跟两个分类器:一个用于分类

一个用于边界框回归,得到最后的检测结果
。2.
根据权利要求1所述的一种基于深度学习的变电站状态指示灯识别方法,其特征在于,步骤三中
Context

Aware RoI Pooling
,使用双线性插值反卷积核,保持场景信息,助于产生基于原始结构的特征,
Context

aware RoI Pooling
将所采用的策略包括:如果建议框的宽和高均大于
RoI
预设的尺寸时,使用原始的
RoI
池化策略,提取每个子窗口的最大值
。3.
根据权利要求2所述的一种基于深度学习的变电站状态指示灯识别方法,其特征在于,
Context

aware RoI Pooling
将所采用的策略包括如果建议框的宽和高均小于
RoI
预设的尺寸时,使用双线性反卷积核扩大建议框,保持场景不被破坏,使得仍能提取到小建议框中的判别特征,反卷积核的大小由建议框的大小和预定义的池化大小动态确定:核的大小=预设的池化特征图的大小
/
建议框的大小
。4.
根据权利要求3所述的一种基于深度学习的变电站状态指示灯识别方法,其特征在于,
Context

aware RoI Pooling
将所采用的策略包括如果建议框的宽度比
RoI
预设的大,高度比预设的小,
CARoI pooling
使用反卷积操作来扩大建议框的高度,将建议框沿着宽度方向分成若干个子窗口,同时使用每个子窗口的最大值作为最具判别性的特征值
。5.
根据权利要求4所述的一种基于深度学习的变电站状态指示灯识别方法,其特征在于,
Context

aware RoI Pooling
将所采用的策略具体公式如下:其中公式
(1)
,表示第
k
个建议框
CAROI Pooling
层第
j
个输出;
x
i
∈R

x
i
代表特征层中的第
i
个特征值;先将建议框反卷积,然后再做
ROI
池化操作,公式如下;公式
(2)
中,
R(k,j)
表示子窗口的索引集合,在这个子窗中选择其中最大值,
X
k
表示第
k
个建议框,表示反卷积操作,
σ
k
为反卷积核,如果
ROI
的大小大于目标大小的时候,
σ
k
=1,意味着反卷积不会起到作用
。6.
根据权利要求1所述的一种基于深度学习的变电站状态指示灯识别方法,其特征在于,一个
CA
模块看作一个用来增强特征表示能力的计算单元,将任何中间张量
X
作为输入并
输出一个增强表示能力之后的同样尺寸的输出
Y
,其中
X

Y
可以表示如下:
X

[x1,x2,...,x
c
]∈R
C
×
H
×
W
(3)Y

[y1,y2,...,y
c
](4)
公式
(3)
中,
C
为图片的通道层,
H
为图片的高度,
W
为图片的宽度,
R
为实数集;公式
(4)

c
表示第
c
个通道,
CoordinateAttention
通过精确的位置信息对通道关系和长期依赖性进行编码,具体操作分为坐标信息嵌入和坐标注意力生成
。7.
根据权利要求6所述的一种基于深度学习的变电站状态指示灯识别方法,其特征在于,坐标信息嵌入步骤包括将全局平均池化进行的分解,将二维全局池操作分解为两个一维编码,在输入
X
的条件下,第
c
通道的压缩步长可表示为:公式
(5)
中,
z
c
是第
c
通道的压...

【专利技术属性】
技术研发人员:高丹丹沈阳戴慧丹
申请(专利权)人:佳源科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1