一种基于感知注意力的安全带检测网络制造技术

技术编号:35408052 阅读:24 留言:0更新日期:2022-11-03 11:03
本发明专利技术公开了一种基于感知注意力的安全带检测网络,包括:采集输入特征图x,构建主干网络ResNet50残差网络和5个残差块,并添加协调注意力模块,将通道注意力嵌入到位置信息中;利用特征金字塔网络FPN将ResNet50不同特征层进行融合,得到特征图P3、P4、P5、P6、P7;对所述特征图P3、P4、P5、P6、P7进行模型的特征图Anchor点,生成9种Anchor;预测每个Anchor目标出现的概率,并计算所述Anchor的损失值。本发明专利技术基于深度学习的高空安全带检测,可以在节约时间成本的情况下提取丰富的目标特征,完成对高空安全带的检测,减少了传统人工选取特征的种种麻烦,通过计算机视觉检测的方法,可以精准的判断高处作业施工人员安全带的佩戴情况,有效的预防意外安全事故的发生。有效的预防意外安全事故的发生。有效的预防意外安全事故的发生。

【技术实现步骤摘要】
一种基于感知注意力的安全带检测网络


[0001]本专利技术涉及的
,尤其涉及一种基于感知注意力的安全带检测网络。

技术介绍

[0002]高空电力施工检测场景下安全带目标位置和方向的不确定性。高空电力施 工人员在高空进行施工时通常不会保持固定姿态,导致施工人员的安全带也会 呈现出不同方向和位置。因此安全带目标检测任务中方向信息和位置信息就变 得非常重要。传统的attention机制如SE通常只考虑了内部通道信息但无法捕 获位置信息,而BAM和CBAM尝试通过在通道上进行全局池化来引入位置信 息但这种方式只能捕获局部的位置信息,无法捕获方向信息及长距离依赖的信 息。
[0003]高空电力施工检测场景下安全带目标特征的分散性。相对于人体目标特征 而言,安全带目标分散在人体躯干上,特征不够集中。因此提高分散特征的检 测能力就变得非常重要。传统的FPN通过水平融合低分辨率特征图和高分辨 率特征图,在一定程度上缓解了信息扩散问题。但是,直接融合不同密度的信 息会引起语义冲突,限制了多尺度特征的表达,使分散的特征容易淹没在冲突 信息中。
...

【技术保护点】

【技术特征摘要】
1.一种基于感知注意力的安全带检测网络,其特征在于,包括:采集输入特征图x,构建主干网络ResNet50残差网络,基于残差映射方法,构建5个残差块;在所述5个残差块中添加协调注意力模块,获取目标位置信息,并将通道注意力嵌入到位置信息中;利用特征金字塔网络FPN通过自下而上、自上而下的连接以及横向连接将ResNet50不同特征层进行融合,得到特征图P3、P4、P5、P6、P7;对所述特征图P3、P4、P5、P6、P7进行模型的特征图Anchor点,生成9种Anchor;预测每个Anchor目标出现的概率,并计算所述Anchor的损失值。2.如权利要求1所述的基于感知注意力的安全带检测网络,其特征在于:所述残差映射方法的计算包括,H(x)=F(x)+x其中,H(x)表示基础残差单元的输出,x表示输入特征图,F(x)表示经卷积层处理后的输出;基于H(x)=F(x)+x的残差映射方法,依次构建Res1、Res2、Res3、Res4、Res5这5个残差块,所述残差块的下采样率分别为2^1、2^2、2^3、2^4、2^5,并选取Res3、Res4、Res5作为初始的检测层。3.如权利要求2所述的基于感知注意力的安全带检测网络,其特征在于:将通道注意力嵌入到位置信息中包括坐标信息生成和坐标注意力嵌入。4.如权利要求3所述的基于感知注意力的安全带检测网络,其特征在于:所述坐标信息的生成包括,利用全局池化对通道注意编码空间的信息进行全局编码,所述全局池的计算包括,其中,z
c
表示第c个通道的值,H表示输入特征图x的高度,W表示输入特征图x的高度,x
c
(h,i)表示第c通道特征图的h高度的第i个值;将所述第c个通道的值z
c
沿水平坐标和垂直坐标进行聚合编码,得到和所述的计算包括,其中,表示沿水平坐标进行聚合编码输出的第c个通道的值,W表示输入特征图的宽度,x
c
(h,i)表示第c通道特征图的h高度的第i个值;所述的计算包括,其中,表示沿垂直坐标进行聚合编码输出的第c个通道的值,W表示输入特征图
的宽度,x
c
(h,i)表示第c通道特征图的w宽度的第i个值。5.如权利要求3或4所述的基于感知注意力的安全带检测网络,其特征在于:所述通道注意力的嵌入包括,通道注意力模块将变换后的坐标信息进行聚合操作,得到空间信息在水平方向和垂直方向进行编码的中间特征映射f,f=δ(F1([z
h
,z
w
]))其中,[
·
,
·
]表示沿空间维度进行聚合操作,δ表示非线性激活函数,F1表示卷积操作,f表示对空间信息在水平方向和垂直方向进行编码的中间特征映射;沿着空间维度将f分解为两个单独的张量f
h
和f
w
;利用两个1
×
1卷积函数F
h
和F
w
分别将f
h
和f
w
的通道数扩张至C,g
h
=σ(F
h
(f
h
))g
w
=σ(F
w
(f
w
))其中,g
h
表示h方向的注意力特征向量,g
w
表示w方向的注意力特征向量,F
h
表示h方向的卷积函数,F
w
表示w方向的卷积函数,f
h
表示对空间信息在水平方向进行编码的中间特征映射,f
w
表示对空间信息在垂直方向进行编码的中间特征映射;将g
h
和g
w
输入至注意力模块,得到y
c
(i,j),其中,y
c
(i,j)注意力模块输出值,x
c
(i,j)表示第c通道特征图x的值,表示第c通道h方向的注意力特征向量,表示第c通道w方向的注意力特征向量。6.如权利要求5所述的基于感知注意力的安全带检测网络,其特征在于:包括,利用特征金字塔网络FPN通过自上而下和自下而上的连接以及横向连接将ResNet50不同特征层进行融合,分别生成特征图Res3、Res4、Res5和特征图P3、P4、P4、P5、P6、P7;其中,P3、P4、P5由Res3、Res4、Res5计算得到,而P6、P7是由P3、P4、P5层进行自上而下和自下而上的融合得到的。7.如权利要求6所述的基于感知注意力的安全带检测网络,其特征在于:所述对所述特征图P3、P4、P5、P6、P7进行模型的特征图Anchor点包括,在P3、P4、P5、p6、p7这5个level上都对应的Anchor的尺寸分别为32^2、64^2、128^2、256^2、512^2,每个金字塔层级的长度宽度比均为{1:2,1:1,2:1};在每个长宽比的Anchor中加入{2^0,2^1,2^2}三种不同...

【专利技术属性】
技术研发人员:杨志花吴振田罗崇立李森林尹震超廖颖茜王秀竹钱鑫韦荣桃吕灵智刘炜伦钟震宇龙邹
申请(专利权)人:广东电力通信科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1