基于Transformer的安全帽识别方法技术

技术编号：33200843 阅读：20 留言：0更新日期：2022-04-24 00:37

本发明专利技术公开了一种基于Transformer的安全帽识别方法，首先，提取图像上的特征，并加入图像位置信息，其次，在经过Transformer编码组件得到注意力特征信息，并将所得到注意力特征信息和目标查询信息输入Transformer解码组件，输出注意力特征图，最后，利用前馈神经网络预测物体类别和中心坐标、框图高度、宽度。此方法能够用于智慧工地安全帽检测系统，快速有效，方法巧妙，扩展性强，具有良好的应用前景。具有良好的应用前景。具有良好的应用前景。

全部详细技术资料下载

【技术实现步骤摘要】
基于Transformer的安全帽识别方法

[0001]本专利技术涉及图像目标识别
，尤其涉及一种基于Transformer的安全帽识别方法。

技术介绍

[0002]智慧工地是一种崭新的工程全生命周期管理理念，它利用人工智能、计算机视觉等技术实现对工程项目实施过程的高效管理，大幅度地降低施工环境下出现的意外和损失，提高施工安全性，让施工工程管理更加省心。在工地施工过程中，安全帽对保障工人生命安全具有非常重要的作用，佩戴安全帽可以有效降低安全事故发生后因坠落、物体坠击对头部造成的损伤，最大限度地保护施工人员的生命安全。为了降低施工人员不按规范佩戴安全帽而造成的事故发生率，有必要对施工人员是否戴安全帽进行实时检测。
[0003]计算机视觉技术应用于生产安全的方式越来越受到人们的重视，已有许多专家学者对自动检测工人安全帽佩戴技术进行了研究。基于Transformer的网络框架在图像识别领域不断发展，取了不错的成果。

技术实现思路

[0004]本专利技术的目的是提供一种基于Transformer的安全帽识别方法，能够用于智慧工地安全帽检测系统，快速有效，方法巧妙，扩展性强，具有良好的应用前景。
[0005]为了达到上述目的，本专利技术所采用的技术方案是：
[0006]基于Transformer的安全帽识别方法，包括以下步骤：
[0007]步骤1，提取图像上的特征，并加入图像位置信息；
[0008]步骤2，利用Transformer编码组件得到注意力特征信息；/>[0009]步骤3，将所得到注意力特征信息和目标查询信息输入Transformer解码组件，输出注意力特征图；
[0010]步骤4，注意力特征图当成输入，利用前馈神经网络预测物体类别和中心坐标、框图高度、宽度。
[0011]进一步地，在一种实现方式中，所述步骤1，包括以下步骤，
[0012]将图像上的三维信息通过卷积神经网络转换成二维图像信息并通过正弦函数和余弦函数将位置信息嵌入到图像中，具体的公式如下：
[0013][0014][0015]其中，pos表示当前位置，i表示为维度，d
model
为HW。
[0016]进一步地，在一种实现方式中，所述步骤2，包括以下步骤：
[0017]将输入信息，通过多头自注意力模块，得到多头自注意力特征信息
[0018]步骤2
‑
1,将输入信息，通过多头自注意力模块，得到多头自注意力特征信息；
[0019]步骤2
‑
2，进一步地，对所得信息数据用Softmax归一化，做残差连接，具体地公式如下：
[0020][0021]其中x
i
为第i个节点地输出值，J为输出节点个数；
[0022]步骤2
‑
3，通过前馈神经网络，更深地挖掘注意力重点信息，并对结果归一化和残差连接；
[0023]步骤2
‑
4，重复6次步骤2
‑
1至2
‑
3，得到Transformer编码组件最终输出。
[0024]进一步地，在一种实现方式中，所述步骤2
‑
1，包括以下步骤：
[0025]步骤2
‑1‑
1，在上述得到多头自注意力特征图，是将多头注意力(Multi
‑
head Attention)应用于图像信息特征，具体计算公式如下：
[0026]MultiHead(Q，K，V)＝Concat(head1，...，head
h
)w
o
[0027][0028][0029]其中
[0030]进一步地，在一种实现方式中，所述步骤3包括以下步骤：
[0031]步骤3
‑
1，Transformer编码组件输出注意力特征信息成为Transformer解码组件多头注意力中的V，K输入，目标查询信息作为Q的输入，通过多头注意力模块，得到多头自注意力特征信息，对所得信息数据用softmax归一化，做残差连接，再通过前馈神经网络，并对结果归一化和残差连接，得到第一次输出注意力特征信息；
[0032]步骤3
‑
2，重复6次步骤3
‑
1，其中每一次V，K输入都来自Transformer编码组件输出注意力特征信息，Q由每一步骤中上一步骤的输出注意力特征信息，最终得到注意力特征图。
[0033]进一步地，在一种实现方式中，所述步骤4，包括以下步骤：
[0034]步骤4
‑
1，对自注意力特征图做前馈神经网络，利用前馈神经网络预测物体类别和中心坐标、框图高度、宽度，分别输出识别目标类别和目标边框位置。
[0035]本专利技术中，首先，提取图像上的特征，并加入图像位置信息，其次，在经过Transformer编码组件得到注意力特征信息，并将所得到注意力特征信息和目标查询信息输入Transformer解码组件，输出注意力特征图，最后，利用前馈神经网络预测物体类别和中心坐标、框图高度、宽度。
[0036]本专利技术能够用于智慧工地安全帽检测系统，快速有效，方法巧妙，扩展性强，具有良好的应用前景。
附图说明
[0037]图1是本专利技术实施例部分提供的基于Transformer的安全帽识别方法的工作流程示意图；
[0038]图2是本专利技术实施例部分提供的基于Transformer的安全帽识别方法中Transformer编码解码组件的具体操作流程示意图。
具体实施方式
[0039]为使本专利技术的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本专利技术作进一步详细的说明。
[0040]本专利技术实施例公开一种基于Transformer的安全帽识别方法，本方法可应用于智慧工地，如工人安全帽检测，危险区域人员检测等、还可应用于图像分割领域，如城乡建筑分类识别，城乡道路分类规划等。
[0041]如图1和图2所示，一种基于Transformer的安全帽识别方法，首先，提取图像上的特征，并加入图像位置信息，其次，在经过Transformer编码组件得到注意力特征信息，并将所得到注意力特征信息和目标查询信息输入Transformer解码组件，输出注意力特征图，最后，利用前馈神经网络预测物体类别和中心坐标、框图高度、宽度。此方法能够用于智慧工地安全帽检测系统，快速有效，方法巧妙，扩展性强，具有良好的应用前景。
[0042]基于Transformer的安全帽识别方，包括以下步骤：
[0043]步骤1，提取图像上的特征，并加入图像位置信息；
[0044]步骤2，利用Transformer编码组件得到注意力特征信息；
[0045]步骤3，将所得到注意力特征信息和目标查询信息输入Transformer解码组件，输出注意力特征图；
[0046]步骤4，注意力特征本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于Transformer的安全帽识别方法，其特征在于，包括以下步骤：步骤1，提取图像上的特征，并加入图像相关位置信息；步骤2，利用Transformer编码组件得到注意力特征信息；步骤3，将所得到注意力特征信息和目标查询信息输入Transformer解码组件，输出注意力特征图；步骤4，注意力特征图当成输入，利用前馈神经网络预测物体类别和中心坐标、框图高度、宽度。2.根据权利要求1所述的基于Transformer的安全帽识别方法，其特征在于，所述步骤1包括以下步骤：步骤1
‑
1，将图像上的三维信息通过卷积神经网络转换成二维图像信息其中H0为图像高，W0为图像宽，d＝512；步骤1
‑
2，通过正弦函数和余弦函数将位置信息嵌入到图像中，具体的公式如下：2，通过正弦函数和余弦函数将位置信息嵌入到图像中，具体的公式如下：其中，pos表示当前位置，i表示为维度，d
model
为HW。3.根据权利要求1所述的基于Transformer的安全帽识别方法，其特征在于，所述步骤2包括以下步骤：步骤2
‑
1，将输入信息，通过多头自注意力模块，得到多头自注意力特征信息；步骤2
‑
2，进一步地，对所得信息数据用Softmax归一化，再做残差连接和标准化，具体地公式如下：其中x
i
为第i个节点的输出值，j为输出节点个数；步骤2
‑
3，通过前馈神经网络，更深地挖掘注意力重点信息，并对结果归一化和残差连接；步骤2
‑<...

【专利技术属性】
技术研发人员：施文波，徐然，戴华冠，
申请(专利权)人：江苏电力信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人