基于计算机视觉和模糊控制的塔吊吊运安全分析方法技术

技术编号：40422256 阅读：7 留言：0更新日期：2024-02-20 22:41

本发明专利技术公开了一种基于计算机视觉和模糊控制的塔吊吊运安全分析方法，包括感知传输、处理分析、决策预警、图像语义描述、模糊规则控制。该安全分析方法由前端感知传输模块采集吊运场景视觉数据信息，对吊运场景视觉数据信息进行分析处理，对分析处理后的信息进行决策预警并进行信息响应。该方法还预先建立图像训练库存储于数据库服务器中，提供分析处理所需的分析数据，并添加注意力机制和束搜索策略提升图像描述算法的性能；同时，通过模糊推理有效处理了场景语义信息的不确定性，解决了施工场景风险评估难以量化的困难，实现了塔吊吊运场景下的建筑工人安全行为监控与预警的功能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机视觉感知和模糊控制，具体涉及一种基于计算机视觉和模糊控制的塔吊吊运安全分析方法。

技术介绍

1、在施工现场，尤其是在塔吊吊运过程中，由于作业环境的高度复杂性，存在多种安全隐患，成为建筑施工过程中的高风险环节。当前，施工现场的安全管理仍以相对落后的粗放型为主，主要依赖人工巡检和人工目视方式，既消耗大量人力和时间成本，又难以实现良好的管理效果。

2、计算机视觉、人工智能等ict技术的快速发展为解决这一问题提供了新的视角。利用这些先进技术，结合丰富的数据和算法资源，不仅可以提高安全监管的精度，还有助于企业更好地管理和优化资源，从而提高整体施工效率。然而，目前的研究应用大多是单点开发，智能化水平相对较低，现有模型或系统在处理复杂场景时仍显不足，未能满足当前塔吊安全管理的实际需求。

技术实现思路

1、本专利技术的目的是为了解决现有技术中的上述缺陷，提供一种基于计算机视觉和模糊控制的塔吊吊运安全分析方法。

2、本专利技术的目的可以通过采取如下技术方案达到：

3、一种基于计算机视觉和模糊控制的塔吊吊运安全分析方法，所述塔吊吊运安全分析方法包括以下步骤：

4、s1、事先采集包含人、材、机、场布四个元素在内的15个类别目标的大型施工视觉数据，对不同类别目标进行标注，建立语义描述训练库；

5、s2、施工远景摄像头和监控摄像头实时采集吊运现场施工工人作业的视频图像信息；

6、s3、根据施工远景摄像头和监控摄像头采

7、s4、通过led显示屏显示工人作业过程、工人作业过程的语义描述结果；并从语义描述结果中提取语义描述所代表的场景的作业状态风险值和环境状态风险值；

8、s5、对作业状态风险值、环境状态风险值进行模糊化处理和模糊推理，对模糊推理结果进行解模糊化，从而确定待分析的塔吊吊运场景的风险等级，输出安全状态的判定；当出现风险等级超过设定阈值时，音响设备发出报警信息；同时，实时记录作业过程安全状态的信息。

9、进一步地，所述步骤s1过程如下：

10、s1.1、在建筑工地上通过无人机、手持单目摄像机、吊钩可视化设备获取吊运场景图像数据；无人机提供高空俯视视角，手持摄像机负责低空和难以到达区域，吊钩可视化设备用于实时监测吊运过程；这种组合能够解决由于运动模糊和角度受限而引起的数据采集质量问题，确保了全方位、高质量的图像数据采集，为后续数据处理和分析提供了更为可靠的基础。

11、s1.2、对数据进行清洗，删除重复数据、删除模糊数据、删除非目标数据，并对清洗后的数据进行编号；避免数据集中存在重复、模糊和非目标数据，对模型训练和性能产生负面影响，同时为清洗后的数据集进行编号，确保数据唯一性，为数据集建立了清晰的标识。

12、s1.3、利用labelimg等软件对视觉数据进行标注，创建json格式的语义描述数据集，建立语义描述训练库。此标注过程需要确保标注的效率和准确性，为训练库的建立提供了高质量的、带有语义信息的数据。通过有效的标注，模型能够更好地理解图像内容，提升了后续语义描述任务的性能。

13、进一步地，所述步骤s3过程如下：

14、s3.1、使用faster r-cnn物体检测模型对输入图像进行检测，输出使用非极大值抑制，并在其中筛选置信度大于0.3的目标，目标的空间位置对应在resnet-101最后一层卷积层的特征图。

15、s3.2、将resnet-101最后一层卷积层的特征图进行平均池化处理，生成图像全局特征向量，图像中目标对应的图像特征向量作为空间注意力机制模型的输入；

16、s3.3、空间注意力机制模型根据输入的空间特征向量{v1，v2，...，vn}和解码器中lstm网络上一时刻的隐藏状态ht-1来计算出每个空间位置的注意力分数，并通过softmax函数进行归一化生成权重当前时刻选取的特征向量和名称属性向量的权重αij；

17、eij＝fatt(vj，ht-1) (1)

18、

19、式中，eij为注意力分数，fatt()为注意力分数的计算函数，vj为第j个目标对应的特征向量，ht-1为lstm网络上一时刻的隐藏状态，αij为归一化的注意力权重，n为目标数量。

20、通过引入注意力机制，模型能够在序列建模任务中动态关注不同空间位置，提高对关键信息的感知能力，减少冗余信息的干扰，以及适应不同目标的特征权重，从而优化模型性能。

21、s3.4、依据当前权重当前时刻选取的特征向量的权重αij得出当前时刻的视觉上下文信息zt；

22、

23、式中，zt为视觉上下文信息，n为目标数量，vj为第j个目标对应的特征向量，n为目标数量。

24、s3.5、将图像全局特征v分别通过两个独立的多层感知机计算得到lstm网络的细胞单元状态和隐藏状态的初始值。

25、c0＝finit，c(v) (4)

26、h0＝finit，h(v) (5)

27、式中，c0为初始细胞单元状态，h0为初始隐藏状态，v为图像全局特征，finit，c和finit，h分别表示两个独立的多层感知机，用于处理图像全局特征v。

28、s3.7、将前一时刻的输出yt-1、前一时刻的隐藏状态ht-1和视觉上下文信息zi输入作为解码器lstm的输入，可以计算得到当前时刻的隐藏状态ht。

29、ht＝lstm(yt-1，ht-1，zt) (6)

30、式中，hi为当前时刻的隐藏状态，yi-1为前一时刻的输出，hi-1为前一时刻的隐藏状态，zt为当前时刻视觉上下文信息。

31、s3.8、由当前时刻的隐藏状态、视觉上下文信息以及前一时刻的输出通过softmax函数可以得到当前输出的单词的概率分布。

32、p(yt|ht，zt，yt-1；e)＝softmax(e·[ht，zti，yt-1]) (7)

33、式中，p()为当前输出的单词yt的概率分布，yt为当前时刻的输出，ht为隐藏状态，zt为视觉上下文信息，yt-1为前一时刻的输出，e是随机初始化的学习参数，代表线性层的权重矩阵，softmax()为对向量进行归一化，将其转换为概率分布。

34、s3.9、在得到输出的每个单词的得分后，使用束搜索策略优化改进每个时间步的单词选取过程，并最终输出图像的语义描述结果。

35、

36、式中，为当前时刻的最优输出序列，argmaxyt为在所有备选序列中选择使得总得分最高的输出，b是束搜索的宽度，表示考虑的备选序列数量，为当前时刻的输出，ht为隐藏状态，zt为视觉上下文信息，yt-1为前一时刻的输出，e是随机初始化的学习参数，代表线性层的权重矩阵。本文档来自技高网...

【技术保护点】

1.一种基于计算机视觉和模糊控制的塔吊吊运安全分析方法，其特征在于，所述塔吊吊运安全分析方法包括以下步骤：

2.根据权利要求1所述的基于计算机视觉和模糊控制的塔吊吊运安全分析方法，其特征在于，所述步骤S1过程如下：

3.根据权利要求1所述的基于计算机视觉和模糊控制的塔吊吊运安全分析方法，其特征在于，所述步骤S3过程如下：

4.根据权利要求3所述的基于计算机视觉和模糊控制的塔吊吊运安全分析方法，其特征在于，Faster R-CNN物体检测模型提供检测空间注意力，目标的名称属性通过目标对应的图像特征信息推断得到，目标对应的图像特征包含目标名称属性信息。

5.根据权利要求1所述的基于计算机视觉和模糊控制的塔吊吊运安全分析方法，其特征在于，所述步骤S4过程如下：

6.根据权利要求5所述的基于计算机视觉和模糊控制的塔吊吊运安全分析方法，其特征在于，所述步骤S5过程如下：

【技术特征摘要】

1.一种基于计算机视觉和模糊控制的塔吊吊运安全分析方法，其特征在于，所述塔吊吊运安全分析方法包括以下步骤：

2.根据权利要求1所述的基于计算机视觉和模糊控制的塔吊吊运安全分析方法，其特征在于，所述步骤s1过程如下：

3.根据权利要求1所述的基于计算机视觉和模糊控制的塔吊吊运安全分析方法，其特征在于，所述步骤s3过程如下：

4.根据权利要求3所述的基于计算机视觉和模糊控制的塔吊吊...

【专利技术属性】
技术研发人员：邓晖，余炳霖，邓逸川，张恒运，段锐，付柯捷，朱桓宇，蔡峤峰，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人