一种建筑施工场景下的多目标实时检测算法制造技术

技术编号:37984143 阅读:23 留言:0更新日期:2023-06-30 09:59
本发明专利技术公开了一种建筑施工场景下的多目标实时检测算法,具体包括如下步骤:步骤1,数据采集以及数据增强;步骤2,特征提取模块;步骤3,区域建议网络;步骤4,RoI Align层;步骤5,全连接层;采用本发明专利技术的检测方法,通过实验测试表明,可以有效的识别建筑工地场景下的施工常见目标,如工人、水管、振捣棒、搅拌车、水桶、铁锹、布料机等;良好的检测效果可以为工程质量监管、施工违规检测等任务提供坚实的基础;同时,该发明专利技术提出的算法也为目标检测领域提升检测效果提供了一种选择。检测效果提供了一种选择。检测效果提供了一种选择。

【技术实现步骤摘要】
一种建筑施工场景下的多目标实时检测算法


[0001]本专利技术涉及计算机视觉及人工智能
,具体涉及一种建筑施工场景下的多目标实时检测算法。

技术介绍

[0002]目标检测是计算机视觉领域中的一个重要研究方向,也是其他复杂视觉任务的基础,作为图像理解和计算机视觉的基石,目标检测旨在使得计算机能够自动地识别图像中特定类别物体,它是解决目标分割、场景理解、目标跟踪、图像描述和行为检测等更高层次视觉任务的基础;
[0003]混凝土施工现场的目标检测是智慧工地建设、智能监管、绿色建造、智慧施工的基础,近年来,目标检测领域引起了越来越多研究者的注意,在检测速度和检测精度上都有了巨大的提升;但是,由于建筑施工现场环境复杂、干扰信息较多、目标较小、待检测目标遮挡严重等现实情况,导致现有目标检测算法在施工场景下的检测效果不如人意;尽管可以通过提高采集数据的图像质量来提升检测效果,但是该方法硬件成本较高且运算量大,难以应用到实际施工现场。

技术实现思路

[0004]本专利技术的目的是提供一种建筑施工场景下的多目标实时检测算法,解决了现本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种建筑施工场景下的多目标实时检测算法,其特征在于,具体按以下步骤实施:步骤1,对现场进行数据采集以及数据增强;步骤2,将经步骤1处理后的数据进行特征提取;步骤3,将经步骤2提取的特征图输入到区域建议网络以得到图像中待检测目标的可能定位;步骤4,将经步骤3得到的数据通过RoI Align层进行处理;步骤5,将经步骤4处理后的数据输入全连接层,结束。2.根据权利要求1所述的一种建筑施工场景下的多目标实时检测算法,其特征在于,所述步骤1具体按以下步骤实施:步骤1.1,通过建筑工地现场摄像头实时采集施工现场数据;步骤1.2,对数据进行数据增强:步骤1.2.1,尺度匹配,根据不同目标尺寸进行裁剪,缩小不同大小目标之间的差距;步骤1.2.2,对目标过采样,通过在图像上多次复制粘贴目标的方式来增加目标的训练样本数目;步骤1.2.3,将图像中的大尺寸目标转换为中等尺寸目标,中等尺寸目标转换为小尺寸目标,对图像进行翻转、裁剪操作以增强模型的鲁棒性。3.根据权利要求1所述的一种建筑施工场景下的多目标实时检测算法,其特征在于,所述步骤2具体为图像特征提取模块采用MobileNetv2作为特征提取的主干网络。4.根据权利要求3所述的一种建筑施工场景下的多目标实时检测算法,其特征在于,所述步骤2具体按以下步骤实施:步骤2.1,先将图像输入到一个1x1的卷积层进行升维处理,卷积后使用BN和ReLU6激活函数;步骤2.2,再将得到的向量输入一个3x3的DW卷积,卷积后使用BN和ReLU6激活函数;步骤2.3,将得到的向量在输入一个1x1的卷积,进行降维,卷积依旧使用BN和ReLU6激活函数。5.根据权利要求1所述的一种建筑施工场景下的多目标实时检测算法,其特征在于,所述步骤3具体按以下步骤实施:步骤3.1,将MobileNetv2提取到的特征图经过一个3x3的卷积,再分别经过两个1x1的卷积,最终得到两个预测分数和四个预测坐标;步骤3.2,根据预测坐标,映射预测相应的候选建议框,...

【专利技术属性】
技术研发人员:宋霄罡张冬冬张鹏飞宁靖宇唐俊杰庞欣超崔永新黑新宏
申请(专利权)人:西安理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1