一种基于单步多框目标检测(SSD)算法的物体识别方法技术

技术编号：45814521 阅读：6 留言：0更新日期：2025-07-15 22:27

本发明专利技术涉及一种基于单步多框目标检测(SSD)算法的物体识别方法。该方法在教师模型SSD中引入混合注意力机制并采用MoblieNet v3为学生模型，使SSD动态调整资源分配到更重要的目标区域，有效提升建筑工地复杂施工场景中对小目标的识别精读，同时引入知识蒸馏实现模型的轻量化，提高SSD模型的训练速度。本方法有效解决了施工场景中目标识别不准确、SSD数据集训练速度较慢的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种基于深度学习的物体识别，具体说是一种在教师模型ssd中引入混合注意力机制并采用moblienet v3为学生模型的图像识别方法。

技术介绍

1、随着城市建设脚步的加快,新增建筑工地项目多,施工周期长,导致同一时间在建项目日益增多,对建筑工地施工状态的监管变得尤为重要。目前,主要以人工线上看视频、线下巡逻两种方式对项目违规施工状态进行监管,两种监管方式耗费大量人力物力,且工作效率较低。

2、随着科研人员对深度学习概念的不断探索与研究,以及基于深度学习图像识别技术的不断成熟,科研人员已经将识别技术运用到建筑工地施工状态监管。现有技术中，可以采用卷积神经网络的vgg模型,通过数字图像处理技术将建筑工地现场采集的图像进行样本数据增强及图像平滑预处理，通过目标检测算法和迁移学习方法提升安全带、安全帽佩戴的识别速度，提高建筑工地施工状态监管人员的工作效率,同时也有效增加了识别的准确程度。然而，现有技术中ssd对所有区域的关注程度相同，无法动态调整资源分配到更重要的目标区域，复杂施工场景中的目标在被遮挡、光照不均衡、目标...

【技术保护点】

1.一种基于单步多框目标检测(SSD)算法的物体识别方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的识别方法，其特征在于：所述步骤2.1中，输入预处理是将输入图像统一缩放到固定尺寸300*300，对像素质进行标准化处理。

3.根据权利要求1所述的识别方法，其特征在于：所述步骤2.2.3中，混合注意力机制(CBAM)模块由通道注意力机制模块(CAM)和空间注意力机制模块(SAM)两个模块以串行方式结合，具体工作流程如下：1)计算通道注意力，生成通道权重；2)计算空间注意力，生成空间权重；3)对特征图进行加权；使用self.cbam1＝CBAM(512)、s...

【技术特征摘要】

1.一种基于单步多框目标检测(ssd)算法的物体识别方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的识别方法，其特征在于：所述步骤2.1中，输入预处理是将输入图像统一缩放到固定尺寸300*300，对像素质进行标准化处理。

3.根据权利要求1所述的识别方法，其特征在于：所述步骤2.2.3中，混合注意力机制(cbam)模块由通道注意力机制模块(cam)和空间注意力机制模块(sam)两个模块以串行方式结合，具体工作流程如下：1)计...

【专利技术属性】
技术研发人员：王柯璇，成德烜，胡景祺，
申请(专利权)人：华北电力大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人