当前位置: 首页 > 专利查询>大连大学专利>正文

一种基于深度学习预提取RoI的AprilTag检测方法技术

技术编号:41578723 阅读:35 留言:0更新日期:2024-06-06 23:55
一种基于深度学习预提取RoI的AprilTag检测方法,属于计算机视觉定位技术领域,包括如下步骤:S1、对RGB图像进行加权灰度化处理,将其输入单通道YOLOv5网络进行AprilTag预识别;S2、对YOLOv5网络进行如下改进:采用轻量且兼顾识别性能的Ghost Bottleneck和ConvNeXt Block分别替换主干网络Backbone和颈部网络Neck的瓶颈层C3模块,加快了模型推理速度;S3、通过Mosaic进行数据增强,在对数据集图像进行批量剪裁和拼接之前,通过亮度增强扩充数据集,提高了模型的泛化能力;S4、将YOLO识别得到的锚框区域按比例放大作为RoI区域,保证RoI区域内标识轮廓的完整性,提高了计算效率;S5、最后,在不降低原标识图像分辨率的情况下,仅在RoI区域内采用传统AprilTag算法实现对标识的顶点检测和ID解码,实现AprilTag的加速检测。

【技术实现步骤摘要】

本专利技术属于计算机视觉定位,具体涉及一种基于深度学习预提取roi的apriltag检测方法。


技术介绍

1、在当今的自动化与智能化工业应用中,机器视觉系统扮演着至关重要的角色。其中,apriltag作为一种流行的视觉标识,因其鲁棒性、高可靠性和易于使用的特点,被广泛应用于机器人协同定位、增强现实、三维重建等领域。然而,随着应用场景的不断拓展,对apriltag识别速度的要求也日益提高。因此,研究如何优化和加速apriltag的检测过程,已经成为了该领域内一个亟待解决的技术挑战。

2、传统方法一般通过减小识别区域或降采样的方法来加速视觉标识检测。现有文献将视频流划分为关键帧和非关键帧,在关键帧进行全局apriltag标识检测并划分识别框,在非关键帧中仅在各识别框内进行标识检测,并更新识别框位置。类似的,现有文献借助kalman滤波预测下一时刻的识别框位置和尺寸,达到缩小识别范围,提高识别实时性的目的。然而,但上述方法在相机画面中识别目标运动较快或画面模糊、抖动情况下易出现识别框跟踪丢失,从而导致标识漏检。现有文献中通过降采样提高apriltag本文档来自技高网...

【技术保护点】

1.一种基于深度学习预提取RCI的AprilTag检测方法,其特征在于,包括如下步骤:

2.如权利要求1所述的基于深度学习预提取RoI的AprilTag检测方法,其特征在于,所述步骤S2中,YOLOv5网络由输入端Input、主干网络Backbone、颈部网络Neck和预测端Prediction组成,基于改进的YOLOv5s预提取感兴趣区域RoI的AprilTag加速检测过程如下:

3.如权利要求1所述的基于深度学习预提取RoI的AprilTag检测方法,其特征在于,所述步骤S2中,

4.如权利要求1所述的基于深度学习预提取RoI的AprilTag检测...

【技术特征摘要】

1.一种基于深度学习预提取rci的apriltag检测方法,其特征在于,包括如下步骤:

2.如权利要求1所述的基于深度学习预提取roi的apriltag检测方法,其特征在于,所述步骤s2中,yolov5网络由输入端input、主干网络backbone、颈部网络neck和预测端prediction组成,基于改进的yolov5s预提取感兴趣区域roi的apriltag加速检测过程如下:

3.如权利要求1所述的基于深度学习预提取roi的apriltag检测方法,其特征在于,所述步骤s2中,

4.如权利要求1所述的基于深度学习预提取roi的apriltag检测方法,其特征在于,所述步骤s2中,在颈部网络部分,采用改进的卷积模块convnext block替换双向特征金字塔网络中的c3模块,进一步加快yolo网络的推理速度,convnext block引入深度可分离卷积dsc,每个卷积核仅负责输入特征矩阵的一个通道,通过将多个这样的卷积核组合在一起,convnext block采用逆瓶颈层结构,经过dsc提取特征后,先通过1×1的卷积升维,使用gelu激活函数激活,将通道数扩充4倍,再用1×1的卷积降维处理,采用lay...

【专利技术属性】
技术研发人员:王卓刘艳
申请(专利权)人:大连大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1