【技术实现步骤摘要】
本专利技术属于计算机视觉定位,具体涉及一种基于深度学习预提取roi的apriltag检测方法。
技术介绍
1、在当今的自动化与智能化工业应用中,机器视觉系统扮演着至关重要的角色。其中,apriltag作为一种流行的视觉标识,因其鲁棒性、高可靠性和易于使用的特点,被广泛应用于机器人协同定位、增强现实、三维重建等领域。然而,随着应用场景的不断拓展,对apriltag识别速度的要求也日益提高。因此,研究如何优化和加速apriltag的检测过程,已经成为了该领域内一个亟待解决的技术挑战。
2、传统方法一般通过减小识别区域或降采样的方法来加速视觉标识检测。现有文献将视频流划分为关键帧和非关键帧,在关键帧进行全局apriltag标识检测并划分识别框,在非关键帧中仅在各识别框内进行标识检测,并更新识别框位置。类似的,现有文献借助kalman滤波预测下一时刻的识别框位置和尺寸,达到缩小识别范围,提高识别实时性的目的。然而,但上述方法在相机画面中识别目标运动较快或画面模糊、抖动情况下易出现识别框跟踪丢失,从而导致标识漏检。现有文献中通过降采样
...【技术保护点】
1.一种基于深度学习预提取RCI的AprilTag检测方法,其特征在于,包括如下步骤:
2.如权利要求1所述的基于深度学习预提取RoI的AprilTag检测方法,其特征在于,所述步骤S2中,YOLOv5网络由输入端Input、主干网络Backbone、颈部网络Neck和预测端Prediction组成,基于改进的YOLOv5s预提取感兴趣区域RoI的AprilTag加速检测过程如下:
3.如权利要求1所述的基于深度学习预提取RoI的AprilTag检测方法,其特征在于,所述步骤S2中,
4.如权利要求1所述的基于深度学习预提取RoI的
...【技术特征摘要】
1.一种基于深度学习预提取rci的apriltag检测方法,其特征在于,包括如下步骤:
2.如权利要求1所述的基于深度学习预提取roi的apriltag检测方法,其特征在于,所述步骤s2中,yolov5网络由输入端input、主干网络backbone、颈部网络neck和预测端prediction组成,基于改进的yolov5s预提取感兴趣区域roi的apriltag加速检测过程如下:
3.如权利要求1所述的基于深度学习预提取roi的apriltag检测方法,其特征在于,所述步骤s2中,
4.如权利要求1所述的基于深度学习预提取roi的apriltag检测方法,其特征在于,所述步骤s2中,在颈部网络部分,采用改进的卷积模块convnext block替换双向特征金字塔网络中的c3模块,进一步加快yolo网络的推理速度,convnext block引入深度可分离卷积dsc,每个卷积核仅负责输入特征矩阵的一个通道,通过将多个这样的卷积核组合在一起,convnext block采用逆瓶颈层结构,经过dsc提取特征后,先通过1×1的卷积升维,使用gelu激活函数激活,将通道数扩充4倍,再用1×1的卷积降维处理,采用lay...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。