当前位置: 首页 > 专利查询>南通大学专利>正文

基于改进YOLOv11的视障群体引导马甲系统的障碍物检测方法技术方案

技术编号:44584792 阅读:33 留言:0更新日期:2025-03-14 12:45
本发明专利技术公开了一种基于改进YOLOv11的视障群体引导马甲系统的障碍物检测方法,包括:一、获取障碍物数据集,并完成数据集标注工作;二、将YOLOv11的主干网络替换成ShuffleNetV2;三、重设计一种轻量化检测头,方便后续的部署;四、利用数据集,完成改进YOLOv11模型的训练;五、将改进YOLOv11检测模型部署到用于感知的嵌入式硬件设备中;六、进行模型推理,实现马甲上摄像头的实时障碍物检测。本发明专利技术能够保证马甲上对障碍物检测实时性和精确性,为其实现引导视障群体避障决策提供了可靠依据,保障了视障群体的出行安全。

【技术实现步骤摘要】

本专利技术属于视觉目标检测领域,尤其涉及一种基于改进yolov11的视障群体引导马甲系统的障碍物检测方法。


技术介绍

1、视力是人类最重要的五种感官之一,作为社会中的弱势群体,由于视觉的缺陷,视障群体的生活质量和生活体验都与普通人存在巨大差异,出行安全也一直得不到保障。人工智能技术的迅速发展,为保障视障群体出行安全提供全新的解决思路。在实际生活场景中,视障群体行进路线上的障碍物检测对于确保视障群体出行的安全性至关重要。然而,目前的目标检测技术受到诸多因素的影响,如光照和遮挡等,导致检测精度不高,这成为亟待解决的问题。

2、随着深度学习技术的不断成熟,研究人员开始将其应用于目标检测领域,这为技术的进步带来了革命性的变革。卷积神经网络的出现能够有效地提取图像特征,避免了传统手工特征提取方法的局限性。而令人振奋的是,卷积神经网络将特征提取和目标分类融为一体,显著提升了检测的准确性和速度。然而,目前基于卷积神经网络的目标检测模型在实时性和准确率方面仍存在一定的不足,需要进一步改进和优化。


技术实现思路b>

1本文档来自技高网...

【技术保护点】

1.一种基于改进YOLOv11的视障群体引导马甲系统的障碍物检测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于改进YOLOv11的视障群体引导马甲系统的障碍物检测方法,其特征在于,所述步骤一中的障碍物数据集,分为训练集、测试集和验证集;训练集用于模型训练,优化网络参数;测试集用于训练过程中进行模型测试,比较训练效果;验证集用于训练完成后进行模型验证,验证模型的有效性和泛化性;每个所述障碍物数据集都包含图片和标签,标签中包含图片上每一个目标物的类别和位置信息,其中位置信息为标注框的中心点坐标和标注框的宽、高。

3.根据权利要求1所述的基于改进YOLO...

【技术特征摘要】

1.一种基于改进yolov11的视障群体引导马甲系统的障碍物检测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于改进yolov11的视障群体引导马甲系统的障碍物检测方法,其特征在于,所述步骤一中的障碍物数据集,分为训练集、测试集和验证集;训练集用于模型训练,优化网络参数;测试集用于训练过程中进行模型测试,比较训练效果;验证集用于训练完成后进行模型验证,验证模型的有效性和泛化性;每个所述障碍物数据集都包含图片和标签,标签中包含图片上每一个目标物的类别和位置信息,其中位置信息为标注框的中心点坐标和标注框的宽、高。

3.根据权利要求1所述的基于改进yolov11的视障群体引导马甲系统的障碍物检测方法,其特征在于,所述步骤二中的yolov11目标检测算法是基于深度学习的一阶段目标检测算法,其网络结构包含输入端、主干网络backbone、颈部网络neck、检测头head;所述的输入端执行数据预处理和数据增强的任务,为模型提供高质量的输入数据,在输入端,yolov11会对原始图像进行一系列预处理操作,包括图像缩放、归一化;使模型能够学习图像特征,为提高模型的泛化能力,yolov11在输入端采用数据增强技术;

4.根据权利要求3所述的基于改进yolov11的视障群体引导马甲系统的障碍物检测方法,其特征在于,所述数据增强技术包括mosaic数据增强和自适应锚框计算;所述mosaic数据增强通过将四张图片进行随机缩放、随机裁剪和随机排布的方式进行拼接,丰富检测物体的背景和小目标;在输入端,yolov11采用自适应锚框计算技术;锚框是预先定义的一组固定大小和比例的矩形框,用于在目标检测任务中预测物体的位置,自适应锚框计算技术根据输入图像中的物体大小和比例自动调整锚框的大小和比例,提高物体检测的准确。

5.根据权利要求3所述的基于改进yolov11的视障群体引导马甲系统的障碍物检测方法,其特征在于,所述主干网络backbone的作用是特征提取,它是一个卷积神经网络,yolov11的主干网络采用cspnet结构,主要包括cbl结构、csp结构和sppf结构;cbl结构由卷积层、bn层和激活函数组成,简化模型结构,提高模型推理的速度;csp结构由3个cbl结构和多个带有shortcut结构的bottleneck模块组成,降低显存的使用并加快正向推断时期的推理速度,同时解决训练阶段梯度数据消失和爆炸的问题并增强卷积提取图片特征信息能力;csp结构所获取的丰富特征信息被进一步输入到s...

【专利技术属性】
技术研发人员:理锦诚董丹杨李正鹏于玮
申请(专利权)人:南通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1