【技术实现步骤摘要】
基于改进的YOLO模型的视障人士辅助障碍物感知方法
[0001]本专利技术涉及导盲领域,尤其涉及一种基于改进的YOLO模型的视障人士辅助障碍物感知方法。
技术介绍
[0002]中国是世界盲人最多的国家,约有1200万,占全世界盲人口的18%,作为社会群体中的特殊人群,他们终生生活在无边的黑暗中,因此常常会遇到各种难题,目前市场上的一些导盲产品大多结构简单而功能单一(只能简单提示前方有障碍物),虽然有些产品使用方便,但辅助效果并不明显,而且,盲人朋友在使用时会碰到诸多问题,比如路况不好,坑洼不平,前方有悬挂的障碍物等等,普通的导盲产品无法准确的探明。现有导盲产品的障碍物探测功能,仅仅局限于对障碍物的距离进行探测,不能对障碍物所在方位进行精确定位,并且只能对单一障碍物进行探测,如在多运动障碍物的探测中,仅仅能够探测到离使用者距离最近的障碍物,因此使得产品的导盲功能实用性大幅度降低。
[0003]关于智能导盲设备如导盲眼镜,在国际和国内都有团队和公司进行过研究,但由于性能以及使用体验不理想等原因始终停留在性能检测与小批量试 ...
【技术保护点】
【技术特征摘要】
1.一种基于改进的YOLO模型的视障人士辅助障碍物感知方法,其特征在于,包括以下步骤:步骤一:建立YOLOV3算法框架采用Darknet
‑
YOLOv3为框架,YOLOV3算法基于GoogleNet的卷积神经网络,采用Darknet
‑
53作为特征提取主干网络;YOLOV3算法为全卷积网络,其在Darknet
‑
53结构中多次采用跳层残差模块,并利用卷积的步长移动实现下采样操作,避免直接使用池化运算而导致梯度爆炸的现象,并且YOLOV3算法运用特征金字塔网络FPN中的特征图上采样思想进行特征融合,从而提高对小目标检测的精度;YOLOV3算法在进行目标检测时,先通过特征提取网络Darknet
‑
53对输入图像进行特征提取,得到不同尺度的3个特征图层,每个特征图层中每个cell对应原图中一个小方块,假设被检测物体的中心坐标位于哪个小方块,则该方块就用来预测物体;步骤二:数据增广处理在数据读取层与特征提取层之间增加数据增广层,不仅包括对数据采用旋转、拉伸进行几何变换方式增广数据外,还融合了MSRCR算法进行数据增强,使系统适应光照条件较差的检测任务,以提高模型框架的泛化性;步骤三:预训练采用预训练再微调的方式重新训练分类器,使网络适应不同光照环境下的检测任务,采用在VOC2007和VOC2012混合的数据集上进行预训练,再融合自制的数据集,在不同光照环境的障碍物数据上微调模型;步骤四:多尺度训练采用多尺度训练的方式,随机调整输入数据的尺寸,增强模型的健壮性,将训练数据输入网络,经图像预处理后,分别使用32、64个3*3大小的卷积核进行滤波,执行下采样处理,得到240*240大小的特征图,然后在卷积单元中交替插入1*1、3*3大小卷积核组成的残差块,由5组残差块分别计算出分辨率为240*240、120*120、60*60、30*30、15*15的特征图;所有的卷积单元由卷积层、BN层、池化层组成,以便加快模型收敛,降低模型参数;步骤五:改进YOLOv3的网络结构在主干网络中添加卷积层,在保证效率的同时提升精度,以增加在使用场景的实用性和准确性;步骤六:基于TensorRT进行推理加速采用低精度参数的方式来进行相关计算和加速模型推理,采用TensorRT降低检测模型的推理时长;步骤七:添加注意力机制模块在尺度为26*26输出部分添加了加了一个注意力机制模块,对信息进行refine,从而优化学习到的内容,并且加强了对于小目标的检测能力,添加4层卷积层qie融入注意力机制模块后的网络为SE
‑
YOLOv3;步骤八:利用GIOU Loss作为目标框坐标回归的损失度量标准GIOU Loss为距离度量标准,其值的计算如下所示,其中A
c
为两目标框的最小闭包区域面积,U为两目标框的相交面积
GIOU Loss的计算如下所示:L
GIOU
=1
‑
GIOUSoft
‑
NMS以一个权重的形式,来获得IOU取高斯指数后乘上原得分,之后重新排序,继续循环;在Darknet
‑
YOLOv3中,骨干网络共有31个卷积层,该网络结构包含1
×
,2
×
残差块的6组网络,相对于原YOLOv3中1
×
,2
×
,8
×
,8
×
,4
×
残差块的5组网络,参数数量减少6...
【专利技术属性】
技术研发人员:刘宇红,李伟斌,付建伟,张荣芬,胡国军,
申请(专利权)人:杭州易享优智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。