【技术实现步骤摘要】
基于改进YOLOv3网络的野外山林环境目标检测方法
[0001]本专利技术属于计算机视觉与机器学习
,具体涉及一种基于改进YOLOv3网络的野外山林环境目标检测方法。
技术介绍
[0002]随着科技发展,目标检测技术目前已经成为计算机视觉领域的一个热门方向与研究重点。目标检测技术在各种实际场景下得以应用,例如无人驾驶、无人机监控、场景识别等领域,但是野外山林环境中的目标检测算法仍存在诸多问题。由于野外山林环境具有很高的复杂性,存在着光照变化剧烈、气候变化无常、目标与非目标之间遮挡严重等情况,使得目标检测等基于视觉的任务难度增加,而且出于实际需求,检测速度也必须要满足实时性。
[0003]传统的目标检测算法主要依靠实际物体的表观特征。对于纹理丰富的目标,人工设计特征描述子,如SIFT、PCA
‑
SIFT、SURF等,从图像上提取到表征性强的特征点,进而进行匹配检测。而对于纹理较少甚至无纹理的目标,模板匹配的方式则是首选的解决方法。模板匹配的核心问题是设计合理、普适的距离度量方式。然而,上述两种方 ...
【技术保护点】
【技术特征摘要】
1.基于改进YOLOv3网络的野外山林环境目标检测方法,其特征在于,包括以下步骤:步骤一、获取野外山林背景图片以及前景对象,预设检测目标种类为人和车辆;步骤二、通过图像预处理将背景与前景叠加,生成数据集,并获取前景对象的包围框与类别数据,生成与PASCALVOC2012数据集相同格式的xml文件,即得到训练集、验证集和测试集;步骤三、基于YOLOv3网络模型,在不同尺度的特征提取层之后添加空间变换层STL,以不同尺度的特征图作为输入,训练得到不同的仿射变换结果,再对STL层的输出特征,进行后续的分类和包围框回归操作;步骤四、在网络最后添加de
‑
STL变换层,使得最终计算结果与仿射变换之前的以feature map为坐标系的真值包围框的编码结果相匹配,得到与原图坐标系对应的x和y,再计算损失;步骤五、利用步骤二所得的训练集、验证集和测试集对步骤四所得到的改进后的YOLOv3网络进行训练,得到性能最优模型。2.如权利要求1所述的基于改进YOLOv3网络的野外山林环境目标检测方法,其特征在于,步骤一具体包括以下过程:利用python3+BeautifulSoup+requests+lxml在互联网上分别爬取forest、valley、plain、wetland四个关键字的图片,数量分别为700、600、600、600,人工剔除其中不合适的图片;选取COCO2014数据集中的人和车的数据作为前景对象,因为其包含的目标更加日常化,形变、遮挡情况较多,通过在背景图中随机插入前景对象来构建野外山林环境数据集。3.如权利要求1所述的基于改进YOLOv3网络的野外山林环境目标检测方法,其特征在于,步骤三具体包括以下过程:基于注意力机制的STL层的设计重点在于localization net,使其对于输入的特征图,输出6个参数来对原来的特征图进行仿射变换,以此来应对目标存在的旋转及尺度变化所导致的检测精度下降的问题;所以将STL嵌入到darknet
‑
53的conv26,conv43和conv52特征图之后,既保证了通过STL层后,信息丢失量较小,又保证了对旋转变化的敏感性,之后再对输出结果进行分类和回归等损失计算。4.如权利要求1所述的基于改进YOLOv3网络的野外山林环境目标检测方法,其特征在于,步骤四具体包括以下过程:de
‑
STL层嵌入到图像目标位置卷积层之后,为的是方便计算location的损失;其中location的损失为:其中,λ
coord
【专利技术属性】
技术研发人员:彭志红,蒋卓,陈杰,奚乐乐,王星博,
申请(专利权)人:北京理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。