【技术实现步骤摘要】
一种基于YOLOv3的视频目标检测方法
本专利技术涉及一种基于YOLOv3的视频目标检测方法,属于目标检测和计算机视觉
技术介绍
视频目标检测技术是智能化视频分析的基础。目前几种常用的视频目标检测方法简介如下:背景减除、时间差分、光流。背景减除(BackgroundSubtraction)方法是目前运动检测中最常用的一种方法,它是利用当前图像与背景图像的差分来检测出运动目标的一种技术。它一般能够提供相对来说比较全面的运动目标的特征数据,但对于动态场景的变化,如光线照射情况和外来无关事件的干扰等也特别敏感。实际上,背景的建模是背景减除方法的技术关键。最简单的背景模型是时间平均图像,即利用同一场景在一个时段的平均图像作为该场景的背景模型。由于该模型是固定的,一旦建立之后,对于该场景图像所发生的任何变化都比较敏感,比如阳光照射方向,影子,树叶随风摇动等。大部分的研究人员目前都致力于开发更加实用的背景模型,以期减少动态场景变化对于运动目标检测效果的影响。时间差分(TemporalDifference又称相邻帧差)方法充分利用了视频图像的特征,从连续得到的视频流中 ...
【技术保护点】
1.一种基于YOLOv3的视频目标检测方法,其特征在于:Step1:定义视频视觉任务;Step2:通过特征网络对输入图像提取特征,得到一定尺寸的特征图;Step3:通过groundtruth中的物体中心坐标在那个网络单元中,接着由该网络单元来预测该物体;Step4、利用边界框中和groundtruth的IOU最大的边界框来预测该物体。
【技术特征摘要】
1.一种基于YOLOv3的视频目标检测方法,其特征在于:Step1:定义视频视觉任务;Step2:通过特征网络对输入图像提取特征,得到一定尺寸的特征图;Step3:通过groundtruth中的物体中心坐标在那个网络单元中,接着由该网络单元来预测该物体;Step4、利用边界框中和groundtruth的IOU最大的边界框来预测该物体。2.根据权利要求1所述的基于YOLOv3的视频目标检测方法,其特征在于:所述步骤step2中图像采用448*448,特征网络采用Darknet-53架构,Darknet-53包含卷积层,池化层,Softmax层,采用全卷积,引入residul结构,采用Softmax分类器做训练,学习率0.001,批量大小为64,为采用批量标准化对权重参数和偏置参数进行迭代训练,设置权重衰减速率weight_decay默认为0...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。