一种针对视频目标检测的在线学习方法技术

技术编号：27445347 阅读：38 留言：0更新日期：2021-02-25 04:08

本发明专利技术公开了一种针对视频目标检测的在线学习方法，属于机器视觉领域。包括模型预训练、目标检测、跟踪修正、标注修正、关键帧提取和模型迭代更新。先利用开源或自标注数据集训练一个基础版本的当前模型；利用当前模型对视频序列进行预检测；利用改进的KCF跟踪算法和基于特征空间的k近邻算法对预检测结果分别进行方框修正和标注修正；利用基于特征空间相似度度量的关键帧提取方法，提取视频关键帧，去除重复图像；利用关键帧数据和修正检测结果对模型进行训练，实现模型的迭代更新。本发明专利技术该方法通过跟踪算法和聚类分析对检测和标注结果进行修正，利用修正后的结果重新训练目标检测模型，实现模型性能的不断改进，实现应用场景的自适应。景的自适应。景的自适应。

全部详细技术资料下载

【技术实现步骤摘要】
一种针对视频目标检测的在线学习方法

[0001]本专利技术属于深度学习、机器视觉领域，尤其涉及的是一种针对视频目标检测的在线学习方法。

技术介绍

[0002]目标检测即找出图像中所感兴趣的物体，包含物体定位和物体分类两个子任务，是机器视觉领域的基本任务之一，在智能交通、智能制造、安防监控、自动驾驶等领域有着广泛的应用。随着深度学习的发展，目标检测算法也逐步从基于手工特征的传统算法转向基于神经网络的深度学习算法。目前目标检测的研究主要侧重两个方向：基于图像的目标检测和基于视频的目标检测。
[0003]基于图像的目标检测算法首先被提出，分为one-stage和two-stage两类方法。Two-stage方法沿用传统的目标检测流程，包含候选区域选取、特征提取和分类/回归等三部分。其中比较经典的算法是Region-based CNN（R-CNN）系列网络，经历了由R-CNN到Fast R-CNN到Faster R-CNN的不断改进。One-stage算法简化了two-stage的步骤，将目标检测问题转换为分类和回归问题，引入一个统一的框架，直接将输入图片像素映射为目标方框和目标类别，速度大大提升，比较经典的有Single Shot MultiBox Detector（SSD）和You Only Look Once（YOLO）系列。
[0004]对于视频数据来说，尽管视频也可以被分解为一帧一帧的图像，借助图像目标检测算法进行检测，但是视频中还包含了时序上下文关系，例如目标在相邻视频帧中位置的连续性等，如果能充...

【技术保护点】

【技术特征摘要】
1.一种针对视频目标检测的在线学习方法，其特征在于：该方法包括模型预训练、目标检测、跟踪修正、标注修正、关键帧提取和模型迭代更新，该方法具体包括如下步骤：步骤1：利用开源或自标注数据集训练一个基础版本的改进YOLOv3目标检测模型，作为当前模型；步骤2：利用当前模型对视频序列进行预检测，获取初始检测方框和目标类别；步骤3：利用改进的KCF跟踪算法和基于特征空间的k近邻算法对预检测结果分别进行方框修正和标注修正；步骤4：利用基于特征空间相似度度量的关键帧提取方法，提取视频关键帧，以压缩数据集大小，去除重复图像；步骤5：利用关键帧数据和修正检测结果对模型进行训练，实现模型的迭代更新；步骤6：回到步骤2，重复以上操作。2.根据权利要求1所述的一种针对视频目标检测的在线学习方法，其特征在于：步骤1所述的改进的YOLOv3模型采用全尺度网络OSNet作为特征提取网络，特征金字塔中的上采样方法采用逆卷积神经网络实现，BBox的回归损失函数用GIOU替代MSE，anchors大小的选择仍采用聚类算法，得到9个聚类中心，形成改进的YOLOv3模型。3.根据权利要求1所述的一种针对视频目标检测的在线学习方法，其特征在于：步骤3所述跟踪修正方法是：引入了帧间差分估计运动目标概率，首先利用跟踪算法对检测目标进行跟踪，判断目标是否静止，如果目标运动，则利用帧间差分获取方框目标概率，如果小于给定阈值，则认为跟踪失败，停止跟踪，利用跟踪结果进一步修正检测结果，即将跟踪到而未检测到的目标作为漏检目标添加到检测目标列表中。4.根据权利要求1所述的一种针对视频目标检测的在线学习方法，其特征在于：步骤3所述标注修正方法是，利用神经网络获取检测目标的特征，通过k近邻算法对目标标注进行投票更新，修正检测结果标注。5.根据权利要求1所述的一种针对视频目标检测的在线学习方法，其特征在于：步骤4所述的关键帧提取方法是：利用目标检测网络特征提取层的输出作为图像特征，计算图像之间的距离来衡量图像的相似度，选取相似度的局部极大值作为视频关键帧。6.根据权利要求1－5中任何一项所述的一种针对视频目标检测的在线学习方法，其特征在于：步骤1所述的模型训练的工作步骤包括：步骤1.1：收集开源数据集，或采集特定场景下的视频数据，人工标注检测目标位置方框和目标类别，建立数据集；步骤1.2：对数据集进行旋转、平移、缩放和镜像变换、添加随机白噪音、亮度、色度和饱和度变化，扩充数据集，同时将数据集随机分为训练集、验证集和测试集，其比例为6：2：2；步骤1.3：用生成的扩充数据集，利用随机梯度法训练改进的YOLOv3模型，得到基础目标检测模型作为当前模...

【专利技术属性】
技术研发人员：张宇杰，项俊平，刘建华，张锋鑫，高超，
申请(专利权)人：连云港杰瑞电子有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人