一种基于多特征图融合的野生动物视频目标检测方法技术

技术编号：21548588 阅读：15 留言：0更新日期：2019-07-06 21:51

本发明专利技术公开了一种基于多特征图融合的野生动物视频目标检测方法，包括如下步骤：获取视频序列图像，提取视频序列图像中每一帧图像的特征图；判断视频序列图像中的相邻帧图像是否满足融合条件；若相帧图像满足融合条件，则对相邻帧图像进行特征图融合；对融合后的特征图进行类别与目标框的预测，获得具有目标语义关联信息的最终检测结果。与现有技术相比，本发明专利技术的方法更适合对遮挡、形变目标进行准确检测，检测成功的目标数量与检测置信度得到了提升。

A Wildlife Video Target Detection Method Based on Multi-feature Map Fusion

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多特征图融合的野生动物视频目标检测方法
本专利技术涉及图像识别领域，尤其涉及一种基于多特征图融合的野生动物视频目标检测方法。
技术介绍
生物资源是人类赖以生存和发展的自然基础，是生态系统平衡与稳定的有力保障。野生动物资源是生物资源的重要组成部分，具有珍稀性和生命脆弱性，保护和合理利用野生动物资源对可持续发展有着重要意义。然而，当下对于野生动物的监测保护是通过实地探查，或者使用昂贵的实时录像机进行不间断的定点录像，需要投入大量的人力物力。因此，将目标检测的研究成果运用于野生动物视频检测领域，对辅助科学研究有重要意义。近年来，国内外研究学者在野生动物领域做了一系列的分类与检测识别研究工作。随着深度卷积网络的不断发展，基于深度学习的目标检测方法凭借其强大的特征学习能力，表现出了巨大优势。在基于深度学习的目标检测领域，有人结合selectivesearch算法与SVM分类器，提出了基于区域的卷积神经网络R-CNN，其提取出的特征鲁棒性高、通用性好，但存在时间开销大的缺点；有人使用卷积神经网络直接产生候选框区域对R-CNN进行改进，提出的FasterR-CNN模型解决了R-CNN模型的时空开销大的问题；基于回归的YOLO模型，使用端到端的训练方法，提升了目标检测的速度，但其检测精度低；SSD模型对全图各个位置的多尺度区域进行回归，目标检测精度高，但检测速度不及YOLO模型；有人通过Darknet-53卷积神经网络与金字塔网络，对全图进行三个不同尺度的特征图检测，得到检测速度与检测精度的平衡。在上述模型中，YOLOv3模型的综合性能最优，在保持YOLO模型检测...

【技术保护点】
1.一种基于多特征图融合的野生动物视频目标检测方法，其特征在于，包括如下步骤：S1、获取视频序列图像，提取视频序列图像中每一帧图像的特征图；S2、判断视频序列图像中的相邻帧图像是否满足融合条件；S3、若相帧图像满足融合条件，则对相邻帧图像进行特征图融合；S4、对融合后的特征图进行类别与目标框的预测，获得具有目标语义关联信息的最终检测结果。

【技术特征摘要】
1.一种基于多特征图融合的野生动物视频目标检测方法，其特征在于，包括如下步骤：S1、获取视频序列图像，提取视频序列图像中每一帧图像的特征图；S2、判断视频序列图像中的相邻帧图像是否满足融合条件；S3、若相帧图像满足融合条件，则对相邻帧图像进行特征图融合；S4、对融合后的特征图进行类别与目标框的预测，获得具有目标语义关联信息的最终检测结果。2.如权利要求1所述的基于多特征图融合的野生动物视频目标检测方法，其特征在于，判断视频序列图像中的相邻帧图像是否满足融合条件的方法包括：基于对两相邻帧图像进行相似度计算，式中，P为两相邻帧图像的相似度，p及p'分别为两相邻帧图像的直方图数据，N为直方图数据长度，p(i)及p'(i)分别为两相邻帧图像的直方图数据值；若两相邻帧图像的相似度P大于或等于融合阈值σ，两相邻帧图像是否满足融合条件。3.如权利要求2所述的基于多特征图融合的野生动物视频目标检测方法，其特征在于，图像中任一像素点的RGB值为(a,b,c)，基于公式对图像中每个像素点进行计算，得到图像的直方图数据。4.如权利要求1所述的基于多特征图融合的野生动物视频目标检测方法，其特征在于，基于公式Fn'＝ω*Fn+1+Fn+ω*Fn-1'采用线性迭代的方式进行相邻帧图像的特征图融合，式中，Fn-1'＝ω*Fn+Fn-1+ω*Fn-2'，Fn为第n帧图像的特征图，...

【专利技术属性】
技术研发人员：朱小飞，陈建促，李章宇，王越，林志航，
申请(专利权)人：重庆理工大学，
类型：发明
国别省市：重庆,50

全部详细技术资料下载我是这个专利的主人