当前位置: 首页 > 专利查询>中山大学专利>正文

基于跨尺度特征融合的深度卷积神经网络目标检测方法技术

技术编号:20682095 阅读:73 留言:0更新日期:2019-03-27 19:16
本发明专利技术公开一种基于跨尺度特征融合的深度卷积神经网络目标检测方法,使用公开目标检测数据集上大量标注了物体类别及边界框信息的图片训练得到一个由三部分(深度卷积神经网络,跨尺度特征融合模块,检测器和分类器)组成的目标检测模型,并实现对任意分辨率输入图片进行处理。该发明专利技术首先由深度卷积神经网络的前馈过程生成一系列具有不同分辨率的特征图,然后跨尺度特征融合模块对不同分辨率的特征图进行融合,生成一个更具鲁棒性和辨别性的特征金字塔,最后由检测器对特征金字塔进行检测并由分类器对输出的检测结果进行分类。本发明专利技术生成的特征图能有效抑制背景干扰,对有复杂背景信息的输入图片具有很好的表现。

【技术实现步骤摘要】
基于跨尺度特征融合的深度卷积神经网络目标检测方法
本专利技术涉及人工智能领域,更具体地,涉及一种基于跨尺度特征融合的深度卷积神经网络目标检测方法。
技术介绍
作为计算机视觉中的一个基本任务,目标检测任务一般可以分解为两个子任务。首先,模型需要定位图片中目标的位置,这要求模型具有辨别前景和背景信息的能力。其次,模型需要对定位后的目标进行分类。如果要同时满足上述两种要求,则要求模型提取到对类内物体的外貌差异以及类间物体的尺度差异都具有很强的鲁棒性的特征。近年来基于深度卷积神经网络的模型不断地在计算机视觉领域取得突破,尤其是在图像分类任务上,深度卷积神经网络模型甚至超过了人类的表现,而这很大一部分归功于深度卷积神经网络能够提取到具有鲁棒性的图像非线性特征。而在目标检测领域,KaimingHe于2014年首次提出了基于深度卷积神经网络的目标检测模型R-CNN。该模型把目标检测任务分为两个阶段进行,第一阶段是生成一系列具有粗略位置信息的候选框,第二阶段对第一阶段生成的候选框位置进行微调,使得它更接近于真实值,并对候选框中的包含的物体进行分类。R-CNN模型的有效性奠定了目标检测任务的二阶段处理本文档来自技高网...

【技术保护点】
1.一种基于跨尺度特征融合的深度卷积神经网络目标检测方法,其特征在于:包括以下步骤:S1:将待测图片输入到特征提取网络,输出不同分辨率的特征图;S2:将特征提取网络输出的两张特征图输入到跨尺度特征融合模块进行特征融合;S3:对特征融合后的特征图进行噪声抑制、降维、抗混叠处理得到新的特征图,并将处理后的特征图输入至跨尺度特征融合模块中与S1中的另一张输出特征图进行特征融合;S4:将S3得到的特征融合后的特征图进行检测、分类、计算误差并对检测模型进行训练以及参数更新,并利用训练好的模型进行目标检测。

【技术特征摘要】
1.一种基于跨尺度特征融合的深度卷积神经网络目标检测方法,其特征在于:包括以下步骤:S1:将待测图片输入到特征提取网络,输出不同分辨率的特征图;S2:将特征提取网络输出的两张特征图输入到跨尺度特征融合模块进行特征融合;S3:对特征融合后的特征图进行噪声抑制、降维、抗混叠处理得到新的特征图,并将处理后的特征图输入至跨尺度特征融合模块中与S1中的另一张输出特征图进行特征融合;S4:将S3得到的特征融合后的特征图进行检测、分类、计算误差并对检测模型进行训练以及参数更新,并利用训练好的模型进行目标检测。2.根据权利要求1所述的一种基于跨尺度特征融合的深度卷积神经网络目标检测方法,其特征在于:从特征提取网络不同的位置输出具有不同分辨率的特征图,靠近输入端的特征图的分辨率大于靠近输出端的特征图的分辨率,即越靠近输入端其分辨率越大。3.根据权利要求1所述的一种基于跨尺度特征融合的深度卷积神经网络目标检测方法,其特征在于:所述特征提取网络基于ResNet网络,特征提取网络包括一系列残差连接块。4.根据权利要求3所述的一种基于跨尺度特征融合的深度卷积神经网络目标检测方法,其特征在于:所述特征提取网络的残差连接块串联。5.根据权利要求1所述的一种基于跨尺度特征融合的深度卷积神经网络目标检测方法,其特征在于:步骤S2中特征融合的具体步骤为:S21:将分辨率大小相邻的两张特征图输入到跨尺度特征融合模块中,其中分辨率小的为特征图A,分辨率大的为特征图B;S...

【专利技术属性】
技术研发人员:胡海峰黄福强
申请(专利权)人:中山大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1