一种图像中多尺度特征融合的目标检测方法与系统技术方案

技术编号:18784413 阅读:68 留言:0更新日期:2018-08-29 07:11
本发明专利技术公开了一种图像中多尺度特征融合的目标检测方法与系统,所述方法包括:第一步,利用待检测图片进行不同尺度的缩放,构造图像金字塔;第二步,利用统计学聚类方法获取一组覆盖大多数样本尺度的多尺度检测模板;第三步,基于多尺度检测模板,进行尺度自适应的目标上下文构建;第四步,多尺度深度特征融合;第五步,基于软判决的非极大值抑制。本发明专利技术通过构造图像多分辨率稀疏金字塔、多尺度检测模版、模版尺度自适应上下文、多尺度深度特征融合等一系列方法,实现深度特征的充分挖掘和融合利用,能够提升目标检测性能。

【技术实现步骤摘要】
一种图像中多尺度特征融合的目标检测方法与系统
本专利技术涉及的是一种图像中目标检测领域的方法,具体是一种图像中多特征融合的目标检测方法与系统。
技术介绍
图像中的目标检测识别,在诸如智能视频监控等应用场合,具有广泛的实用需求,也是计算机视觉领域较为热门的研究方向。现有的图像目标检测方法,因为尚存如下困难和挑战,检测结果还有待提升:(1)同类目标之间,颜色纹理形状等表观特征存在较大的多样性、差异性。(2)同类目标存在姿态的多样性,导致类内样本的结构特征存在较大变化。如现实中目标具有直立、卧倒、倾斜等姿态,不同的姿态的同类目标会呈现不同的轮廓、形状等结构特征;(3)同类目标高度、宽度等尺寸大小和比例变化区间大。一方面目标物理高度则会有较大的分布区间,另一方面由于拍摄距离的不同目标在图像中也会呈现不同的大小、比例等尺度变化。(4)目标的遮挡会影响检测结果。目标被遮挡后其部分信息是缺失的,增加了检测难度。(5)目标所处环境背景和光照的多样性导致误检增加。目标出现在为室外时,如城市道路、出入口等,其背景往往较为复杂,且一些复杂的背景如树木、路灯会与目标产生混淆、导致误检。目前,较为成熟的目标检本文档来自技高网...

【技术保护点】
1.一种图像中多尺度特征融合的目标检测方法,其特征在于,包括:S1:利用待检测图片进行不同尺度的缩放,构造一个图像金字塔;S2:基于所述图像金字塔得到的训练图像,利用统计学聚类方法获取一组覆盖大多数样本尺度的多尺度检测模板;S3:在上述多尺度检测模板的基础上,进行尺度自适应的目标上下文构建;S4:根据目标上下文构建的结果,进行多尺度深度特征融合,得到多尺度特征图;S5:根据上述多尺度特征图,进行基于软判决的非极大值抑制,实现图像中多尺度特征融合的目标检测。

【技术特征摘要】
1.一种图像中多尺度特征融合的目标检测方法,其特征在于,包括:S1:利用待检测图片进行不同尺度的缩放,构造一个图像金字塔;S2:基于所述图像金字塔得到的训练图像,利用统计学聚类方法获取一组覆盖大多数样本尺度的多尺度检测模板;S3:在上述多尺度检测模板的基础上,进行尺度自适应的目标上下文构建;S4:根据目标上下文构建的结果,进行多尺度深度特征融合,得到多尺度特征图;S5:根据上述多尺度特征图,进行基于软判决的非极大值抑制,实现图像中多尺度特征融合的目标检测。2.根据权利要求1所述的图像中多尺度特征融合的目标检测方法,其特征在于,所述S1中:为了使得检测网络利用一个或几个有限大小的检测框,能够对图像中不同大小的目标都能完整紧凑地进行框选采样,需要对原始图像进行多尺度缩放、使得原始目标经过多次缩放增加其被检测框完整紧凑框选的概率,将原始图片通过按比例缩放成L个不同分辨率大小的图片,从而构造一个分辨率由高到低的图像金字塔。3.根据权利要求1所述的图像中多尺度特征融合的目标检测方法,其特征在于,所述利用统计学聚类方法获取一组覆盖大多数样本尺度的多尺度检测模板,是指:基于K-medoids聚类方法,并利用杰卡德距离作为聚类评价指标,对训练数据集中目标按不同的宽高值及宽高比进行聚类,形成一组K个聚类中心的宽高比,作为覆盖绝大部分宽高比例的目标模板。4.根据权利要求1所述的图像中多尺度特征融合的目标检测方法,其特征在于,所述进行尺度自适应的目标上下文构建,是指:将CNN网络卷积层输出的特征图上每个点的感受野,作为候选目标框;感受野相对于模板框多出的部分,即作为目标框的上下文,用来辅助目标的检测识别。5.根据权利要求4所述的图像中多尺度特征融合的目标检测方法,其特征在于,所述进行尺度自适应的目标上下文构建,最终得到一个上下文信息随目标尺度变化而变化的检测模型,即:小尺度目标将获得更大的上下文信息,而大尺度目标的上下文信息较少,从而满足不同尺度的目标对上下文信息的不同需求。6.根据权利要求1所述的图像中多尺度特征融合的目标检测方法,其特征在于,所述进行多尺度深度特征融合,是指:将CNN不同卷积层输出的特征图,选出M层进行融合,用于构造多尺度特征金字塔。7.根据权利要求6所述的图像中多尺度特征融合的目标检测方法,其特征在于,所述进行多尺度深度特征融合,具体为:对于M个选出的卷积层中处于CNN网络最后一层,将其输出的特征图利用反卷积对其做上采样,使其扩大到与上一层特征图同样分辨率大小后,与上一层特征图做逐像素相加,得到融合相邻两层的多尺度特征图;再以此类推,反卷积扩大、与更上一层特征图融合,直到完成选出的所有M层特征图的融合。8.根据权利要求1-7任一项所述的图像中多尺度特征融合的目标检测方法,其特征在于,所述基于软判决的非极大值抑制,是指:先选出来置信概率最大的检测框,通过其他...

【专利技术属性】
技术研发人员:张重阳程浩刘泽祥
申请(专利权)人:上海交通大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1